套娃不可取:研究人员证实用AI生成的结果训练AI将导致模型退化 每日看点

搜狐号-IT之家 2023-06-14 18:25:26


(资料图片)

IT之家 6 月 14 日消息,IT之家的小伙伴们可能都有设想过,如果用 AI 生成的结果来训练 AI,进行“套娃式训练”,能得到什么样的结果?目前还真有研究团队对此进行了观察记录,详细论文及得出的结果发表在了 arXiv 上。

一句话总结 —— “在训练中使用模型生成的内容,将导致后续生成的模型出现不可逆转的缺陷”,说人话就是研究人员发现“用 AI 生成的结果训练 AI,只会让模型变得越来越差”。

▲ 图源 arXiv

据悉,研究人员专门研究了 AI 生成模型的概率分布,主要围绕“文本到文本”和“图像到图像”展开,最终得出结论:“由于每个模型生成的结果都具有一定的特点,因此用 AI 生成的模型训练 AI,随着时间的推移,后者会忘记真正的底层数据分布。”

▲ 图源 arXiv

论文的主要作者之一 Ilia Shumailov 同时表示“随着时间的推移,生成数据中的错误(IT之家注:例如虚假举例)会迫使 AI 进一步错误地感知现实,我们惊讶地观察到模型崩溃发生的速度相当快,模型可以迅速忘记他们最初从中学习的大部分原始数据。”

但小伙伴们可能会有所疑问,如果将 AI 生成的结果经过人工润色后再投入模型训练,是否可以避免模型“退化”?

答案是否定的,研究人员发现“模型退化过程是不可避免的”,因此即使对于“经过润色后理想化的 AI 输出内容”,模型在长期学习后,也会出现一定的退化现象。

对于任何大模型而言,由于其学习数据过多,它们都将不可避免地接触到其他 AI 生成的数据,因此研究人员表示“应当引入 AI 鉴定来挑出可能存在错误的学习数据”以提升模型的学习能力与准确性。

x

热门推荐

套娃不可取:研究人员证实用AI生成的结果训练AI将导致模型退化 每日看点

2023-06

全国第六次人口普查各省排名_全国第六次人口普查

2023-06

热评丨进度超八成!颗粒归仓,稳住粮食安全“压舱石”

2023-06

钉钉关闭人脸识别的方法 每日短讯

2023-06

券商理财怎么样 会亏损本金吗_观焦点

2023-06

外交部:日方在核污染水处置问题上没有遵循善意协商原则,一再试图误导国际社会

2023-06

以麦为姓不饥不盗显清奇 ▌管弦|当前速看

2023-06

音乐类综艺:为培养年轻人提供舞台 每日热议

2023-06

处罚通知怎么写比较好(处罚通知怎么写) 世界热头条

2023-06

当前热文:艾隆科技:截止2023年6月9日,公司合并持有股东人数为3847人

2023-06

推荐阅读

山西2021年度发放国家助学贷款逾29亿元 助40万名学生圆大学梦

2021-12

伪造事故赚取“差价” 机动车骗保成诈骗犯罪重灾区

2021-12

内蒙古满洲里新增确诊34例

2021-12

张家口崇礼全力做好冬奥测试赛服务保障工作

2021-12

咖啡、啤酒、盒饭……早出晚归的打工人 寒夜的便利店有故事

2021-12

云南涉疫医疗废物实现“日产日清”

2021-12

对话“贩毒”母亲:不认罪正申诉,盼抗癫痫药物氯巴占可合法购买

2021-12

甘肃省电力投资集团有限责任公司原党委委员、副总经理刘晓黎被开除党籍

2021-12

湖北省委政法委原副巡视员汪宗兴接受审查调查

2021-12

利用游戏平台设线上赌场 江苏一犯罪团伙涉非法牟利数百万元被连锅端

2021-12