谷歌使用深度强化学习发现了更快的排序算法

OSCHINA 2023-06-08 10:42:48


(资料图片仅供参考)

谷歌旗下 AI 实验室 DeepMind 的工程师团队在Nature 官网发表了一篇论文,称使用深度强化学习发现了更快的排序算法。

排序或散列等基本算法在一天内的使用量可达数万亿次,随着计算需求的增长,让这些算法尽可能高效变得至关重要。基础排序算法在过去取得了显著的进步,但如要进一步提高这些算法例程的效率,对人类科学家和已知的计算方法都具有挑战性。

而 DeepMind 通过将“寻找更好的排序程序”任务制定成一个名为 AssemblyGame 的单人游戏。在这个游戏中,玩家需要选择一系列低级 CPU 指令(汇编指令),然后将其组合起来产生一种新的高效排序算法。

然后 DeepMind 训练了一个新的深度强化学习代理 ”AlphaDev“ 来玩这个游戏,AlphaDev 的主要学习算法是 AlphaZero 代理的扩展,并使用深度神经网络指导蒙特卡洛树搜索 (MCTS) 规划过程。

(完整的训练过程和细节分析可以在 deepmind 的论文中细细阅读)

最终,AlphaDev 从零开始地发现了几项新的小型排序算法,分别可用于对大小为 3、4 和 5 的列表进行排序,且均优于已知的人类基准

目前这些算法已经集成到 LLVM 标准 C++ 排序库中,使用强化学习的新算法替换掉了原有的LLVM libc++ 标准排序 3、排序 4 和排序 5 算法,这些基础算法是 C++ 排序库的基本组件,通常被较大的排序算法多次调用。

值得一提的是,DeepMind 的提交是十多年来对 LLVM libc+排序算法子程序的首次更改。

x

热门推荐

谷歌使用深度强化学习发现了更快的排序算法

2023-06

世界信息:全球首发!省人医专家参与的临床试验公布重大成果,为高血压治疗投下“重磅炸弹”

2023-06

6月7日国内市场钴盐价格汇总

2023-06

摩通:放宽一线城市限购料对内房销售影响轻微

2023-06

摩通:放宽一线城市限购料对内房销售影响轻微

2023-06

2023父亲节手抄报图片大全

2023-06

智也升级更名为生活 增加了更多新功能!

2023-06

全球速讯:国泰君安(香港):首予鸿腾精密(06088)“买入”评级 目标价1.95港元

2023-06

【天天新要闻】日产颐达(颐达中控如何拆?)

2023-06

辩证唯物主义和历史唯物主义的区别与联系_历史唯物主义和辩证唯物主义区别 世界播资讯

2023-06

推荐阅读

山西2021年度发放国家助学贷款逾29亿元 助40万名学生圆大学梦

2021-12

伪造事故赚取“差价” 机动车骗保成诈骗犯罪重灾区

2021-12

内蒙古满洲里新增确诊34例

2021-12

张家口崇礼全力做好冬奥测试赛服务保障工作

2021-12

咖啡、啤酒、盒饭……早出晚归的打工人 寒夜的便利店有故事

2021-12

云南涉疫医疗废物实现“日产日清”

2021-12

对话“贩毒”母亲:不认罪正申诉,盼抗癫痫药物氯巴占可合法购买

2021-12

甘肃省电力投资集团有限责任公司原党委委员、副总经理刘晓黎被开除党籍

2021-12

湖北省委政法委原副巡视员汪宗兴接受审查调查

2021-12

利用游戏平台设线上赌场 江苏一犯罪团伙涉非法牟利数百万元被连锅端

2021-12