DeepMind推出AlphaZero AI：国际象棋/围棋/将棋通杀

cnBeta
2018-12-07 18:34

作为 AlphaGo 的最新迭代，DeepMind 又在 11 月 6 日发表的《科学》（Science）论文中，隆重介绍了 AlphaZero 。作为谷歌母公司 Alphabet 旗下的英国人工智能子公司，DeepMind 多年来一直致力于改进 Go AI 。2017 年的时候，前 AI 冠军 AlphaGo 正式退休，但在进一步修补之后，AlphaZero 又达到了新的顶峰。

AlphaZero 是一款能够从头学习围棋、象棋等棋子游戏的新型人工智能平台。在三款棋类比赛中，AlphaZero 将三款 AI 都挑落下马。

● Stockfish：国际象棋 AI 世界冠军；

● elmo：2017 年度世界计算机将棋锦标赛冠军；

● AlphaGo Zero：DeepMind 自家的围棋 AI，被誉为史上最强选手。

在仅仅获知有关游戏基本规则的情况下，AlphaZero 在成为人工智能大师之前，会先自己机型数百万场的对抗练习。

该 AI 初期会实施随机战术来取得胜利，但后续会通过‘强化学习’来试错，以逐步了解哪些策略是最有效的。

实测国际象棋需要 9 小时、将棋 12 小时、围棋 13 天，涉及 5000 个张量处理单元（TPU）。

作为参考，一套 TPU 每天可以处理超过 Google Photos 中的 1 亿+照片，所以 AlphaZero 对硬件处理性能的要求还是比较高的。

闭关学习结束后，AlphaZero 就可以大杀四方了。

这项研究的独特之处在于，研究团队将机器学习算法、与蒙特卡罗树（MCTS）的“搜索方法”结合到了一块。

这是 Go 围棋 AI 决定下一步行动所采用的方式，这次 DeepMind 团队在国际象棋和将棋 AI 上也套用了同样的机制，首次展示了该方法适用于其它复杂的游戏测试。

对于人类国际象棋选手来说，AlphaZero 是极具吸引力的。你可以在与机器对战时，见识到此前从未遇到过的策略、以及一些新颖的想法。

其咄咄逼人的风格、以及高度动态的应变策略，足以让 Matthew Sadler 之类的国际象棋大师感到惊讶（其在 DeepMind 博客上有所表述）。

有关这项研究的详情，已经发表在近日出版的《科学》（Science）期刊上。原标题为：

《A general reinforcement learning algorithm that masters chess, shogi, and Go through self-play》

《一种通用的强化学习算法，可自学成为国际象棋、将棋、围棋大师》

来源：cnBeta

作者：摘编

编辑：jiyang

图片来源:

本文链接: https://www.aiust.com/article/20181207/771.html

免责声明：本网站出于传播商业信息之目的进行发布，不代表 AIUST.Com 立场。本文所涉文、图、音视频等资料之一切权利和法律责任归提供方所有和承担。本网站对文中的图文等所有信息的真实性不作任何保证或承诺，请读者仅作参考，并自行核实相关内容。本网站的任何内容仅供参考，不能做为投资、采购或行为决策依据，据此操作者风险自担。

资讯

原创

荐读

5G+AR加持晨星机器人掀起“智能化+人机交互”制造新趋势
2021世界制造业大会于11月22日在合肥落下帷幕。为期四天的大会中，作为向世界展示智能制造全面能力的窗口，联想展示了一系列让人惊喜的创新产品。现场展示的ThinkPad X1 Fold整体重量仅有1公斤，折叠起来之后的厚度大约为24毫米。当保持半开状态时，可以像拿本书一样握住，并且能同时运行两个应用程序。使用固定在中间的键盘之后，瞬间变...
智能手机竞争中失败，日本在联网汽车领域举步维艰
据外媒报道，在制造带有数字联网服务的汽车的竞争中，丰田汽车和日产汽车面临着被本土市场拖累的风险。与美国和欧洲的汽车消费者不同的是，日本消费者不愿意为这些联网功能和服务买单。结果就是：日本只有10%的汽车...
2020年河南省将推广应用3万台工业机器人
到2020年，推广应用3万台工业机器人，建设1000条智能生产线、300个智能车间、150个智能工厂……4月16日，在2018两岸智能装备制造郑州论坛上，河南省工信委发布了《2017年河南省智能制造白皮书》，河南智能制造的2020...

DeepMind推出AlphaZero AI：国际象棋/围棋/将棋通杀

相关文章

资讯

原创

荐读

热门标签