AlphaGo Zero 3天走完千年棋史超越人类击败AlphaGo

2017-10-21 12:25 • 业界资讯 • 阅读 7781

谷歌旗下的DeepMind团队公布了进化后的最强版AlphaGo （阿尔法狗），代号AlphaGo Zero。
新版本的AlphaGo究竟有多厉害？打败李世石的AlphaGo用了3000万盘比赛作为训练数据，AlphaGo Zero用了490万盘比赛数据。经过3天的训练，AlphaGo Zero就以100：0的比分完胜对阵李世石的那版AlphaGo。

[videos href=https://flv.bn.netease.com/videolib3/1710/19/ZHzGC1351/SD/ZHzGC1351-mobile.mp4]https://laod.cn/wp-content/uploads/2017/10/20171021122356.png[/videos]

伦敦当地时间10月18日18：00（北京时间19日01：00），谷歌旗下的DeepMind团队公布了进化后的最强版AlphaGo （阿尔法狗），代号AlphaGo Zero。

新版本的AlphaGo究竟有多厉害？打败李世石的AlphaGo用了3000万盘比赛作为训练数据，AlphaGo Zero用了490万盘比赛数据。经过3天的训练，AlphaGo Zero就以100：0的比分完胜对阵李世石的那版AlphaGo。

DeepMind联合创始人兼CEO 、AlphaGo之父戴密斯·哈萨比斯（Demis Hassabis）和AlphaGo团队负责人大卫·席尔瓦（Dave Sliver）等人同时在官方博客上发表文章，详解最强版本阿尔法狗是如何炼成的，与前代有何不同。

哈萨比斯等人专文：《AlphaGo Zero：从零开始》

从语音识别、图像分类到基因和药物研究，人工智能发展迅速。这些专家系统，很多是借用海量人类经验和数据开发出来的。

然而，在有些特定问题上，人类的知识要么过于昂贵，要么不靠谱，要么无法获得。因此，人工智能研究的一个长期目标就是跳过这一步，创造能在最有挑战性的领域，不用人类输入就达到超人水平的算法。我们发表在《自然》期刊上的最新论文，展示了实现该目标的关键一步。

论文介绍了首个战胜人类围棋冠军的电脑程序AlphaGo的最新进化版本：AlphaGo Zero。AlphaGo Zero更为强大，可以一争史上最强围棋手。

AlphaGo的前几代版本，一开始用上千盘人类业余和专业棋手的棋谱进行训练，学习如何下围棋。AlphaGo Zero则跳过了这个步骤，自我对弈学习下棋，完全从乱下开始。用这种方法，它很快超过了人类水平，对阵此前战胜人类冠军李世石的前代AlphaGo取得了100连胜。

AlphaGo Zero之所以能当自己的老师，是用了一种叫强化学习的新模式。系统从一个对围棋一无所知的神经网络开始，将该神经网络和一个强力搜索算法结合，自我对弈。在对弈过程中，神经网络不断调整、升级，预测每一步落子和最终的胜利者。

升级后的神经网络与搜索网络结合成一个更强的新版本AlphaGo Zero，如此往复循环。每过一轮，系统的表现就提高了一点点，自我对弈的质量也提高了一点点。神经网络越来越准确，AlphaGo Zero的版本也越来越强。

这种技术比此前所有版本的AlphaGo都更为强大。这是因为，它不再受到人类知识的限制，而能够从婴儿般的白纸状态，直接向世界上最强大的棋手——AlphaGo本身学起。

AlphaGo Zero相较前代还有几点明显的差别：

首先，AlphaGo Zero仅用棋盘上的黑白子作为输入，而前代则包括了小部分人工设计的特征输入。

其次，AlphaGo Zero仅用了单一的神经网络。在此前的版本中，AlphaGo用到了“策略网络”来选择下一步棋的走法，以及使用“价值网络”来预测每一步棋后的赢家。而在新的版本中，这两个神经网络合二为一，从而让它能得到更高效的训练和评估。

第三，AlphaGo Zero并不使用快速、随机的走子方法。在此前的版本中，AlphaGo用的是快速走子方法，来预测哪个玩家会从当前的局面中赢得比赛。相反，新版本依靠的是其高质量的神经网络来评估下棋的局势。

所有这些差异，都提高了系统的表现，使其更为普适。不过，是算法上的变化使得系统更为强大和高效。

仅仅自我对弈3天后，AlphaGo Zero就以100：0完胜了此前击败世界冠军李世石的AlphaGo版本。自我对弈40天后，AlphaGo Zero变得更为强大，超过了此前击败当今第一人柯洁的“大师”版AlphaGo。

通过数百万次自我对弈，AlphaGo从零开始掌握了围棋，在短短几天内就积累起了人类几千年才有的知识。AlphaGo Zero也发现了新的知识，发展出打破常规的策略和新招，与它在对战李世石和柯洁时创造的那些交相辉映，却又更胜一筹。

这些创造性的时刻给了我们信心：人工智能会成为人类智慧的增强器，帮助我们解决人类正在面临的一些严峻挑战。

尽管才刚刚发展起来，AlphaGo Zero已经走出了通向上述目标的关键一步。如果类似的技术可以应用在其他结构性问题，比如蛋白质折叠、减少能耗和寻找新材料上，就能创造出有益于社会的突破。

原创文章，作者：老D，如若转载，请注明出处：https://laod.cn/4131.html

0 5

Adobe CC2018最新系列所有软件全家桶破解版赢政天下@vposy

上一篇 2017-10-17 21:26

谷歌年度报告：有愈来愈多的网络流量都获加密保护

下一篇 2017-10-23 17:54

业界资讯

曾经的论坛程序王者：Discuz! 落幕了

如果有童鞋在用Discuz程序，那么你应该发现：Discuz 官方论坛和应用中心已经有一段时间不能访问了。 Discuz!发布公告称，由于资源和人力投入问题，Discuz!已经关闭…

2019-05-31
8.9K020
业界资讯

Google宣布将于明年关闭URL缩短服务goo.gl

国内用户对于短网址服务想必并不陌生，比如常见的t.cn等，它们可以大大减少交流时网址占用的文本量。谷歌于2009年就推出了自己的短网址服务goo.gl，但他们最近宣布将在明年关闭该…

2018-04-03
5.1K020
业界资讯

融资2.5亿的“自主国产”红芯浏览器，其实是个套壳Chrome

8月15日，自主研发浏览器核心产品的“红芯”公司宣布完成2.5亿C轮系列融资。本轮融资主要来源于红芯目标行业市场的战略投资，投资方除上市公司及政府客户外，晨兴资本、达晨创投、IDG…

2018-08-16
6.2K0180
业界资讯

AlphaGo确认将挑战星际2 谷歌与暴雪沟通中

日前，暴雪娱乐制作总监Tim Morten在WCS中国站决赛上表示，AlphaGo确认将挑战《星际争霸2》，但谷歌目前正在和暴雪沟通，具体细节还没有确定。　　“AlphaGo”日…

2016-03-28
1.4K280
业界资讯

Google 图片搜索将支持书签功能

一般而言，Google 图片搜索大多仅能帮你做暂时的寻找用途，如果需要好好地整理归类一些参考图片的话，则是需要借助 Pinterest 这类的服务来达成，也令人觉得在某种程度而言好…

2015-12-04
1.6K020
业界资讯

央视曝光：木马图片通过360免杀认证盗取支付宝账号密码

央视财经频道《经济与法》栏目曝光了一起新型木马病毒盗窃支付宝资金案。犯罪嫌疑人主要针对淘宝商家，以询问有没有这样的商品为理由，向淘宝卖家发送伪装成照片的exe木马程序，卖家只要点…

2016-03-24
1.9K190
业界资讯

腾讯圈钱新方法：推出QQ群认证功能

腾讯针对QQ群推出付费认证的新功能。之前的QQ群认证只支持个人认证，现在只支持企业认证，申请入QQ认证的用户，需要向腾讯官方提交认证资料，并支付300元认证费用，将由第三方审核机构…

2017-05-16
3.5K0100
业界资讯

为了改进被吐槽的 iCloud 体验，苹果牵手 Google

虽然外界总是认为敌对关系就应该老死不相往来，但实际上商场上没有永远的敌人，近日传出的双方达成协议，Google 将为苹果（Apple）提供 iCloud 和其他苹果基于云端的服务…

2016-03-17
1.3K020
业界资讯

亚马逊退出中国市场，清仓大促：PC网站、移动客户端、微信小程序全线崩溃

4月29日，亚马逊中国进行清仓大促，包括美妆、图书在内的多种商品均在原有基础上大打折扣，其中部分图书更是4折出售。折扣消息一出，大量用户在短时间内涌进亚马逊平台进行抢购，这给网站服…

2019-04-29
11.5K020
业界资讯

非典型 CEO：Google 创始人佩奇

得益于 2015 年第 4 财季的强劲表现，Alphabet（原 Google 分拆而成，现 Google 母公司）以约 5580 亿美元的市值超越了苹果（估值在 5350 亿美元…

2016-02-02
1.3K020

发表回复

登录后才能评论

评论列表（5条）

daoer 2017-10-26 23:25

老厉害了

回复
fyx1130 2017-10-23 15:31

想要安稳的访问谷歌，必须来找老D。

回复
Tooyee 2017-10-21 19:39

为啥是从围棋入手？

回复
qian__ban 2017-10-21 18:12

前天吴军就写信给我说这个了，说自然杂志官网上，刊登了google deepmind 团队的大卫～席瓦尔博士的最新研究成果：不用人对弈棋谱，直接使用机器学习或者增强学习，可以训练出更厉害的围棋对弈程序，该团队把它命名为AlphaGo Zero（阿尔法元）

回复
successfully 2017-10-21 17:26

百度：想知道谷歌的网址吗？百度一下告诉你！

回复

AlphaGo Zero 3天走完千年棋史 超越人类 击败AlphaGo

相关推荐

发表回复

评论列表（5条）

AlphaGo Zero 3天走完千年棋史超越人类击败AlphaGo