100：0完胜AlphaGo，AlphaGoZero让人类连作对手的资格都没有？

2024-09-29 来源:旧番剧

出品：科普中国
制作：缪子文化王轩
监制：中国科学院计算机网络信息中心
2017年10月19日，谷歌子公司DeepMind发布了AlphaGo的新版本。很多人知道AlpoaGo是一个人工智能程序，却不知道它其实是一个家族，早期战胜韩国选手李世石的是AlphaGo Lee。在乌镇击败世界冠军柯洁的是AlphaGo Master。本次发布的是AlphaGo Zero，它经过3天的训练便以100：0的战绩击败了他的哥哥AlphoGo Lee，经过40天的训练便击败了它的另一个哥哥AlphoGo Master。

AlphaGo Zero最大特点
本次发布的AlphaGo Zero与之前版本相比，最大的区别在于，它不再依靠人类的指导来成长，即之前的AlphaGo Lee是依赖于人工录入的大量棋谱来帮助其学习如何下棋，说白了，它是在人的指导下学习，可以理解为是人类千年围棋经验教出的学生。
而AlphaGo Zero使用了强化学习算法，即不再依赖任何棋谱，编程人员输入围棋基本规则后，不再进行任何教导，完全由其自己进行摸索，总结走棋方法，相当于人工智能完全按照自己的方法学习。AlphaGo Lee完败于摒弃了人类经验的AlphaGo Zero，这说明人类的经验可能误导了AlphaGo Lee，进而限制了它的发展。
AlphaGo Zero的行棋方式在开局和收官阶段，与人类选手有较大的相似之处，而盘中的行棋风格的确与人类选手和之前版本的AlPhaGo有较大不同，而正是这种不同让其可以在100次与AlphaGo Lee的交战中立于不败，换个说法，如果当初AlphaGo Lee没有拜人类为师，而是向机器学习，那么对于拥有更强计算能力的AlphaGo Lee来说，胜负还未可知。

1 2 3 4 5 6 查看全文