昨夜雨：人机对弈说前程（二）

2016-3-12 07:40 AM| 发布者: 星光| 查看: 791| 评论: 7|原作者: 昨夜雨

摘要: 这两天随着棋局的进展，我的想法也在不断的发酵。这一篇先说说AlphaGo的研发能给人类带来什么好处，然后再说不好的地方。首先需要肯定AlphaGo的一点，就是对围棋界的促进。毋庸置疑，围棋是一种很精英的智力活动。一 ...

这两天随着棋局的进展，我的想法也在不断的发酵。这一篇先说说AlphaGo的研发能给人类带来什么好处，然后再说不好的地方。

首先需要肯定AlphaGo的一点，就是对围棋界的促进。毋庸置疑，围棋是一种很精英的智力活动。一开始的时候，不是所有的人都看好AlphaGo，尤其是一些水平很高的棋手和热情很高的观众。但是随着3：0的结果出现，连屡次战胜李世石的中国棋手柯洁，也改变了一开始的轻视态度，表明在同等条件下，AlphaGo也有战胜他的可能。无疑，出现了一个能超越现有棋手水平的“机器人选手”，会挑战现有棋手向更高能难的水准冲击。

网上有人推测，AlphaGo取胜的办法，就是依靠海量的棋局数据和快捷的概率统计。这种说法有一定的道理，但我觉得这两者只是取胜的必要条件，却很有可能不是充分条件。因为这两个条件都可以是预设的，而不是通过学习获得的。虽然我也不知道AlphaGo究竟如何学习，但是我想AlphaGo应该还有别的高招。比如说，也许它具有一种现场分析的能力，能够依靠对手临场落子的顺序来不断地分析判断对手的水平与状态，从而对已有数据进行更为有效的择取。这种依据临场数据而做出对策的做法，才有“智能”可言。

我前面曾经说过，因为人类与电脑的差别，在某些方面人类很难直接向电脑学习。比如说，人类在数据储存和处理上，已经无法达到目前的电脑所能达到的数量级。但是人类可以借助与机器棋手的对弈机会，来提高自己，超越自己。还有一点，假设AlphaGo仅仅是依靠已有数据来战胜对手，那么说明了AlphaGo只能走出前人已经走过的路数，只是现场上的对手未必能及时想起这些路数，从而采取相应的对策。但旁观的棋手中，说不定有人会看出这些“失传”的路数，从中得到启发，得到提高。如果AlphaGo不仅能走别人走过的路数，而且还具备推理的能力，走出奇招怪招，那么它所使出的招式也是值得学习的。

AlphaGo的另外一个重要贡献，就是在人工智能的研发上，建立了一个新的里程碑。围棋问题的难度，大家都不难想象。但是应用人工智能来挑战这个问题，究竟有哪些方案，这些方案如何实施，效益如何，都是一个个需要解决的具体课题。对此我也是一个门外汉。但是我相信AlphaGo背后的团队DeepMind所要达到的目的，并不是要击败天下的围棋高手，而是要寻找突破人类思维与智能的个体极限的路径。在围棋问题上找到的方案与方法，对于以后其他类型的人工智能开发，肯定有借鉴的意义。所以，从这个角度上说，AlphaGo的成功，不仅有利于围棋界，也有利于整个人类。

收藏分享邀请

上一篇：昨夜雨：人机对弈说前程下一篇：凡草：人脑与电脑

发表评论

最新评论

引用 2016-3-14 02:24 PM: waspking: 这种神经网络的缺点就是，人和电脑都无法知道，它到底总结出来什麽规律。 Nature paper也没有提到这个。它学到的知识无法传递，给人，或者电脑。只有一堆 ...
这个也许不是什么缺点。规律的东西却不能用语言表达，有的时候可能是语言的限制。比如说人脸识别，现在也是属于AI的范畴，背后的技术也是神经网络。但是这个技术已经比较成熟了，甚至可以识别笑脸，整个软件模块可以镶入相机软件内。

引用 2016-3-14 02:20 PM: 八月风: 我看了一篇介绍alphago程序的主设计师的文章，还没来得及去核实。据这篇文章介绍，他是混血，父亲是希腊籍塞浦路斯人，母亲是新加坡华裔，从小在英国长大，3岁就 ...
在比赛中那位为AlphaGo执子的棋手叫黄士杰，来自台北。他是研究AI的，也是一位业余高手。

引用 2016-3-14 09:54 AM: 这种神经网络的缺点就是，人和电脑都无法知道，它到底总结出来什麽规律。 Nature paper也没有提到这个。它学到的知识无法传递，给人，或者电脑。只有一堆数字。

引用 2016-3-12 10:24 PM: 我看了一篇介绍alphago程序的主设计师的文章，还没来得及去核实。据这篇文章介绍，他是混血，父亲是希腊籍塞浦路斯人，母亲是新加坡华裔，从小在英国长大，3岁就开始学围棋，5岁参加比赛，6岁得到伦敦8岁以下儿童组冠军，8岁开始学编程，13岁拿到国际象棋大师称号，17岁开发游戏软件，18岁开公司，21岁进入剑桥大学念计算机本科，33岁拿到伦敦大学认知神经科学博士，2011年博士后期间创办DeepMind公司，2014年公司被谷歌收购，他继续负责设计alphago。如果这些全部属实，alphago的程序后面除了有众人智慧的结晶，更主要的恐怕也还是有一个天才头脑的引领和巨大的热情作为动力。

引用 2016-3-12 10:07 PM: hanxin: "比如说，也许它具有一种现场分析的能力，能够依靠对手临场落子的顺序来不断地分析判断对手的水平与状态，从而对已有数据进行更为有效的择取。这种依据临场 ...
我同意韩姥姥的解释。我认为这就是stochastic process的memoryless property的特点。

引用 2016-3-12 09:50 PM: hanxin: "比如说，也许它具有一种现场分析的能力，能够依靠对手临场落子的顺序来不断地分析判断对手的水平与状态，从而对已有数据进行更为有效的择取。这种依据临场 ...
谢谢韩姥姥的介绍。其实我没有去查他们的算法，只是想当然。如果按照你说的这样，说明人类的智力水准确实不是很高啊！

引用 2016-3-12 08:52 PM: "比如说，也许它具有一种现场分析的能力，能够依靠对手临场落子的顺序来不断地分析判断对手的水平与状态，从而对已有数据进行更为有效的择取。这种依据临场数据而做出对策的做法，才有“智能”可言。"

风雨，看了你这段，我去查了查他们的算法介绍。我的理解是，他们的算法并没有去分析对手的走棋顺序。阿尔法狗的算法是延用了传统的计算机博弈的 look ahead 的方法，也就是说，根据当前的棋盘，预算出下面好几步的棋盘状态，从中选出对自己最有利的一步。由于围棋每一步的可能走法太多了，所以在预算时不可能采用 brute force （全面搜索）。阿尔法狗的突破是，他们综合了 neural network 技术以及随机搜索技术。在预算下一步走法时，不是每个可能走法都考虑，而是随机抽样。抽样之后，再用 neural network 来评估棋盘的分数。分析对手的可能走法也是一样，随机抽样，然后用另外一套 neural network 来评估。这样，算下去几步（不知道到底几步），最后取一个最好的。两个 neural networks 都是事先一点点‘训练’好的，也可能在下棋中，也在被‘训练’。总之，此算法并不分析对手的走棋顺序。算法重点是，（1）通过千万次的学习，系统能摸索出怎样评估一个棋盘。（2）随机搜素。

查看全部评论(7)

		自动登录	找回密码
密码			注册

昨夜雨：人机对弈说前程（二）

最新评论

相关分类