天涯小站 2.0

 找回密码
 注册
搜索
天涯小站 2.0 首页 拾萃 科技网络 查看内容

昨夜雨:人机对弈说前程(二)

2016-3-12 07:40 AM| 发布者: 星光| 查看: 791| 评论: 7|原作者: 昨夜雨

摘要: 这两天随着棋局的进展,我的想法也在不断的发酵。这一篇先说说AlphaGo的研发能给人类带来什么好处,然后再说不好的地方。首先需要肯定AlphaGo的一点,就是对围棋界的促进。毋庸置疑,围棋是一种很精英的智力活动。一 ...

这两天随着棋局的进展,我的想法也在不断的发酵。这一篇先说说AlphaGo的研发能给人类带来什么好处,然后再说不好的地方。


首先需要肯定AlphaGo的一点,就是对围棋界的促进。毋庸置疑,围棋是一种很精英的智力活动。一开始的时候,不是所有的人都看好AlphaGo,尤其是一些水平很高的棋手和热情很高的观众。但是随着3:0的结果出现,连屡次战胜李世石的中国棋手柯洁,也改变了一开始的轻视态度,表明在同等条件下,AlphaGo也有战胜他的可能。无疑,出现了一个能超越现有棋手水平的“机器人选手”,会挑战现有棋手向更高能难的水准冲击。




网上有人推测,AlphaGo取胜的办法,就是依靠海量的棋局数据和快捷的概率统计。这种说法有一定的道理,但我觉得这两者只是取胜的必要条件,却很有可能不是充分条件。因为这两个条件都可以是预设的,而不是通过学习获得的。虽然我也不知道AlphaGo究竟如何学习,但是我想AlphaGo应该还有别的高招。比如说,也许它具有一种现场分析的能力,能够依靠对手临场落子的顺序来不断地分析判断对手的水平与状态,从而对已有数据进行更为有效的择取。这种依据临场数据而做出对策的做法,才有“智能”可言。


我前面曾经说过,因为人类与电脑的差别,在某些方面人类很难直接向电脑学习。比如说,人类在数据储存和处理上,已经无法达到目前的电脑所能达到的数量级。但是人类可以借助与机器棋手的对弈机会,来提高自己,超越自己。还有一点,假设AlphaGo仅仅是依靠已有数据来战胜对手,那么说明了AlphaGo只能走出前人已经走过的路数,只是现场上的对手未必能及时想起这些路数,从而采取相应的对策。但旁观的棋手中,说不定有人会看出这些“失传”的路数,从中得到启发,得到提高。如果AlphaGo不仅能走别人走过的路数,而且还具备推理的能力,走出奇招怪招,那么它所使出的招式也是值得学习的。


AlphaGo的另外一个重要贡献,就是在人工智能的研发上,建立了一个新的里程碑。围棋问题的难度,大家都不难想象。但是应用人工智能来挑战这个问题,究竟有哪些方案,这些方案如何实施,效益如何,都是一个个需要解决的具体课题。对此我也是一个门外汉。但是我相信AlphaGo背后的团队DeepMind所要达到的目的,并不是要击败天下的围棋高手,而是要寻找突破人类思维与智能的个体极限的路径。在围棋问题上找到的方案与方法,对于以后其他类型的人工智能开发,肯定有借鉴的意义。所以,从这个角度上说,AlphaGo的成功,不仅有利于围棋界,也有利于整个人类。

发表评论

最新评论

引用 2016-3-14 02:24 PM
waspking: 这种神经网络的缺点就是, 人和电脑都无法知道, 它到底总结出来什麽规律。 Nature paper也没有提到这个。 它学到的知识无法传递, 给人, 或者电脑。 只有一堆 ...
这个也许不是什么缺点。规律的东西却不能用语言表达,有的时候可能是语言的限制。比如说人脸识别,现在也是属于AI的范畴,背后的技术也是神经网络。但是这个技术已经比较成熟了,甚至可以识别笑脸,整个软件模块可以镶入相机软件内。
引用 2016-3-14 02:20 PM
八月风: 我看了一篇介绍alphago程序的主设计师的文章,还没来得及去核实。据这篇文章介绍,他是混血,父亲是希腊籍塞浦路斯人,母亲是新加坡华裔,从小在英国长大,3岁就 ...
在比赛中那位为AlphaGo执子的棋手叫黄士杰,来自台北。他是研究AI的,也是一位业余高手。
引用 2016-3-14 09:54 AM
这种神经网络的缺点就是, 人和电脑都无法知道, 它到底总结出来什麽规律。 Nature paper也没有提到这个。 它学到的知识无法传递, 给人, 或者电脑。 只有一堆数字。
引用 2016-3-12 10:24 PM
我看了一篇介绍alphago程序的主设计师的文章,还没来得及去核实。据这篇文章介绍,他是混血,父亲是希腊籍塞浦路斯人,母亲是新加坡华裔,从小在英国长大,3岁就开始学围棋,5岁参加比赛,6岁得到伦敦8岁以下儿童组冠军,8岁开始学编程,13岁拿到国际象棋大师称号,17岁开发游戏软件,18岁开公司,21岁进入剑桥大学念计算机本科,33岁拿到伦敦大学认知神经科学博士,2011年博士后期间创办DeepMind公司,2014年公司被谷歌收购,他继续负责设计alphago。如果这些全部属实,alphago的程序后面除了有众人智慧的结晶,更主要的恐怕也还是有一个天才头脑的引领和巨大的热情作为动力。
引用 2016-3-12 10:07 PM
hanxin: "比如说,也许它具有一种现场分析的能力,能够依靠对手临场落子的顺序来不断地分析判断对手的水平与状态,从而对已有数据进行更为有效的择取。这种依据临场 ...
我同意韩姥姥的解释。我认为这就是stochastic process的memoryless property的特点。
引用 2016-3-12 09:50 PM
hanxin: "比如说,也许它具有一种现场分析的能力,能够依靠对手临场落子的顺序来不断地分析判断对手的水平与状态,从而对已有数据进行更为有效的择取。这种依据临场 ...
谢谢韩姥姥的介绍。其实我没有去查他们的算法,只是想当然。如果按照你说的这样,说明人类的智力水准确实不是很高啊!
引用 2016-3-12 08:52 PM
"比如说,也许它具有一种现场分析的能力,能够依靠对手临场落子的顺序来不断地分析判断对手的水平与状态,从而对已有数据进行更为有效的择取。这种依据临场数据而做出对策的做法,才有“智能”可言。"

风雨,看了你这段,我去查了查他们的算法介绍。我的理解是,他们的算法并没有去分析对手的走棋顺序。阿尔法狗的算法是延用了传统的计算机博弈的 look ahead 的方法,也就是说,根据当前的棋盘,预算出下面好几步的棋盘状态,从中选出对自己最有利的一步。由于围棋每一步的可能走法太多了,所以在预算时不可能采用  brute force (全面搜索)。阿尔法狗的突破是,他们综合了 neural network 技术以及随机搜索技术。在预算下一步走法时,不是每个可能走法都考虑,而是随机抽样。抽样之后,再用 neural network  来评估棋盘的分数。分析对手的可能走法也是一样,随机抽样,然后用另外一套 neural network 来评估。这样,算下去几步(不知道到底几步),最后取一个最好的。两个 neural networks 都是事先一点点‘训练’好的,也可能在下棋中,也在被‘训练’。总之,此算法并不分析对手的走棋顺序。算法重点是,(1) 通过千万次的学习,系统能摸索出怎样评估一个棋盘。(2)随机搜素。

查看全部评论(7)

手机版|天涯小站

GMT-5, 2026-6-27 08:07 AM

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

返回顶部