天涯小站 2.0

 找回密码
 注册
搜索
天涯小站 2.0 首页 拾萃 科技网络 查看内容

昨夜雨:人机对弈说前程

2016-3-11 09:33 PM| 发布者: 昨夜雨| 查看: 829| 评论: 9|原作者: 昨夜雨|来自: 小站空间

摘要: 最近正在进行的人机对弈,即世界围棋冠军李世石对谷歌开发的智能棋手AlphaGo,随着棋局的发展,越来越引起人们的兴趣。目前比赛的结果是0比2,机器人领先。怎么看待这个比赛的结果呢?我的看法是,这次比赛体现了人 ...
最近正在进行的人机对弈,即世界围棋冠军李世石对谷歌开发的智能棋手AlphaGo,随着棋局的发展,越来越引起人们的兴趣。目前比赛的结果是0比2,机器人领先。怎么看待这个比赛的结果呢?我的看法是,这次比赛体现了人类寻找一种通过电脑来实现脑力合作的途径。无论比赛的结果如何,胜利的是人,而不是机器。

其实这句话当然不是我先说的。谷歌老板Eric Schmidt在比赛的开幕式就说,“The winner here, no matter what happens, is humanity.”他是这样论证这个结论的——“Humanity wins because the advances in artificial intelligence and machine learning will make each, and every other, human being in the entire world smarter, more capable - just better human beings."

我不是想重复Eric Schmidt的话。我的看法是,我们要了解人机对弈的时候,到底博弈的双方是谁。 这个似乎很明显,一方是李世石,另一方是AlphaGo。但实际上,AlphaGo只是一个工具,在AlphaGo背后的,是一个AI系统的开发团队。所以,真正对弈的是李世石与谷歌的AI系统开发团队。


谷歌AI系统开发团队中的每一个人,肯定没有哪一个敢和李世石在棋盘上过招。但是他们可以设计一个学习系统,然后让电脑通过学习,逐渐提高自己对弈的能力。

所谓学习系统,就是说不是预先编好程序,让电脑知道怎么走每一步棋,而是让电脑通过一系列的规则与运算,知道怎么跟对手学习,怎么辨别好招坏招,最终达到取胜的目标。

就用微信小冰来做一个简单的例子来说明学习系统的一些原理。假设小冰有学习能力,那么开发团队就没有必要把所有的对话都事先输入给小冰,而是给小冰一个巨大的储存空间,快捷的运算能力,以及毫无障碍的信息通道。于是,小冰就可以和客户开始像小孩一样,从简单的对话开始,一边对话一边学习。

现在你问小冰一个非常简单的问题:“你几岁了?”

也许小冰的记忆储存里还没有答案来直接回答这个问题,于是根据一个简单的规则,她就回答说,“哦哦哦

你显然不满意,于是回答说,“哦什么哦

小冰可能一时也对付不了这个答复。于是,根据另外一个规则,她可能回答,“我在思考”,或者换一个别的比较空泛的句子来对付你,“你说呀。”

但是与此同时,小冰不仅会把你说的哦什么哦”这句话记存下来,而且还会标志上这句话是可以用来回答“哦哦哦”的。下一次,当另外一个用户在对话中说到“哦哦哦”的时候,小冰就有可能回答一句,哦什么哦”虽然她的程序员并没有事先给她提供了这一句话。这样一个过程,就是一个简单的学习与提高的过程。

作为一个高级的学习系统,AlaphGo的运算规则与系统配置要复杂得多,但在原理上还是类似的。也就是说,学习系统不是把所有的答案都事先编制好,而是边运行边学习,和一个孩子的智力成长有点类似。所以AlaphGo在挑战李世石之前,还要做大量的功课,包括输入以前的比赛结果,也包括和段位比较低的棋手对弈。电脑与小孩子相比起来,它的学习速度快,所以智能成长速度也快;但另一方面,电脑的知识发展方向由人类控制,不像一个孩子那样可以处身在家庭与社会的环境之中,所以电脑的知识面至少在目前来说还是比较单一的。

和李世石对弈的AlaphGo所具有的学习能力,当然要比微信小冰强得很多。但无论怎么复杂,都还只是一个具有简单并且明确目标的学习系统。所以,在这场人机对弈中,我们看到的是一个非常优秀的个人人脑,面对一个合作的善于学习的团队头脑。AlaphGo只是团队头脑合作过程中所应用的载体。如果这次比赛的结果还是李世石胜出,那就说明人们在头脑合作方面的成绩还不够好。如果AlaphGo胜出,那么说明人们在探索头脑合作方面迈出了一步。

无论如何,合作的头脑会超越个人的头脑,这是迟早会发生的事情。

那么,人工智能的发展,有没有可能发生机器威胁人类战胜人类的情况呢?请看下一篇。
发表评论

最新评论

引用 2016-3-12 11:00 PM
xcr: 如果我是AlphaGo的围棋对手,我会这样考虑:我的每一步棋招都有两个作用:1)有可能会被AlphaGo用更好的高招来对付我这一招,使我立即败阵。所以我的每一招必须 ...
我在微薄里说过,我觉得李世石最好的对策是不把对手当计算机,而是把它当成水平相当的对手,发挥自己的长处,下自己的棋,这样胜率反而大。我看了第三局的实况,基本印证了我这个想法。第三局里李世石的发挥比前两局明显好,评论的人都说他在不少地方走出了自己的风格。我觉得今晚他更应该放下包袱,不要再去试图找计算机的“漏洞”,而是走自己风格,下自己能下的最好的棋。另外他的确要注意用时。对今晚的比赛很期待。第四局比赛刚刚开始了!
引用 2016-3-12 11:03 AM
youzi: 等着看下一篇。
想说的还有很多,今天争取写一些。
引用 2016-3-12 11:01 AM
panda: 文学城抄来的
我不知道这个说法是否属实。不过按照这些说法,更像是利用“大数据”,而没有多少“学习”机制在其中。
引用 2016-3-11 03:04 PM
等着看下一篇。
引用 2016-3-11 02:58 PM
文学城抄来的
引用 2016-3-11 02:57 PM
pop3 发表评论于 2016-03-10 21:20:40 下一步落在这格, 我棋库里十亿局棋中有一千局出现过相似局面, 最后560盘是本方赢了.
下一步落在那格, 我棋库里十亿局棋中有三千局出现过相似局面, 最后1560盘是本方赢了.
....

总共才几百格, 阿狗用不了多久就统计完了.它就挑赢率最高的那个直接下了.
这种统计是不是有点象古狗自己的搜索统计?是的.

以上是阿狗在前盘和中盘时的基本算法, 这叫算法么? 这个学术上叫赌博概率法.但是非常有效.
引用 2016-3-11 02:55 PM
pop3 发表评论于 2016-03-10 21:13:03 前头鄙人已经说了, 阿狗没什么算法和逻辑模式.

但是阿狗会统计,他的库里有几十亿局棋,包括高手下的和自己下的.

他统计接下来棋盘上的空格中, 哪一个落子在他那棋库中类似的局面中,最后的结果胜率最高.
他不需要逻辑计算接下来的几步(大局上,非官子),阿狗只算一步.
引用 2016-3-11 10:19 AM
xcr: 如果我是AlphaGo的围棋对手,我会这样考虑:我的每一步棋招都有两个作用:1)有可能会被AlphaGo用更好的高招来对付我这一招,使我立即败阵。所以我的每一招必须 ...
有可能啊。这个就是属于“互驯”过程的行为了。
引用 2016-3-11 03:56 AM
如果我是AlphaGo的围棋对手,我会这样考虑:我的每一步棋招都有两个作用:1)有可能会被AlphaGo用更好的高招来对付我这一招,使我立即败阵。所以我的每一招必须出得无懈可击;2)AlphaGo有可能将我这一招“学”去,在后面采用我这个招法反过来对付我。所以,我应该在我的招法中故意安插难以被AlphaGo发觉的漏洞,这样等到AlphaGo使用同样的招法时,我就可以出奇制胜。

查看全部评论(9)

手机版|天涯小站

GMT-5, 2026-6-27 09:16 AM

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

返回顶部