漫人：阿狗、神经网络、蒙特卡罗、围棋及其它（一）

2016-3-30 06:52 AM| 发布者: 星光| 查看: 705| 评论: 25|原作者: 漫人

摘要: 前些天人狗大战，天昏地暗，人哭鬼泣。但实在忙得晕头转向，都没来得及插嘴。只是最后一盘，看了一半，熬马眼熬得睁不开了，就洗洗睡了。本来觉着小李（李世石）还挺有希望的，因为狗右下角处理不好，走成了死棋。 ...

前些天人狗大战，天昏地暗，人哭鬼泣。但实在忙得晕头转向，都没来得及插嘴。只是最后一盘，看了一半，熬马眼熬得睁不开了，就洗洗睡了。本来觉着小李（李世石）还挺有希望的，因为狗右下角处理不好，走成了死棋。但一觉醒来，小李还是输了，唉，叹一声。对了，叫他小李，是因为他前面还有个大李，李昌镐，现在都看不见他的踪迹了。这二李，抢了多少个世界冠军。中日韩三国擂台赛，有这二李之一把关，中日两国只要有一个赢了一回，唉呀，那就高兴得不得了。不过现在围棋在日本衰落了，擂台赛上基本是做陪衬，看中韩对抗。而最近的一次三国围棋擂台赛，小李最后又在决战中输给了中国的柯洁。所以世界排名，是柯洁第一。但柯洁他自己的微博号，却是柯洁大棋渣。

扯哪儿去了，还是回头来说阿狗。且看风头谈风正健，连连发篇，指点狗棋，激扬人工智能江山。俺说什么也不能落后，而且顶风作案，是俺的恶习，所以尽管时过境迁，还忍不住要插几句嘴。

阿狗就是阿尔法狗（AlphaGo）的简称，专门下围棋的计算机系统。之所以说系统，是因为这里面不光是软件，硬件也很关键。当年打败国际象棋世界冠军卡斯帕罗夫的深蓝（Deep Blue），就是IBM专门开发的大型计算机。去阿狗的网站（https://deepmind.com/alpha-go.html）瞄了一下，没看出来硬件用的是什么。网站上提到他们在《内缺》（Nature）上发了一篇文章，但还没来得及读。英文维基的说法是早期他们用的计算机是分布式的（distributed），有64个threads，1920个CPU，280个GPU，基本上就是现代超级计算机的模式。而且维基说现在用的计算机要比这个还要强得多，你可以想象这里面有多少计算力量（computing power）在里面。当然深思（DeepMind）计算机系统不光是可以跑阿狗这个软件，他们还在做其它项目。

然后就是软件，AlphaGo。看英文维基介绍，这套软件运用了神经网络（neural network）、机器学习（machine learning）、还有蒙特卡罗树搜寻（Monte Carlo tree search）三样技术。

神经网络是最近三、四十年研究的新成果，就是用计算机模拟大脑神经细胞（又叫神经元）处理信息的方法。现代神经科学的理论是大脑里面不是一个神经元在处理信息，而是一群，并且有可能是不同的区域的神经元连接在一起，形成回路和网，最后加工了的信息，更重要的是认知和判断，就从这网中“玄出”。这玄出，炉匠师傅当年有专门的日志论述，俺就不赘述了。

有一点很重要，就是人的大脑里，大约有一千亿（100 billion neurons）个脑细胞。这一千亿的脑细胞，是生下来就有了，以后不会再长新的了。人的生命在延续，脑细胞在不断消耗中死去。到了后来，细胞死的太多，不够用了，那么人的智力行为功能就会受到很大影响。大脑里的细胞损失多了，症状就是老年痴呆。丘脑下面的基底核（basal ganglia）损失太多，那就是帕金森氏症。要是不幸中风或者受到创伤，语言功能或者运动功能都可能受到影响。虽然以后可能恢复部分甚至全部，但那是大脑的可塑性很大。不过要是脑细胞损失太多，那也就没办法了。虽然近年来有研究发现大脑里在海马那块区域还能长新的细胞，但这个发现还没能转换到利用这些新长的神经细胞去弥补替代那些失去的脑细胞，不然老年痴呆、帕金森氏症、还有中风脑损伤啥的都有救了。

还是把话题转回来，说人工智能。计算机不存在脑损伤的问题，而且只会越造越大，越来越快。但这只是硬件，更重要的是软件，因为只有通过软件，才能向机器发出指令，告诉机器怎么去做。而棋是高级智力游戏，于是跟人下棋，就成了衡量人工智能进步的标志。在西方，对象当然是国际象棋了。

去维基看了一下人机国际象棋大战的历史，蛮有意思的，原来1956年就有人在Los Alamos科学实验室的MANIAC上写了下棋程序，居然用23步打败了一位业余棋手。Los Alamos是个什么地方呢？简单点说吧，就是研究原子弹设计制造的地方，李文和就在那里工作过。以后又不断有人写出更好的程序来，计算机下棋的成绩也在不断提高。到了1968年，国际大师戴维德·列维（David Levy）公开打赌说，十年之类，没有机器能打败他。果然，到了1978年，列维跟当时最强的计算机象棋程序Chess 4.7对阵，在6局对阵中列维以4.5:1.5的比分战胜了对手。其中第二局计算机已经占尽了优势，但是在终局阶段还是被列维扯平了。第四局列维没能抵挡住，让计算机赢了，这也是计算机第一次赢了一位国际大师。虽然列维在总分上赢了计算机，但他也承认计算机战胜人类的那一天不远了。有意思的是，列维本人也很深入地参与到了计算机象棋软件的开发中。

随后的时间，就是人机不断较量，开头是人赢，但计算机进步很快，慢慢人就不占优势了。

1981 年，Cray Blitz在密西西比州国际象棋冠军赛中，取得了5:0的战绩，其中在第四轮打败了象棋大师Joe Sentef (2262)（括号里面的应该是排名等级分），成了第一个战胜人类大师的计算机程序，从而自己的得到了象棋大师的等级分2258。克雷超级计算机（Cray Supercomputer）还有印象么？当年可是大牛哦，超级计算机里就数Cray。Blitz则是德语“闪电”的意思。希特勒当年发动突袭战，就叫Blitz（闪电战）。以后又被延伸，一位橄榄球教练把闪电战术运用到橄榄球比赛中，所向无敌，当然他开头都不好意思说这是从希特勒那里学来的。你要是关心橄榄球的话，就会在评论中不断听到Blitz这个词。克雷闪电，呵呵，厉害哦。

到了1988年，卡内基·梅隆大学（Carnegie Mellon University）一帮人开发的HiTech象棋程序在宾西法利亚州象棋冠军赛中以4.5:0.5的比分赢得了冠军，并在比赛中打败了象棋国际大师（International Master）Ed Formanek (2485)。

回头接着写。

https://deepmind.com/alpha-go.html
https://en.wikipedia.org/wiki/AlphaGo
https://en.wikipedia.org/wiki/Human-computer_chess_matches
https://en.wikipedia.org/wiki/David_Levy_%28chess_player%29

收藏分享邀请

上一篇：凡草：人脑与电脑（之二）下一篇：漫人：阿狗、神经网络、蒙特卡罗、围棋及其它（二）

发表评论

		自动登录	找回密码
密码			注册

漫人：阿狗、神经网络、蒙特卡罗、围棋及其它（一）

最新评论

相关分类