前些天人狗大战,天昏地暗,人哭鬼泣。但实在忙得晕头转向,都没来得及插嘴。只是最后一盘,看了一半,熬马眼熬得睁不开了,就洗洗睡了。本来觉着小李(李世石)
还挺有希望的,因为狗右下角处理不好,走成了死棋。但一觉醒来,小李还是输了,唉,叹一声。对了,叫他小李,是因为他前面还有个大李,李昌镐,现在都看不
见他的踪迹了。这二李,抢了多少个世界冠军。中日韩三国擂台赛,有这二李之一把关,中日两国只要有一个赢了一回,唉呀,那就高兴得不得了。不过现在围棋在日本
衰落了,擂台赛上基本是做陪衬,看中韩对抗。而最近的一次三国围棋擂台赛,小李最后又在决战中输给了中国的柯洁。所以世界排名,是柯洁第一。但柯洁他自己
的微博号,却是柯洁大棋渣。![]() 扯哪儿去了,还是回头来说阿狗。且看风头谈风正健,连连发篇,指点狗棋,激扬人工智能江山。俺说什么也不能落后,而且顶风作案,是俺的恶习,所以尽管时过境迁,还忍不住要插几句嘴。 阿 狗就是阿尔法狗(AlphaGo)的简称,专门下围棋的计算机系统。之所以说系统,是因为这里面不光是软件,硬件也很关键。当年打败国际象棋世界冠军卡斯帕罗夫的深蓝(Deep Blue),就是IBM专门开发的大型计算机。去阿狗的网站(https://deepmind.com/alpha-go.html)瞄了一下,没看出来硬件用的是什么。网站上提到他们在《内缺》(Nature)上发了一篇文章,但还没来得及读。英文维基的说法是早期他们用的计算机是分布式的(distributed),有64个threads,1920个CPU,280个GPU,基本上就是现代超级计算机的模式。而且维基说现在用的计算机要比这个还要强得多,你可以想象这里面有多少计算力量(computing power)在里面。当然深思(DeepMind)计算机系统不光是可以跑阿狗这个软件,他们还在做其它项目。 然后就是软件,AlphaGo。看英文维基介绍,这套软件运用了神经网络(neural network)、机器学习(machine learning)、还有蒙特卡罗树搜寻(Monte Carlo tree search)三样技术。 神 经网络是最近三、四十年研究的新成果,就是用计算机模拟大脑神经细胞(又叫神经元)处理信息的方法。现代神经科学的理论是大脑里面不是一个神经元在处理信 息,而是一群,并且有可能是不同的区域的神经元连接在一起,形成回路和网,最后加工了的信息,更重要的是认知和判断,就从这网中“玄出”。这玄出,炉匠师傅当年有专门的日志论述,俺就不赘述了。 有一点很重要,就是人的大脑里,大约有一千亿(100 billion neurons)个脑细胞。这一千亿的脑细胞,是生下来就有了,以后不会再长新的了。人的生命在延续,脑细胞在不断消耗中死去。到了后来,细胞死的太多,不够用了, 那么人的智力行为功能就会受到很大影响。大脑里的细胞损失多了,症状就是老年痴呆。丘脑下面的基底核(basal ganglia)损失太多,那就是帕金森氏症。要是不幸中风或者受到创伤,语言功能或者运动功能都可能受到影响。虽然以后可能恢复部分甚至全部,但那是大 脑的可塑性很大。不过要是脑细胞损失太多,那也就没办法了。虽然近年来有研究发现大脑里在海马那块区域还能长新的细胞,但这个发现还没能转换到利用这些新 长的神经细胞去弥补替代那些失去的脑细胞,不然老年痴呆、帕金森氏症、还有中风脑损伤啥的都有救了。 还是把话题转回来,说人工智能。计算 机不存在脑损伤的问题,而且只会越造越大,越来越快。但这只是硬件,更重要的是软件,因为只有通过软件,才能向机器发出指令,告诉机器怎么去做。而棋是高 级智力游戏,于是跟人下棋,就成了衡量人工智能进步的标志。在西方,对象当然是国际象棋了。 去维基看了一下人机国际象棋大战的历史,蛮有 意思的,原来1956年就有人在Los Alamos科学实验室的MANIAC上写了下棋程序,居然用23步打败了一位业余棋手。Los Alamos是个什么地方呢?简单点说吧,就是研究原子弹设计制造的地方,李文和就在那里工作过。以后又不断有人写出更好的程序来,计算机下棋的成绩也在 不断提高。到了1968年,国际大师戴维德·列维(David Levy)公开打赌说,十年之类,没有机器能打败他。果然,到了1978年,列维跟当时最强的计算机象棋程序Chess 4.7对阵,在6局对阵中列维以4.5:1.5的比分战胜了对手。其中第二局计算机已经占尽了优势,但是在终局阶段还是被列维扯平了。第四局列维没能抵挡 住,让计算机赢了,这也是计算机第一次赢了一位国际大师。虽然列维在总分上赢了计算机,但他也承认计算机战胜人类的那一天不远了。有意思的是,列维本人也 很深入地参与到了计算机象棋软件的开发中。 随后的时间,就是人机不断较量,开头是人赢,但计算机进步很快,慢慢人就不占优势了。 1981 年,Cray Blitz在密西西比州国际象棋冠军赛中,取得了5:0的战绩,其中在第四轮打败了象棋大师Joe Sentef (2262)(括号里面的应该是排名等级分),成了第一个战胜人类大师的计算机程序,从而自己的得到了象棋大师的等级分2258。克雷超级计算机(Cray Supercomputer)还有印象么?当年可是大牛哦,超级计算机里就数Cray。Blitz则是德语“闪电”的意思。希特勒当年发动突袭战,就叫Blitz(闪电战)。以后又被延伸,一位橄榄球教练把闪电战术运用到橄榄球比赛中,所向无敌,当然他开头都不好意思说这是从希特勒那里学来的。你要是关心橄榄球的话,就会在评论中不断听到Blitz这个词。克雷闪电,呵呵,厉害哦。 到了1988年,卡内基·梅隆大学 (Carnegie Mellon University)一帮人开发的HiTech象棋程序在宾西法利亚州象棋冠军赛中以4.5:0.5的比分赢得了冠军,并在比赛中打败了象棋国际大师 (International Master)Ed Formanek (2485)。 回头接着写。 https://deepmind.com/alpha-go.html https://en.wikipedia.org/wiki/AlphaGo https://en.wikipedia.org/wiki/Human-computer_chess_matches https://en.wikipedia.org/wiki/David_Levy_%28chess_player%29 |
漫人: 嚯嚯,那你可真是投入。赶快把感想写下来吧,不然忘得真快,而且那股激情没了。

waspking: 如果不可以这样, 就是电脑不如人吧。
昨夜雨: 学习的过程不那么简单。电脑的学习方法人不能完全模仿,人脑的学习方法电脑也不能完全模仿。不像你做实验,可以定量给对照组提供多少多少“点”的“IQ溶液”,就 ...

waspking: 学啊。 同时, 跟同一个人学。

漫人: 用神经网络的设计,就必须有个学习的过程。你不让计算机学,计算机就是一片空白。但人有过去的经验可以借助。 ...
四维: 才想起我因为AlphaGo下载了那多伦多大学的教授的deep learning的论文,但没读。

waspking: a better match would be for someone to teach one person and one computer at the same time, and let both students to have a match...
in that case, the ...
yi_ran: Neural network 有意思。等我去看炉匠师傅的博客
AprilFool: 主任是半仙,自然是骑着扫帚飘过的。小六哥你骑什么飘呀?Drone?

666: 我飘过的原因跟主任相反,我不会下棋。
八月风: 我从头到尾实时看了后面三局比赛,感慨颇多。最近琐事太多,等你这里侃完了,我也抽时间整理整理思路扯一篇,不然时间久了也就忘了。 ...
waspking: MANIAC上写了下棋程序,居然用23步打败了一位业余棋手
还以为是程序只有23句。。。
星光: 你这文章里信息量很大,长知识了。![]()
上茶,等着听你慢慢侃。

AprilFool: 主任是半仙,自然是骑着扫帚飘过的。小六哥你骑什么飘呀?Drone?![]()

666: 我飘过的原因跟主任相反,我不会下棋。

Powered by Discuz! X3.4
© 2001-2017 Comsenz Inc.