天涯小站 2.0

 找回密码
 注册
搜索
天涯小站 2.0 首页 拾萃 科技网络 查看内容

漫人:阿狗、神经网络、蒙特卡罗、围棋及其它(一)

2016-3-30 06:52 AM| 发布者: 星光| 查看: 705| 评论: 25|原作者: 漫人

摘要: 前些天人狗大战,天昏地暗,人哭鬼泣。但实在忙得晕头转向,都没来得及插嘴。只是最后一盘,看了一半,熬马眼熬得睁不开了,就洗洗睡了。本来觉着小李(李世石) 还挺有希望的,因为狗右下角处理不好,走成了死棋。 ...
前些天人狗大战,天昏地暗,人哭鬼泣。但实在忙得晕头转向,都没来得及插嘴。只是最后一盘,看了一半,熬马眼熬得睁不开了,就洗洗睡了。本来觉着小李(李世石) 还挺有希望的,因为狗右下角处理不好,走成了死棋。但一觉醒来,小李还是输了,唉,叹一声。对了,叫他小李,是因为他前面还有个大李,李昌镐,现在都看不 见他的踪迹了。这二李,抢了多少个世界冠军。中日韩三国擂台赛,有这二李之一把关,中日两国只要有一个赢了一回,唉呀,那就高兴得不得了。不过现在围棋在日本 衰落了,擂台赛上基本是做陪衬,看中韩对抗。而最近的一次三国围棋擂台赛,小李最后又在决战中输给了中国的柯洁。所以世界排名,是柯洁第一。但柯洁他自己 的微博号,却是柯洁大棋渣。

扯哪儿去了,还是回头来说阿狗。且看风头谈风正健,连连发篇,指点狗棋,激扬人工智能江山。俺说什么也不能落后,而且顶风作案,是俺的恶习,所以尽管时过境迁,还忍不住要插几句嘴。

阿 狗就是阿尔法狗(AlphaGo)的简称,专门下围棋的计算机系统。之所以说系统,是因为这里面不光是软件,硬件也很关键。当年打败国际象棋世界冠军卡斯帕罗夫的深蓝(Deep Blue),就是IBM专门开发的大型计算机。去阿狗的网站(https://deepmind.com/alpha-go.html)瞄了一下,没看出来硬件用的是什么。网站上提到他们在《内缺》(Nature)上发了一篇文章,但还没来得及读。英文维基的说法是早期他们用的计算机是分布式的(distributed),有64个threads,1920个CPU,280个GPU,基本上就是现代超级计算机的模式。而且维基说现在用的计算机要比这个还要强得多,你可以想象这里面有多少计算力量(computing power)在里面。当然深思(DeepMind)计算机系统不光是可以跑阿狗这个软件,他们还在做其它项目。

然后就是软件,AlphaGo。看英文维基介绍,这套软件运用了神经网络(neural network)、机器学习(machine learning)、还有蒙特卡罗树搜寻(Monte Carlo tree search)三样技术。

神 经网络是最近三、四十年研究的新成果,就是用计算机模拟大脑神经细胞(又叫神经元)处理信息的方法。现代神经科学的理论是大脑里面不是一个神经元在处理信 息,而是一群,并且有可能是不同的区域的神经元连接在一起,形成回路和网,最后加工了的信息,更重要的是认知和判断,就从这网中“玄出”。这玄出,炉匠师傅当年有专门的日志论述,俺就不赘述了。

有一点很重要,就是人的大脑里,大约有一千亿(100 billion neurons)个脑细胞。这一千亿的脑细胞,是生下来就有了,以后不会再长新的了。人的生命在延续,脑细胞在不断消耗中死去。到了后来,细胞死的太多,不够用了, 那么人的智力行为功能就会受到很大影响。大脑里的细胞损失多了,症状就是老年痴呆。丘脑下面的基底核(basal ganglia)损失太多,那就是帕金森氏症。要是不幸中风或者受到创伤,语言功能或者运动功能都可能受到影响。虽然以后可能恢复部分甚至全部,但那是大 脑的可塑性很大。不过要是脑细胞损失太多,那也就没办法了。虽然近年来有研究发现大脑里在海马那块区域还能长新的细胞,但这个发现还没能转换到利用这些新 长的神经细胞去弥补替代那些失去的脑细胞,不然老年痴呆、帕金森氏症、还有中风脑损伤啥的都有救了。

还是把话题转回来,说人工智能。计算 机不存在脑损伤的问题,而且只会越造越大,越来越快。但这只是硬件,更重要的是软件,因为只有通过软件,才能向机器发出指令,告诉机器怎么去做。而棋是高 级智力游戏,于是跟人下棋,就成了衡量人工智能进步的标志。在西方,对象当然是国际象棋了。

去维基看了一下人机国际象棋大战的历史,蛮有 意思的,原来1956年就有人在Los Alamos科学实验室的MANIAC上写了下棋程序,居然用23步打败了一位业余棋手。Los Alamos是个什么地方呢?简单点说吧,就是研究原子弹设计制造的地方,李文和就在那里工作过。以后又不断有人写出更好的程序来,计算机下棋的成绩也在 不断提高。到了1968年,国际大师戴维德·列维(David Levy)公开打赌说,十年之类,没有机器能打败他。果然,到了1978年,列维跟当时最强的计算机象棋程序Chess 4.7对阵,在6局对阵中列维以4.5:1.5的比分战胜了对手。其中第二局计算机已经占尽了优势,但是在终局阶段还是被列维扯平了。第四局列维没能抵挡 住,让计算机赢了,这也是计算机第一次赢了一位国际大师。虽然列维在总分上赢了计算机,但他也承认计算机战胜人类的那一天不远了。有意思的是,列维本人也 很深入地参与到了计算机象棋软件的开发中。

随后的时间,就是人机不断较量,开头是人赢,但计算机进步很快,慢慢人就不占优势了。

1981 年,Cray Blitz在密西西比州国际象棋冠军赛中,取得了5:0的战绩,其中在第四轮打败了象棋大师Joe Sentef (2262)(括号里面的应该是排名等级分),成了第一个战胜人类大师的计算机程序,从而自己的得到了象棋大师的等级分2258。克雷超级计算机(Cray Supercomputer)还有印象么?当年可是大牛哦,超级计算机里就数Cray。Blitz则是德语“闪电”的意思。希特勒当年发动突袭战,就叫Blitz(闪电战)。以后又被延伸,一位橄榄球教练把闪电战术运用到橄榄球比赛中,所向无敌,当然他开头都不好意思说这是从希特勒那里学来的。你要是关心橄榄球的话,就会在评论中不断听到Blitz这个词。克雷闪电,呵呵,厉害哦。

到了1988年,卡内基·梅隆大学 (Carnegie Mellon University)一帮人开发的HiTech象棋程序在宾西法利亚州象棋冠军赛中以4.5:0.5的比分赢得了冠军,并在比赛中打败了象棋国际大师 (International Master)Ed Formanek (2485)。

回头接着写。

https://deepmind.com/alpha-go.html
https://en.wikipedia.org/wiki/AlphaGo
https://en.wikipedia.org/wiki/Human-computer_chess_matches
https://en.wikipedia.org/wiki/David_Levy_%28chess_player%29
发表评论

最新评论

引用 2016-5-26 07:55 AM
一边读一边觉得自己脑细胞已经死去好多了。
引用 2016-4-2 12:39 AM
漫人: 嚯嚯,那你可真是投入。赶快把感想写下来吧,不然忘得真快,而且那股激情没了。
我写了一大半没完成的“工程”有好几个呢,现在时间总是不够用,而且的确也是“激情”不在了。
引用 2016-4-1 06:33 PM
waspking: 如果不可以这样, 就是电脑不如人吧。
毋庸置疑,电脑在很多方面不如人。
引用 2016-4-1 04:35 PM
昨夜雨: 学习的过程不那么简单。电脑的学习方法人不能完全模仿,人脑的学习方法电脑也不能完全模仿。不像你做实验,可以定量给对照组提供多少多少“点”的“IQ溶液”,就 ...
如果不可以这样, 就是电脑不如人吧。
引用 2016-4-1 03:44 PM
waspking: 学啊。 同时, 跟同一个人学。
学习的过程不那么简单。电脑的学习方法人不能完全模仿,人脑的学习方法电脑也不能完全模仿。不像你做实验,可以定量给对照组提供多少多少“点”的“IQ溶液”,就可以做出结果对照研究什么的。
引用 2016-4-1 01:01 PM
漫人: 用神经网络的设计,就必须有个学习的过程。你不让计算机学,计算机就是一片空白。但人有过去的经验可以借助。 ...
学啊。 同时, 跟同一个人学。
引用 2016-3-31 10:50 PM
四维: 才想起我因为AlphaGo下载了那多伦多大学的教授的deep learning的论文,但没读。
快读快读,然后给我们说说。
引用 2016-3-31 10:50 PM
waspking: a better match would be for someone to teach one person and one computer at the same time, and let both students to have a match...

in that case, the ...
用神经网络的设计,就必须有个学习的过程。你不让计算机学,计算机就是一片空白。但人有过去的经验可以借助。
引用 2016-3-31 10:48 PM
yi_ran: Neural network 有意思。等我去看炉匠师傅的博客
非常有意思的东西,而且现在应用也非常广泛。
引用 2016-3-31 10:47 PM
AprilFool: 主任是半仙,自然是骑着扫帚飘过的。小六哥你骑什么飘呀?Drone?
你说主任是扫帚星?
引用 2016-3-31 10:47 PM
666: 我飘过的原因跟主任相反,我不会下棋。
没杀过猪还没见过猪跑?我也不怎么会下,但胡侃还是要的。
引用 2016-3-31 10:45 PM
八月风: 我从头到尾实时看了后面三局比赛,感慨颇多。最近琐事太多,等你这里侃完了,我也抽时间整理整理思路扯一篇,不然时间久了也就忘了。 ...
嚯嚯,那你可真是投入。赶快把感想写下来吧,不然忘得真快,而且那股激情没了。
引用 2016-3-31 10:44 PM
waspking: MANIAC上写了下棋程序,居然用23步打败了一位业余棋手

还以为是程序只有23句。。。
说琳爷写过只有几行的程序,还特卖钱。
引用 2016-3-31 10:43 PM
星光: 你这文章里信息量很大,长知识了。

上茶,等着听你慢慢侃。
呵呵,胡侃漫侃,不必当真。
引用 2016-3-31 06:08 PM
才想起我因为AlphaGo下载了那多伦多大学的教授的deep learning的论文,但没读。
引用 2016-3-31 02:53 PM
a better match would be for someone to teach one person and one computer at the same time, and let both students to have a match...

in that case, the computer had no prior knowledge about the game and will always lose?
引用 2016-3-31 02:42 PM
AprilFool: 主任是半仙,自然是骑着扫帚飘过的。小六哥你骑什么飘呀?Drone?
上班时间自然是迷迷糊糊在云雾里飘来啦。
引用 2016-3-31 12:37 PM
Neural network 有意思。等我去看炉匠师傅的博客
引用 2016-3-31 11:28 AM
666: 我飘过的原因跟主任相反,我不会下棋。
主任是半仙,自然是骑着扫帚飘过的。小六哥你骑什么飘呀?Drone?
引用 2016-3-31 10:24 AM
我飘过的原因跟主任相反,我不会下棋。

查看全部评论(25)

手机版|天涯小站

GMT-5, 2026-6-27 03:03 AM

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

返回顶部