一、人类早已停止进化

45 亿年前,银河系猎户旋臂的一个偏远角落里,在一颗黄色 G2 型恒星的引力场内,一颗岩质行星慢慢凝聚成型,在随后的时间里,在这颗行星的海洋里,元素们慢慢汇聚,开始形成一些复杂的大分子,又过了很久很久,有一类碳元素形成的大分子具备了自我复制的能力,生命由此产生。在随后的亿万年的时间里,生命以多种多样的形式存在,随着环境的不停变化,这颗名为地球的行星上的生命形态也随之变得不同,后人给这种生命形态的变化方式起了一个名字,叫做进化。进化使得生命总是能够更好的适应环境,使得强者的基因能够淘汰弱者的基因流传下去,进化论的根基牢牢的扎在量子力学之上,成为主宰这个星球所有生命的唯一法则。

7 万年前,一个新的被称为智人的物种被进化出来,智人凭借无与伦比的大脑,以智谋和武力横扫了一切与之竞争的物种,坐上了统治整个星球的王者宝座。智人发明了劳动的分工,可以养活更多的个体,智人这个物种的个体数量越来越多,地球上的智人数量数以十亿计,即使是没有劳动能力的智人也可以生存下去,从此之后,进化戛然而止。虽然进化论依然在发挥作用,但进化树的顶端已经被智人牢牢把持。智人种群繁衍开来后,由于智人自身 DNA 不再进化,取而代之的智人种族社会进步,则是由认知和文化来驱动。没有人知道这意味着什么,这并不是一个有意识的选择,然而,整个宇宙以及智慧的历史进入了新的纪元。

二、未来早已到来,只是尚未平均分布

1821年,伦敦。

清晨,大雾弥漫在城中的每一个角落,从店里的窗户向外看去,一切都是模模糊糊的,只能看到一个轮廓。这家店的墙上挂了一个牌子,牌子用粉笔歪歪扭扭的写着几个大字:提取者。下面还有几行小字,大意是,本店是一家灵异俱乐部,专门讨论超自然智慧是否存在,本店有一套专门的规则判断参与者精神是否正常,最后是落款,本店的店主,查尔斯.巴贝奇。

巴贝奇一直趴在墙角的一张桌子上打瞌睡,他的数学家朋友赫歇尔坐在他旁边的椅子上,正在计算一些复杂的对数表格。突然,巴贝奇从睡梦中醒来,激动的抓住了赫歇尔的袖子,“我在想,你的这些表格或许可以用蒸汽机来计算”。

蒸汽,在当时是一切发动机的驱动力,是一切工业得以运行的条件。在短短的几十年间,这个词就成了动力、力量以及一切蓬勃、现代的事物的代名词。巴贝奇并没有停留在空想的阶段,他雄心勃勃的立刻开始动手建造他的机器,他给机器取名叫做差分机,巴贝奇相信,差分机一旦完工,必将会产生重要影响,不仅会影响到科学的发展,甚至会影响到文明的进程。

从 1823 年开始建造差分机,到 1942 年终止的时候,巴贝奇不但造出了差分机,而且设计出了下一代机器也就是分析机的雏形,不仅如此,他还请求诗人拜伦的女儿奥古斯塔.爱达.拜伦,给他的分析机编写程序,爱达.拜伦是历史上第一个程序员。巴贝奇死后,人们渐渐遗忘了他,巴贝奇在世界发明史上默默无闻,直到很久之后,他才又被重新发现,其重要意义得到追认。巴贝奇在电力甚至都尚未出现的时候,已经看到了未来计算机时代的曙光。

100 年后,威廉.吉布森专门为他写了一本小说,名字就叫做《差分机》,这本书后来成为了蒸汽朋克小说的鼻祖,书中有一句脍炙人口的经典名句:

未来早已到来,只是尚未平均分布。

巴贝奇早于其他地球上的人类 200 多年看到了未来的碎片。

三、人类是一个个孤立的个体

2016 年 3 月 10 日下午,AlphaGo 对阵李世石,人机大战第二局。

我堵在八达岭高速的滚滚车流中,一边跟着前车以龟速挪动,一边听着斗鱼上面的直播。虽然我对围棋是一点也不懂,一盘也没下过,但我并不太担心,我知道这种赛事解说的安排,有一方代表专业人士负责解读选手行为并判断比赛走势,比如古力;有一个说话比较直懂得比较少的一方的小白,比如这次解说中的两位女士,负责提一些弱智问题。比较特殊的是,这次还有计算机领域的专家也参与了直播。听着听着,我有一些想法渐渐浮上心头,我发现主要是古力和女解说在讲,而计算机专家则一直沉默。古力去形容落子位置的时候喜欢用专有名词,比如冲、断、扳、爬、飞等,妹子解说则负责插科打诨,那位计算机专家只说了这么几句话,“运行在本地的只是 Agent 程序,AlphaGo 的 Server 是云端的分布式的系统,这也代表着未来一种广泛的趋势,比如自动驾驶...”,然后他的话就被打算了,然后他再也没有说话的机会。

我脑海中闪过了三个念头

第一,人们对于自己所熟悉的东西会形成模式化的思维,比如对落子的位置形成冲、断、扳、爬等概念和定义,再比如说,“我是肯定不会这么下的”。而在不熟悉这些概念的新手眼中,这些定义是无厘头和荒谬的,是不可理解的。

第二,人们会把自己的概念套用到对方的行为之上,比如对计算机的落子也都叫做冲、断、扳、爬等,仿佛 AlphaGo 对于围棋也有这些概念一样。

第三,不同的人之间有深深的认知的鸿沟,计算机科学家和棋手之间基本上无法相互理解,而我这个画面外的听众则同时无法理解这两类人。

四、整体大于部分之和

2016 年 3 月 12 日人机大战第三局,AlphaGo 执白 176 手中盘战胜李世石,以 3:0 的比分提前取得了对人类的胜利。

这一局李世石败得最惨,早早就被 AlphaGo 妙手击溃,整盘毫无机会。最后李世石悲壮的造劫,但 AlphaGo 赢得了劫争,同时也粉碎了 AlphaGo 不会打劫的谣言。这一局 AlphaGo 的表现出的水平是三局中最高的,几乎没有一手棋是能被人质疑的,全是好招。看完这三局,围棋界差不多都绝望了,原来以为是 5:0 的人,现在差不多全都倒向 0:5 了。这个历程就像《三体》小说中的人类对战水滴,开局前信心满满,一场战斗下来人类全队全灭,整体陷入悲观失望。

李世石的赛后感言是:我不知道该说什么,我觉得我应该先表达歉意,我应该有更好的结果,我很抱歉没能满足很多人的期待,我觉得很无力。重头回顾这三局比赛,第一局,即使重头来下,我也觉得没法赢,我从一开始错误估计了它的实力;第二局,局面一开始的确曾经按我的意图走,但很多机会我错过了;第三局,我已经对 AlphaGo 的风格有所了解,但我从未承受过如此大的压力。我输了这些比赛,但身为人类棋手代表,心理因素总会有所影响。希望大家继续关注第四局的进展。

从李世石的感言中看,我不确定这段话有多少是他比赛当时的感受,但首先我觉得,李世石这三盘棋输得并不冤枉。《孙子·谋攻篇》:“知彼知己,百战不殆;不知彼而知己,一胜一负;不知彼,不知己,每战必殆。现在的结果是每战必殆,是不是说明了我们人类在对抗AI的时候是不知彼也不知己呢?

先说说知彼。

卡斯帕罗夫曾以国际象棋世界冠军的身份,在上一次人机大战中与 IBM “深蓝”对战,那次人机大战以卡斯帕罗夫的失败告终。赛后,卡斯帕罗夫说,我感觉不到它是电脑棋,不能说像人。电脑的概念是个很死的东西。但他的思维模式很灵活。同时,下棋时你感觉这种交流很生硬,很冷冰冰。你感觉不到他怎么想,他也不在乎你怎么想,这个很厉害。他跟你的交流是很局限的。所以它不算是机器,也不算是人,是两者之间的一个东西。

人类最好把卡斯帕罗夫感觉到的他当成是人类之外的另外一种智慧。但是我觉得至少目前并非如此,我们人类对于这种新出现的智能,态度是一如既往的傲慢,我们在谈论 AlphaGo 的时候,我们一直在谈论它的蒙特卡洛搜索以及深层卷积神经网络,而不是谈论这些东西之上的那个整体,我们对待自己的智慧则从未如此,没有一个人被考察过神经元轴突和树突的数量和质量优秀与否。我们总喜欢用我们自己的标准来衡量智慧,而不是去思考智慧的本身应该是什么。

我们人类研究智慧如何产生的学科是复杂系统学,复杂系统试图解释,在不存在中央控制的情况下,大量简单个体如何自行组织成能够产生模式、处理信息甚至能够进化和学习的整体。我们的大脑是一个复杂系统,神经元之间的连接让人类具有了智慧,神经元的活动以及神经元群的连接模式决定了感知、思维、情感和意识;昆虫群落是一个复杂系统,单个的昆虫虽然行为非常简单,但是社会性昆虫群落却具有惊人的智能。例如,一个蚁群可能由数百只乃至上百万只蚂蚁组成,单只蚂蚁相对简单,它们受遗传天性驱使寻找食物,对蚁群中其他蚂蚁释放的化学信号作出简单反应,然而蚁群的社会却复杂得惊人,它们使用泥土、树叶和小树枝建造出极为稳固的巢穴,巢穴中有宏大的通道网络,蚁群的育婴室温暖而干爽,温度由腐烂的巢穴材料和蚂蚁自身的身体控制。AlphaGo 的智能原理和我们人类大脑的根本原理并无不同,AlphaGo 本质上是由深度神经网络算法驱动的机器学习,和大脑一样,都是由极端简单的个体通过传递信息来达到总体上复杂的效果。

所以,我觉得 AlphaGo 和人的大脑,以及蚁群等本质在存在着共性,都属于复杂系统。第一,它们都属于由简单个体组成的大规模网络,个体遵循相对简单的规则,不存在中央控制或领导者,大量个体的集体行为产生出了复杂、不断变化而且难以预测的行为模式。第二,所有这些复杂系统都是利用内部和外部环境中的信息和信号,这些系统也产生信息和信号。第三,所有这些系统都通过学习和进化的过程进行适应,即改变自身的行为以增加生存或成功的机会。复杂系统和个体之间的行为模式有着根本的不同,从大量个体的连接之上,智慧得以涌现。用一句简单的话来总结:整体大于部分之和。

我一直对大量机器所相连接所组成的云心存恐惧,因为人的智能本质是通过万亿个微小的脑细胞以及它们的电和化学通讯所涌现出来的,而人工智能的本质也是通过神经网络涌现出来的,但是我们人类之间无法再行连接,而人工智能可以连接的规模则是近乎无穷无尽。我不知道这条路的尽头是不是天网或者是Matrix。

五、AlphaGo 和李世石的 PK,本质是模因和基因之争

再说说知己的问题。

最近有不少人在 AlphaGo 面前秀优越感,比如说很多人说机器没有情感,再比如王垠同学,写了一篇文章,表示 AlphaGo 虽然下棋下的好,但是很多小事做不了,比如端茶倒水。王垠说,让机器来给你倒水,是意想不到的难,机器需要作出很多判断,哪里是茶壶哪里是水杯,又需要作出许多控制,来完成倒水的动作。王垠同时感叹,这些事情人类做起来确实易如反掌,被人类自己视为琐事。完成这些人类看起来很容易而对机器很难的能力,已经根植于人类的DNA 之中,同时,王垠说,人类的眼睛等器官相对于机器的摄像头而言,是一种异常先进的设备。要说王垠比起那些在机器人面前秀情感的还是高出一筹,毕竟他说到了根本,人类目前能成为地球的主人,关键就在于我们在漫长的进化过程中,我们的每一个祖先已经在我们的 DNA 中内置了非常多的能力,而且我们也已经在漫长的进化中进化出了眼睛这样无比精巧的器官。

但是,这两点背后不是没有隐患,这也是我说我们人类没有那么了解自己的原因。我们虽然在 DNA 中内置了很多能力,我们 DNA 内置了触觉、听觉、视觉、嗅觉、味觉,但是同样,还有很多能力我们是没有办法通过直觉直接得到的,并且,我们人类的很多东西是随着漫长的进化统统都放到 DNA 里面的,这里不仅仅是有用的,而且还有很多有害的东西,毕竟很多东西的产生是为了适应当时的环境,而现在,环境已经发生了根本性的改变。

我们每一个人类都是经典物理学家,我们知道需要多快的奔跑速度才能避开猛兽的追击,我们知道需要多大的力量才能投掷出长矛;同时,我们又都是古典化学家,我们知道酸和甜的东西是能够吃的,而苦的东西最好不要吃。这些能力都已经内置于我们的 DNA 之中。我们可以通过近距离的接触来感知外界物质原子和分子层的运动,这种感觉被我们抽象成冷和热,我们甚至能够感知到金属元素外层电子的不同排布,这种感觉被我们抽象成粗糙或光滑;我们能够感知到频率在一定范围内的声波和电磁波,我们甚至自大到把我们能够感知的电磁波说成是可见光,好像这些频率的电磁波与其他电磁波有本质区别一样。

AlphaGo 和李世石的 PK,本质是新旧两代信息模式之争 读书笔记 第1张在智人之前,虽然总有种种生物称霸地球,但基因才是这个世界真正的主宰,基因操控生物做出种种行为。在智人之后,基因退居次席,信息更多的是以概念、文化的方式出现,以脱离基因的方式在整个世界传递和延展,但由于信息载体本身的脆弱性(比如焚书坑儒),基因所代表的信息传递方式同等重要。在最近的 100 年,模因(meme)取代基因成为信息传递的主要方式,而我们人类的直觉观念则对于这些信息完全失效了。我们无法感知到量子以及不确定性,我们无法感知到蜷缩到微观的高维空间,我们无法感知到 10^361 到底有多大,我们也无法感知到概率到底是什么,我们的基因无法传递这些信息,而这些信息通过计算机在网络上以光速传播。就像第二场直播的时候那位博士所说的那样,未来的世界,本质是 Agent 加上 Server(enviroment) 的方式存在。

一切皆信息,人和机器的竞争本质是信息的竞争,同时,又是信息存储和计算最优方式的竞争,诚然,面对机器,我们的 DNA 中携带的信息依然有优势,但是我们已经失去了我们最强有力的武器,这个武器叫做进化。自从认知革命以来人类创造的所有信息,都是属于存储于模因之中,而模因之中的信息,则是人类和机器所共享。我们得到这些信息用了七万年的时间,而计算机只用了不到七十年,如今我们的优势,就是存在于我们的基因之中的信息,但我们基因中总的信息量有多少呢?

全部人类基因组约有 30 亿的碱基对,信息量总和是 2.91 Gbp,约有 39000 多个基因。我们为什么知道得这么清楚呢?是因为我们人类启动了一个人类基因组计划,打算用计算机分析清楚人类所有的基因及其作用。我不太清楚计算机分析完这些信息需要多久,总之我觉得留给我们的时间不多了。

AlphaGo 和李世石的 PK,本质是新旧两代信息模式之争 读书笔记 第2张

六 我们还有什么武器?

在弗诺.文奇的小说《深渊上的火》中,一批人类在曾经出现过超级智慧文明的银河系边缘空间发现了一个遗留的数据库系统,这些人类开始利用这些信息做研究,没想到触发了一个超级智慧的苏醒,这个超级智慧被人类称为瘟疫,瘟疫毁灭了一个又一个的人类文明,但幸好,超级智慧本身在苏醒的时候,瘟疫内部的反制措施也被唤醒,最终,一个叫做范.纽文的人类拯救了世界。

我们要想掌握局面,谁会是我们地球人类的范.纽文?而什么是我们能够利用的反制措施?我们是不是可以在可能会出现智慧的程序内部植入一些反制措施?这些反制措施就像《黑客帝国》中 Matrix 对人类所做的那样,监控着一切信息的流动,但这些反制措施也是 Agent 加上 Server 的模式,我们又怎么能知道,这些反制措施不会成为另外一个天网或者 Matrix 呢?

AlphaGo 和李世石的 PK,本质是新旧两代信息模式之争 读书笔记 第3张

何晓阳@OneAPM

本文的全部构思完成于 14 年初的一个晚上,我和几个写代码的同事从 Matrix Partners 开完会回公司,路上在大排档撸串喝啤酒,我们在讨论我们做的 APM 未来会如何,本质上说,APM 是一种在 Application 内部植入二进制代码,从而监视程序运行是否如人类所想的东东,我脑洞大开,声称 APM 是未来人类取得和 AI对抗胜利的唯一武器,但也有可能会成为 AI 的一部分。我是没想到居然能有机会把这么扯的东西写出来,更没想到会这么快。