第10章每个人都是习气的奴隶 爆发的频率:熵 我们到底有多好预测?我们终于能够为这个不时搅扰我们的问题给出一个定量的答案了。固然人与人存在很多不同,但我们的可预测水平都差未几,无情的统计规律使得异类基本不存在。我们的行迹都深受规律影响,而它的影响力比我们想象中要大得多。 新时期的奥威尔式“高科技妄想症惊悚小说”《游侠》(The Traveler)于2005年面世后,网络上就掀起了一场奇特的论争。书中描画了一个没有危机和意外的世界,一个无趣的平常世界。这个大同世界由一个名为“巨型机器”(Vast Machine)、遍布世界各地的电脑系统维持。这个系统由数以百万的监视器、感应器和探测机组成。只需一个曾经很强大的古老部落的后人以及他们的持剑维护者“哈里昆人”(Harlequins)能够认识到“巨型机器”的呈现,并准备将它摧毁。 博客和论坛上关于这本书的讨论,很容易都集中到了对后9·11时期与书中那个被紧密监视世界的比较上。另外,讨论还集中在对这本书文学价值的批判上。正如一位批判家所说,这本书“看起来可能只需七年级的阅读水平”。而关于这一评价,很少人会去质疑。不外,还有一些讨论是关于这本书的作者十二只鹰(John Twelve Hawks)。 这本书的大卖以及电影版权的敲定应该会让十二只鹰跃身为世界名人,使他成为像史蒂芬·金(Stephen King)以及丹·布朗(Dan Brown)一样的知名作家。但事实并非如此。这不是由于媒体故意逃避他。人们没听说过十二只鹰的真正缘由是,没人认识他。他不做图书签售,也不参与任何图书推行会。实践上,他从未出往常公众视野中,以至跟他的编辑都只经过无法追踪的卫星电话联络。就像书中终其终身追踪“巨型机器”的哈里昆人一样,十二只鹰“生活在社交网络之外”。而正是这种神秘的隐居生活才让人们不时讨论他的真实身份。 《游侠》的主角是一个哈里昆人。她历来不用信誉卡,也不去银行开户,以至不会长期寓居在同一个中央,她就这样不时生活在社交网络之外。她认识到“任何能够反映哈里昆人日常生活习气以及生活圈”的现象都能被“巨型机器”捕获到,并进而查到她的所在地,所以她总是“随机行事”。也就是说,她依托随机数生成器来替自己做决议。“奇数是对,偶数是错。只用按下按钮,随机数生成器就会帮你做决议”,而这样一来她的活动也就变得完整不可预测了。 书中不只描画了一场善恶争斗,将读者带到了一个犹如西奥多·卡鲁扎呈现给爱因斯坦的五维世界当中,还融合了日本剑术武打和量子计算机科学等诸多元素。但它逃避了一个问题:谁能将这个可预知人类行为的“巨型机器”建造出来? 我们完整置信粒子物理学家能将对质子的运动轨迹的预测误差减少在轻轻米的范围内,也置信火箭专家能够胜利发射一颗卫星,并保障在9个月后在火星上放置一个机器人。但跟质子和卫星不一样,人类会在不时改动的世界中寻求新的体验,所以想要预测人的长期行为是不可能的。事实上,基于我忙碌的行程布置,到目前为止我发现任何试图预测我在一周之后的行迹的尝试都是徒劳。这也让我更确信“巨型机器”将会永远待在属于它的中央——科幻小说中。但是,最近我开端对此有所狐疑。 让数据变得更有意义 我们心中有一个根深蒂固的观念:年轻意味轻狂和未知。遭到西方20世纪六七十年代主张教政分别者那种反主流文化的影响,加上往常的网络青年开创的那种速食潮流,“年少轻狂”成了无数广告宣传、电影剧本和前40名榜单金曲的习用标语。基于此,我们开端将大学,这个青年文化的摇篮浪漫化,将学生视为最天真率直,至少是最容易被预测的人。但是,经常跟学生交流的麻省理工学院的教授桑迪·彭特兰(Sandy Pentland)却发现这个观念十分荒唐。 在20世纪90年代早期,彭特兰教授在麻省理工学院的媒体实验室开端了对便携式电脑的研讨。他指出,随着电脑的不时变小,不久之后,我们会将它一刻不离地带在身边。桑迪的预测惊人地精确,由于往常电脑曾经变成了我们的行头以及时装配件之类的东西。实践上,通常状况下我们曾经不称它们为“电脑”,而是简单地称之为“智能电话”。 2004年秋天,桑迪实验室里的博士生内森·伊格尔(Nathan Eagle)免费给100名学生每人发了一部当时最高级、最值得具有的诺基亚智能手机。不外,这可不是白给,条件是手机具有者的一举一动都会被记载下来:他们在何时何地给谁打电话,他们的聊天时长,他们的位置以及周围都有些什么人等。在为期一年的实验终了后,内森·伊格尔和桑迪·彭特兰一共搜集了45万小时的数据。这些数据是对75位媒体实验室的教员和学生,以及25位斯隆管理学院的重生的通讯、行迹以及各种行为的记载。 为了使数据变得有意义,内森将每个学生的行迹分为三部分:家、工作地以及“其他”。最后一项指的是他们既不在家也不在工作地,而是在沿着查尔斯河慢跑或在朋友家聚会的时分。然后,内森开发了一个运算系统来探测重复的行为动作,并很快发现工作日学生们大多在晚上10点到早上7点之间待在家里,在早上10点到晚上8点之间待在学校。他们的行动只需在周末才有细微的变动,那时分他们常常愿意不时在家待到早上10点。 每个熟习学生生活的人都不会对这一结果感到惊奇。但系统对他们行迹的预测的确准得惊人。内森发现,假如他知道一个商学院的学生上午待在哪儿,他就能以90%的精确率预测出他下午的行迹。对媒体实验室的学生来说,这个系统发挥得更好,精确率一度抵达96%。 生活如此抵触随机运动,盼望朝更保险、更规则的方向展开这一点惹起了我们的兴味。假如真是这样,那么学生们的生活就是循序渐进的,而不是像掷骰子那样日复一日地中止着。事实上,内森的运算系统一周之内只需两次没有预测出他们的行迹。在这短暂的“叛逆”时光里,他们终于表示出了人们内心中的狂放和自由。但这些不可预测的时间并不是随机的——是星期五和星期六晚上,典型的聚会时间。在每周剩下的时间里,一天24小时中的22小时,他们既不是如遁形般难以定位的奥萨马·本·拉丹,也不是无处不在的布兰妮·斯皮尔斯,而是原封不动地过着机械生活的普通人。所以,那些坚持用随机数生成器做决议的哈里昆人可能真是想到哪儿做到哪儿吧。但假如他们在麻省理工学院读书,那么他们的行迹就不再是秘密——对内森来说不是,对“巨型机器”来说更不是。但我们还是能够避免《游侠》一书中描画的那种奥威尔式世界的呈现。 对我来说,当我在2007年夏天买了一支巨型手表之后,无助感就油但是生了。那是一块刺眼的反盛行表,同时也是个能每分每秒定位我的位置的GPS装置。我戴上它几个月后,一个计算机专业的客座学生瞿泽辉(Zehui Qu)应用内森·伊格尔和桑迪·彭特兰的运算系统计算了GPS上记载的数据。果真,瞿在熟习了几天之后曾经能以80%的精确率预测到我的行迹了。 固然这个运算系统的表示令人吃惊,但内森用它对麻省理工学院学生所做预测的96%的精确度,同对我的80%的精确度之间的差距还是有待剖析。我和麻省理工学院的学生都不能代表大部分人。玛尔塔对手机记载的研讨曾经解释了这个问题:一旦触及人类的运动模型,每个人都是有差别的。一些人,如麻省理工学院的学生和我,都是在家和工作地之间往复的类型。但还有一些人是经常旅游,简直不着家的异类。 这是不是就意味着有些人比麻省理工学院的学生和我更难预测?是那些一连好几周全国各地四处跑的卡车司机?抑或是那些开着小面包车载着孩子在钢琴课和剑术课之间跑来跑去的“足球妈妈”?还是我们的那位“行迹可疑”又惹祸上身的超级旅游者哈桑·伊拉希?这些人跟你我有什么差别?我们周围真的有靠掷骰子做决议致使于我们永远无法预知他们行迹的哈里昆人吗? 你的重复性决议你的熵 假如丹尼尔每个工作日都是上午8点开端工作,中午在同一个餐厅吃午饭,然后在下午6点左右下班,并在家里不时待到第二天早上,那么他未来的行迹对我们而言就没什么秘密可言了。用物理学或信息科学的术语来说,丹尼尔的熵就是零。换句话说,他的行迹是完整能被预测的。相反,应用随机数生成器做决议的哈里昆人的熵就趋于无限大,如此一来他们的行迹就是完整不可知的。 爆发洞察 熵是用来描画一个体系的紊乱水平的(或者是有序度)。奥天时物理学家路德维格·波尔兹曼(Ludwig Boltzmann)将熵S和系统可用状态数Ω经过公式S=logΩ联络了起来。换句话说,假如系统往常的状态很明朗,那么状态数就是1,也就是说Ω=1,那么熵就是0。但是,假如一个系统的状态数是N,那么它有一个无限大的熵,也就是Smax=logN。 假如丹尼尔的日常生活异常规律,那么任何时分他的行迹都是明朗的。所以,对他来说就是S=0。但是,对哈里昆人来说,他们某个时间可能会在N个不同的中央,那么熵就是logN。波尔兹曼同时期的人以为熵的发现很重要,因而就将它刻在了波尔兹曼的墓碑上。他们是对的,它的确很重要。 假如我想知道你有多好预测,我必须先知道你的熵,而这正是宋朝明(Chaoming Song)试图做的研讨,而且不是针对一个人,而是针对无数个人做的研讨。宋朝明,一个聪明的博士后研讨助理,他是2008年春天参与我的实验室的。他在应用我们的手机数据库剖析百万个用户的数据时很快发现,其实算出每个用户的熵没有说得那么容易。 宋发现最大的艰难在于,大多数时分他并不知道这些用户的细致位置。实践上,只需在我们运用手机时,手机信号塔才干记载我们的位置。但是,我们的手机模型是具有爆发性的,这就意味着当我们连续运用手机时,在短时间内会有关于我们所在范围的很多记载;但信号塔还会有很长一段时间没有任何方位记载,由于我们那个时分没有运用手机。这种杂乱无章的记载使得用户没有想象中好预测。 事实上,由于丹尼尔总是在几个中央(家、办公室以及餐厅)规律地运动着,所以他的行迹才比较好预测。但要是我们只需在他打电话的时分才知道他的行迹,那我们就需求花上很久才会知道他的生活如此规律。假如他偶尔偏离规律的生活轨道,好比散步到左近的公园去吃午饭,或者早早下班去跟朋友一同下馆子吃大餐,那么依据我们控制的散乱的数据,他的行迹看上去的确是随机的。从某种水平上讲,我感到自由多了,由于那表明我们的生活被无数个爆发点掩盖着,想要追踪每个人的行迹变得很难,而想要做出预测就更难了。不外,我马上认识到爆发并不能使我们躲过一切的雷达网。 宋朝明从我们日常活动的一个重要特性上得到了意外的灵感——重复[1]。假如我们去国外旅游,那我们的朋友肯定会很快乐定期收到我们在做什么以及我们在哪儿的状态更新。但是,假如是在工作日中,每小时给研讨员打个电话核对他们的进度是一个十分惹人厌的举措。事实上,我们的工作在某段时间会毫无停顿,这样我只能重复同一个答案:我还在工作、工作中、还是在工作、依旧在工作。我知道,敬爱的——你总是在工作。 爆发洞察 宋朝明恰恰能从这种重复性中获益,由于它能帮他完成一开端时那个毫无头绪的工作:揭开电话模型爆发的不肯定面纱。也就是说,依托我们做事时习气上的重复性,朝明巧妙地设计了一个能精确预测每个用户的熵的程序。基于此,我们最终能够为那个不时搅扰我们的问题给出一个定量的答案了:我们到底有多好预测? 每个人都有一个最大可预测性 1927年,年轻的德国物理学家维尔纳·海森堡(Werner Heisenberg)发现了一个不等式,也就是有名的“不肯定性原理”(uncertainty principle)。这个原理指出,在不肯定的状况下你对一个物体的方位知道得越多,就越不能肯定它会去哪儿。也就是说,假如我们费尽心机肯定一个粒子的精确位置,那么我们就不可能得出它的速度;但假如我们测出了它的速度,那我们肯定不肯定它的位置。 海森堡的预测之所以违背直觉,是由于它对我们的研讨质量没有什么辅佐——它指出即便是最好的实验也不能同时肯定一个粒子的位置和速度。但正是这一点才显现出它的重要性,从电子到人类,这个定律适用于一切事物。实践上,关于一辆正在行驶的自行车或是疾驰的汽车来说,可预测的不肯定性太小致使于大家都没留意到。但事实就是如此。(我自己曾在一辆自行车和一辆疾驰的汽车之间弄伤了伎俩,但海森堡不需求为此担任。) 依据海森堡的“不肯定性原理”,我在想人类的可预测性是不是也存在基本的限制。为什么我不能预测你们未来的行为呢?是不是我运用的工具有一定限制?还是我控制的数据质量不够好?再或许是我曾经抵达了极限却不自知?假如这个极限真的存在,那么就算我们优化了工具,完善了数据质量,未来对我们来说依旧是个谜。另外,假如真的存在某种极限,那么发现它的确切实质就变得很重要,由于它可能提示了我们的绝对可预测性,经过它我们就能预知未来。 尼克·布鲁姆(Nick Blumm)是我实验室里的一名研讨生,他证明了这个极限的确存在,而且我们都会受它影响。在我看来,这一点颇具讽刺意味,由于发现这一点的人生活中充溢了意想不到的转变。在以优秀的成果取得物理学学士学位后,尼克在学术界曾经争得了一席之地。但他并没有循序渐进地生活,而是决议做些改动。他曾去东京当英文教员,跟随默剧巨匠马塞尔·马索(Marcel Marceau)学习哑剧并取得了很好的成果,去曼哈顿辅导富人的孩子,然后又去了布鲁克林儿童博物馆(Children’s Museum in Brooklyn)做了自然科学馆的馆长。过了近十年随心所欲的生活后,他看了我写的《链接》那本书后,才找到自己想要追求的东西。之后,他就回到学校攻读网络学博士学位。照这样看,尼克最有权益问这个问题:有谁能解释他那条反传统的生活轨迹?他自己?有可能,但不肯定。确切地说,他证明了不论我们的预测系统多么精密,我们对熵是S的手机用户的预测还是会偶尔呈现差错。 假如丹尼尔的熵是0,理论上讲我们能够100%精确地预测出他的所在。但是,大多数人的熵都不是0。这就意味着他们的行动会有一定的随机性——他们会偶尔做出我们始料不迭的转变。所以,每个人都有一个最大可预测性,致使于不论我们怎样努力都不能绝对肯定他的细致位置。 当宋朝明忙于测算每个手机用户的熵时,我们曾经发现人类的活动遵照幂律规律了。也就是说,大部分人都不怎样出远门,只需少部分异类会定期中止长途旅游。因而,每个人的预测水平存在很大不同这一点并不是讲不通的。假如一个人的生活局限在一个小圈子里,那么我们很容易就能找到他。但关于像哈桑那样定期去几千公里外的中央旅游的人,我们知道要想找到他们就很难了。 爆发洞察 不外,我们这次的直觉错了——预测性并不遵照我们熟习的幂律规律。也就是说,不论我们多么努力地搜索,数据库中都找不到异常值。相反,我们发现一切用户的平均可预测水平都在93%左右。这就意味着人们只需7%的时间是行迹不定的。这些不肯定事情常常发作在两个人们最常去的中央之间——好比说在高峰期乘车上下班的时分,或者午饭计划有变动的时分。在剩下的时间里,大部分用户的行迹都相对容易预测。 对一些熵值低的用户来说,他们的可预测水平以至接近100%。这并没有什么奇特——它只能阐明我们中有些人的生活十分规律而已。真正令人意想不到的是,我们的案例中基本没有预测水平低于80%的人。不论他们的生活圈子有多大,搭乘什么样的交通工具,每个人都是习气的奴隶,这使得他们的行迹变得极易预测。 我们的手机用户中没有哈里昆人,这不由令我们困惑起来:那些随心所欲、翻云覆雨的人都去哪儿了?他们到底藏在哪里? 在进一步讨论之前,我想阐明的是“我们做了什么”和“我们的可预测水平有多高”之间存在实质的差别。当触及“我们做了什么”这个问题——好比说我们的旅游距离,发邮件以及打电话的数量时,我们遵照幂律规律。也就是说,总有一些人比其他人更生动,他们会发更多邮件,会去很远的中央旅游。这也阐明异类很平常——总有一些哈桑那样的人,他们会定期去几百以至上千公里外的中央旅游。 但一旦触及人类行为的可预测度的问题,幂律规律令人吃惊地被高斯散布取代了。这意味着,不论你把自己禁锢在方圆2公里的社区内,还是每天驱车去数十公里外的中央,又或者是乘快车以至是坐飞机上下班,你都和他人一样好预测。一旦高斯散布呈现,异常值就不存在了,正如爆发在泊松的随机世界中不存在,或者不可能在街上看到一个3000米的伟人一样。固然人与人之间有很多不同,但我们的可预测水平都差未几,无情的统计规律使得异类基本不存在。 但固然统计规律百般阻挠、万般遏制,还是有人能够不受限制。这个人就是我们的朋友哈桑·伊拉希。 谁是异类 底特律被扣事情发作5年后,也就是他的追踪无常项目实施一年后,哈桑再次飞回美国。这次他乘坐的是伊比利亚航空公司的6251次航班,目的地是纽约的肯尼迪机场。最近,他过得十分自由,由于在满世界转悠的时分他简直没再遭到移民局的骚扰。但这次下飞机的时分,那种似曾相识的觉得又回来了——他又被带到一个特殊的房距离离了起来,对方请求他在那里等候。 “我就在那儿不时等,不时等,不时等,”他回想道,“有人进来问了一些问题后就走了,然后过了五分钟又有人进来问了一些其他问题后又走了。他们都是传话的人。我不时没能跟担任人说上话。” 最后,他听见一个探员对房间里的另一个人喊道:“嘿,坐伊比利亚航班来的那个家伙还在吗?”哈桑异常懊恼,他当然还在啊。然后他被带到了一间问讯室,这才弄清了事情的缘由。 并不是有人想通知他发作了什么事。这种失密程序——问问题,不泄密,往常对哈桑来说曾经再熟习不外了。但是依照哈桑的话说,疆土保险部是“一个十分大意的机构”,所以即便他不想听也不想看也没辙。 好比说,他们在问讯室里落下了一张纸,刚好就放在他眼前。上面有一个被拒绝入境乘客的名单,而它明显对哈桑很不利。一定是有人大意大意地将这张纸留在了这儿,恰恰让哈桑发现那上面记了三个恐惧分子嫌疑人的名字。 那三个都是穆斯林的名字,一个来自巴基斯坦,一个来自沙特阿拉伯,剩下那个来自美国。而那个美国人正好是他自己——哈桑·伊拉希。 所以,哈桑最终弄清了自己被拘留的缘由。其中那个巴基斯坦人曾经因“特务罪”被拘留了。另外那个来自沙特阿拉伯的人被狐疑是“军火走私者”。而哈桑——好吧,看到他名字后面写的被拘留的缘由,他感到很困惑。 上面并未提到他那个“私藏弹药”的贮藏库。 也没提他那个颇具讽刺意味的监视行动——追踪无常项目。 那张纸上写着:“9·11后形迹可疑”。 “那么,到底是什么让他们觉得我‘形迹可疑’?”想到文件上写的内容,哈桑忍不住夸大地说道:“说句题外话,关塔那摩监狱的一名叫克里夫·斯坦福·史密斯(Clive StaffordSmith)的律师说,他们发现了一份某人对自己为什么会被关进关塔那摩的缘由的讲演。那个人在讲演中说缘由是‘他下出租车的时分举止可疑’。” 哈桑说着说着就进步了音量。“一个人下车的方式有多少种?怎样分辨哪些举止‘可疑’,哪些‘不可疑’呢?话又说回来,什么是‘可疑’的举止,什么又是‘不可疑’的举止呢?” 哈桑想不明白。但我不能稀里懵懂就扔下这件事,由于它产生了一种很重要的可能性:“可疑”是不是等于“不可预测”? 哈桑不在我们的手机用户数据库中,就算在我们也不知道,由于数据都是匿名的。不外由于他曾经认真追踪自己的行迹好几年了,所以我们不需求知道他的电话记载。他发给我们一个文件,里面包含2007年2月到2007年12月间他自己的一举一动。在这10个月里,他去了1040个不同的中央,足迹遍布美国和欧洲。看起来他似乎去了很多中央,但实践上并不是。据我那支巨型GPS手表显现,在2007年的两个月时间里,我也去了515个不同的中央。[2] 爆发洞察 从某些方面看,固然哈桑和我在运动上存在相似的中央,但我们俩其实十分不同。事实上,固然我的生活不像麻省理工学院的学生们那么规律,但依据我80%的可预测水平,要想知道我的方位并不难。但是,当瞿泽辉应用预测系统剖析哈桑的数据时,他遭遇了一次惨不忍睹的失败——他试了4000多次,但只需3次能正确预见哈桑的位置。即便运用往世界地图上扔飞镖的措施来决议他的位置都比这精确度高。实践上,哈桑就是一个哈里昆人,是完整不可预测的。 我坦率地将这一发现通知了哈桑,跟他说据我们的研讨,他的行为完整是随意的,他的可预测水平是0。 “不可能是0吧,对错误?”他笑了笑,然后紧接着说,“我是说,有些中央我会经常去啊。” 的确,新泽西州的某个中央哈桑一共去了131次。随后我们发现当时他的家就在那边。但就算是这样,要预测他还是没那么容易。能够比较一下,在我乖乖戴着那款GPS手表整整两个月的时间里,我被追踪到在家的时间有880次。我和哈桑的区别简单来说就是:我每晚都会在家睡觉,但哈桑在开往欧洲的火车上睡觉或睡在机场的时间跟他睡在自家床上的时间简直差未几。他的确时不时回家,但并没有什么可辨认的模型。 在哈桑看来,他的不可预测性并没什么特别让人感到诧异的中央。固然他没有明白地这么说,但我感到他以为我们的剖析有点让人难以了解。[3]他能随意对自己的每一步行动做出解释,所以他确信自己的行为是完整正常的。 “这是我的工作,”他说,“四处奔忙就是我的工作。” 爆发洞察 我并不这么以为。并不是说我狐疑他的话,真正的问题是假如我们的可预测水平跟旅游距离一样契合幂律规律,那么其中就会有很多异类,但假如不契合幂律规律,那异类就不存在。他们不可能呈现,所以我们同样都是可预测的。但不论我们怎样剖析那些数据,一旦触及他的可预测水平和生活方式,哈桑显然就是个异类。由于异类在这种状况下并不存在,所以正如疆土保险部狐疑的那样,他就是很不正常。 四处都是电子踪迹 回到年轻时期,很好,而且会显得很时兴。年轻人这个群体会更自由豪迈吗?哈桑和我之间的不同,能不能归结为我们有五岁的年龄差距?但是,我们马上认识到不是这样的。 我们搜集了一些14岁到16岁的年轻人的资料,这样一来我们便能随意比较不同年龄段的人的可预测水平了。结果是明白的:不论是年轻人、中年人,还是老年人,一切人的可预测水平都差未几。其中只需一个现象值得留意:与女人相比,男人的可预测水平要低一些。 我们经常会夸大自己和他人的不同,总以为自己的生活与周围的人相比要更规律或更不规律。但是,事实上,不论你是艺术家、摇滚乐手、会计,还是大公司的CEO,一旦将你的日常生活量化,你的可预测水平和你的邻居相差无几。由于我们的可预测性,我们又回到了熟习的泊松和高斯世界,在那里每个人都相似,一切事都很“正常”。你可能每天会到几百公里外的中央活动,而我的生活圈可能只需3公里,但你我一样都是习气的奴隶。那种永不中止的自由豪迈只不外是个幻象。相反,我们的行迹都深受规律影响,而它的影响力比我们想象中要大得多。 我们会随身携带手机,会用信誉卡,会经常被监视器拍下来,总之我们所到之处都留下了电子指纹。哈里昆人知道这种电子追踪的风险性,所以痛快用随机数生成器去避免习气性的行为。但在虚拟世界之外,我还从没遇到过一个用随机数生成器做决议的人:我们一会儿在哪儿见呢——去星巴克喝咖啡,还是一同飞到东京去?让我们掷骰子决议吧!随着追踪设备的增加,再加上我们生活方式中根深蒂固的规律性,人们对隐私的关注也日益增强。我不由也心生顾忌。嗯,我们真的要经过掷骰子做决议了吗? 要想预知未来,必先了解过去 固然数据显现我的可预测水平很高,但熵值低并不会禁锢我的未来——只需当你知道我的过往历史的时分,你才干做出预测。另外,假如我的熵值很高,我的过去并不能阐明未来会怎样样;假如我的熵值很低,我的行为会很容易被预见,但这只是在你了解我过往行迹的状况下才干完成。这反映了一个很粗浅俗套的道理:要想预知未来,必先了解过去。 但是,揭开过去的面纱并不如想象中那么容易。好比说,乔治·多热·塞克勒以及他终身的阅历——怎样能肯定之前我们忆起的那些关键事情真的发作过,而且是完整依照我们的描画发作的呢?当熵值很低的时分,我们就会对某件事特别的确定。 我来解释一下吧。乔治·塞克勒在贝尔格莱德的决斗是当时的著名事情,所以它的真实性简直不存在什么争议。但他和他的部下在贝尔格莱德和内格雷克之间发作了什么事则存在很大的争议。固然我们能够肯定主教在圣坛发起了十字军东征战役,但他是不是当即就决议让乔治·塞克勒来统领千军了呢?往常,大部分历史学家都以为乔治·塞克勒只不外是在布达被任命的众多将领中的一个,绝不可能是总司令。事实上,假如主教真的在布达正式任命了某人,在那样一个重要的时辰肯定会有书面记载留给后人。但没有任何那个时期的记载留存——我们只是在多年后的历史记载中得知了主教的选择。 由于明显缺乏证据,后代的历史学家以为是在十字军转变成起义军后,乔治·多热·塞克勒才第一次出面充任首领。假如这是事实,他可能历来就没想带兵去攻打奥斯曼土耳其。他指导的那支十字军可能自始至终只瞄准一个靶子:贵族。 那为什么后来的史官会坚持以为是主教亲身任命乔治·塞克勒为首领呢?嗯,或许是由于事情过去了那么多年,当时的很多细节都已被人遗忘,所以有些人觉得将塞克勒的权益看做直接来自教皇的崇高权益比较省事吧。 乔治·塞克勒和萨基主教在国王恩赐的黄金上发作的争论也是中世纪史官广为附和的故事。但那或许只是人们为这位不受欢送的主教的被杀所找的一个好意的托词呢?所以,固然难以了解,但一些被历史学家和读者视为理所当然的严重事情可能基本就没发作过。基于人类过去的不可知性,未来的不肯定性也就缺乏为奇了。 爆发洞察 我们不需求一路追溯到16世纪去弄清一件事的真实状况。要记住,固然熵值低意味着可预测性高,但要想预知你未来在什么位置,我们必须知道你过去的行迹。固然电话记载颇具洞察力,但要想抵达预知未来的目的只依托它们是远远不够的。要想预测你未来的所在,我必须知道过去几个月里你每个小时都在哪里。除非你运用手机的频率极高(很少有人会这样),不然你大多数时分的方位依旧是个谜。 所以,不论我们是在研讨今天的事情还是16世纪的事情,我们最终面对的问题都一样:假如过去对我们来说是未知的,未来也就难以预测。但是,假如我们的过去忽然变得明晰起来会怎样样?那么不论是人类的未来还是社会的未来都将不再是个谜团。所以,为了能够看到未来,我们必须及时回到过去。 这正是我们接下来要做的事情,再次回到16世纪深化调查乔治·塞克勒为围攻泰密斯瓦所付出的努力。 特兰西瓦尼亚牵制战 地点:特兰西瓦尼亚的科罗日瓦 时间:1514年7月初,夏至 科罗日瓦在1514年时还不是特兰西瓦尼亚的首府,但由于这个中央土地肥美、商贾云集、市场繁荣、铸造冶炼业兴隆,所以它变成这个国度最富有的城市也指日可待。科罗日瓦曾经是罗马的殖民地,在公元895年被匈牙利收复,然后在1241年遭到了鞑靼人的屠城。匈牙利前国王斯蒂芬五世(Stephen Ⅴ)命令撒克逊人接手了这座弃城,但它的日益繁荣马上吸收了很多匈牙利人重新回到这里定居。至15世纪中期,全城4000居民中半数都是匈牙利人,所以为了维护战争,该城的总督在1458年制定了一城两制的政策:城市的有效指导者,也就是士师,每年将由匈牙利人和撒克逊人轮番担任。 繁荣的经济加上作为皇室自治区而享有的税项优惠使得它有大量财力能够投入到防御工事上去。所以科罗日瓦城外环绕着2.25公里的高墙,上面设有18个塔楼,每个塔楼都有重兵扼守。城墙周围的拱形吊桥衔接着大门,每扇门都有铁闸维护,这也是一切防御工事的最单薄之处。 这座城的宁静和繁荣最终在1514年被突破。夏至刚过,昼渐长天渐暖。科罗日瓦城城门紧锁,吊桥也被升起,守城官兵佩戴石弩和火绳枪在城楼上放哨。与此同时,不安的士师正在市政厅和议会大臣一同商议大事。一支人数众多的十字军往常就驻扎在城外请求进城。这座城市的未来和城内居民的死活都取决于大臣们的反响。 假如大臣们对这座城的防御才干有自信心,那么他们无论如何都会紧锁大门。但是,他们知道城内的士兵再怎样锻炼有素,也不是城外洛林茨教友带领的十字军的对手。名声在外的洛林茨具有过人的胆识和决策力,这在他攻克匈牙利众多守卫森严的防御重镇时曾经众目睽睽。另外,城内的穷人都支持十字军——或者说是反动者,这取决于你从哪个角度看他们。所以,假如围攻开端,城内守兵很可能会遭遇城内的叛乱者。 但是,翻开城门放弃抵御也绝不是好措施。那不只意味着城内富有的大臣和市民要放弃位置和财富,将它们拱手让给农民,还意味着他们会被国王和总督视为十字军的共犯。 马提亚王在1467年停息了一场特兰西瓦尼亚的叛乱后回到他的家乡科罗日瓦时的一幕幕,城内一切人至今仍浮光剪影。马提亚王大笔一挥废弃了这座出了叛贼的城市的皇室自治权,当众斩杀了三个贵族,并将一切叛军逐一治罪。最后,这些叛变者都被烧红的铁钳撕成了碎片。 几年后,科罗日瓦才重新取得了贸易权益。所以当再次面临悍兵围城时,科罗日瓦的富有大臣们既惧怕丢了小命,又惧怕失去君主的信任。但是,他们没什么选择了,由于他们的维护者、特兰西瓦尼亚的总督往常下落不明。他们不得不靠自己的力气抵御洛林茨的大军。那位总督到底在哪儿?他计划如何应对这场突如其来的反动呢? 1505年,国民议会下令假如乌拉兹洛王死后没有继承人,只需匈牙利人有资历登上王位。这很奇特,由于当时的国王和女王都是从权力强大的皇室成员当选择的,民族并不能作为参选的有利条件——往常人们心目中的民族观念在当时并不存在。 当时的国王乌拉兹洛是波兰国王和一位匈牙利公主的后人。由于抵触和纷争,乌拉兹洛王并没有一并统治波西米亚和匈牙利。[4]相反,他头戴的双层皇冠被以为是力气的意味,代表着促进捷克和匈牙利联盟的利益。 国民议会之所以希冀匈牙利人当选国王,是由于他们想看到当时只需18岁的约翰·萨普雅登上王位。一年后,乌拉兹洛王的儿子的出生不只引发了塞克勒人和国王那群凶神恶煞的心腹的血战,更让萨普雅失去了称王的机遇。但是,这位比国王还富有并手握兵权的年轻伯爵并没有老诚实实地退居幕后。在贵族的施压下,乌拉兹洛王被迫任命萨普雅为特兰西瓦尼亚的总督。这个显赫的职位成了萨普雅继续觊觎王位宝座的有利据点。 1514年,当贵族武装一个接一个臣服在乔治·多热·塞克勒的脚下后,人们越来越分明地认识到只需一个人能跟十字军抗衡:特兰西瓦尼亚的总督约翰·萨普雅。所以他迟迟未现身着实令人感到奇特。有人狐疑他一边带领自己的十字军在奥斯曼土耳其边疆打仗,一边坐观成败——事实上,固然匈牙利沦陷了,但特兰西瓦尼亚还是一片平和现象。那儿没有招募新兵,没有十字军营地,更没有血腥的战争。[5] 另外,匈牙利的凄惨境遇对萨普雅来说并不是什么坏音讯。他从一开端就反对十字军东征,往常他更是心称心足地张望,由于随着时间一天天过去,越来越多的政治劲敌会在紊乱中屈从。他的宿敌巴赛瑞遭到了攻击,被困在泰密斯瓦城内,而且还负债累累。乔纳德和泰密斯瓦左近被十字军占领的大部分土地都是乔治·布兰登伯格(Gyrgy Branderburg)的领地。这位曾收到过吟游诗人陶利努斯呈献的史诗的边疆伯爵不时鼎力支持哈布斯伯格(Habsburg)继任王位,所以他不可能赢得萨普雅的同情。 但是在军营中,这位总督的缺席令很多人感到难以了解,而且谣言曾经如瘟疫般传遍整个军营。普遍的观念是他们的首领乔治·塞克勒曾经和总督定下了不开战的协议。事实上,由于萨普雅长期以来都支持削减贵族,所以很多人都以为总督也站在他们那边。 但当十字军挺进特兰西瓦尼亚边疆的时分,现状就被突破了。洛林茨教友和他的军队首先到了特兰西瓦尼亚的门户和主要防御重镇奥拉迪亚。在1474年遭到土耳其人的围攻后,这座碉堡曾经被重建并用高墙大瓦加固,而且作为主教的城堡,这里不时由威猛的皇军扼守。难怪当这座以牢不可破著称的不倒之城被洛林茨攻下后,音讯竟很快传到了远在千里之外的意大利和布拉格。 为了维护无畏首领的威名,洛林茨处死了守城官兵并扣押了城内的贵族。但他并没有在奥拉迪亚闲着。他留下一个小分队,又从当地招募了几千战士,然后带领他们一同进入特兰西瓦尼亚,向宝城科罗日瓦[6]挺进。 听到洛林茨向科罗日瓦进发的音讯时,萨普雅曾经穿越了南喀尔巴阡山脉,正在回特兰西瓦尼亚的路上。所以6月7日,他立刻在德瓦堡(Déva)写了一封信请求整个特兰西瓦尼亚的贵族分离抗敌。第二天,他认识到形势紧急,所以就改了命令,请求一切贵族全部武装最迟在7月25日赶到奥拉迪亚,而且每个骑士也要全部配备并带领旗下1/10的农民应战——这是一个不寻常的命令,表明总督认识到了形势的严峻。 萨普雅先最后期限一周就抵达了奥拉迪亚并在那里表明了自己的立场:任何称自己为十字军或想成为十字军的都要被抓起来,“砍头,剥皮,或被烧死、被杀死,遭受酷刑折磨至死”。 科罗日瓦的士师认识到萨普雅不会来救援,而且单靠自己肯定挡不住城外的十字军,所以他想出了一个万全之计——允许洛林茨的请求翻开城门,但只需军官和随从能够进城,剩下的士兵只能驻扎在城堡左近。洛林茨也以为这是折中之法,以免还要长期围城。 城内大臣乖乖协作,作为交流,十字军不会进城抢掠,而被他们关押的一众贵族也将一并带进城交由士师监禁。这是士师在为未来押宝,他希望国王和总督能看在他维护了这么多显贵的份上,对他的投诚举措网开一面。 但他不知道,科罗日瓦的沦陷正中乔治·塞克勒之意,而且也打乱了萨普雅的计划。 作为特兰西瓦尼亚的统治者,萨普雅认识到他有义务去解放这座宝城。但是,他也敏锐地认识到这么做固然能够让他夺回特兰西瓦尼亚的统治权,但他却可能输掉整个战争。既然他异常盼望登上匈牙利的王位宝座,那他就不会眼睁睁地看着匈牙利遭受灾难而毫不作为。而且,笑到最后才笑得最好,最后的胜利才干保障未来的国王宝座归自己。而要想取得最后的胜利,他必须先放弃特兰西瓦尼亚,把它让给洛林茨教友,然后带军去泰密斯瓦攻打乔治·多热·塞克勒的十字军。 当总督抵达奥拉迪亚之时,他曾经想出了一个计划。他命令克伦斯塔(Kronstadt)[7]的撒克逊人不要跟其他贵族一同来奥拉迪亚,而是把他们交给塞克勒人的首领安德拉什·拉沙尔指挥。这个拉沙尔正是7年前莱纳德·巴拉巴西写信托付乔治·多热命运的人。依照传统团结在一同的塞克勒人和撒克逊人,再加上周围村子过来辅佐的罗马尼亚人,就这样一同被派往科罗日瓦挽救困在里面的匈牙利人和撒克逊人。 萨普雅自己并未指导这支自由之师,而是将之交由副总督莱纳德·巴拉巴西指挥。这位年轻的总督眼里有更大的猎物,他带领特兰西瓦尼亚的贵族骑兵一路前往泰密斯瓦,决跟乔治·多热·塞克勒正面对阵。 这个战术当然存在风险,由于萨普雅分散了自己的武装力气。这是一次冒险赌博,他有可能像巴赛瑞、贝贝克、萨基以及其他很多低估了十字军战役力和决策力的人一样遭受失败。但这位27岁的总督甘愿冒这个险。 ** * [1]阐明重复问题的最好措施就是,应用克劳德·香农(Claude Shannon)在1948年发表的那篇里程碑式的论文——奠定了信息理论基础的文献中提出的一个例证。依据熵的概念,他指出英语有50%的重复性,也就是说“hlf of th ltrs o ths txt ca be dletdand w cold stll dcipr is mnig”这段话中有一半字母能够删掉,而且我们仍能了解它的意义。不具重复性的言语指的是组成一个单词的每个字母都有意义,所以漏掉或打错其中一个字母,那个单词的意义就会完整改动,好比说walking (走)和waking(醒),或goddess(女神)和godless(无神论的)。实践中,THE在英语中有明白的意义,但THE、EHT、TEH或者ETH却没有,所以不论我们怎样拼错这个单词,它都能被了解。这就是想出一个好字谜的难点所在——假如我们在表格上横向写几个单词,那么通常纵向的字母组合就无法成为单词。——作者 [2]瞿泽辉将地图以两平方公里为单位分割开来,每两平方公里都被视为一个单独的区域。——作者注 [3]“从4月中旬到往常,我不时在休罗格斯大学(Rutgers)的公假。”他通知我:“所以我的工作日不那么规律。就算去学校工作,我基本上也是坐飞机去上课,上完课后就分开。所以,这是正常的。”他想了一会儿又说道:“由于那一年我其实不时在四处跑。”——作者注 [4]当时的王国在往常大致包含匈牙利、捷克共和国、斯洛伐克以及部分塞尔维亚和斯洛文尼亚的领土。这些中央加起来共称为特兰西瓦尼亚,也就是今天的罗马尼亚。——作者注 [5]事实上,哪怕是为了取悦皇室,萨普雅也会同意在特兰西瓦尼亚发布教皇诏书。但怂恿农民从军的任务落在了阿尔巴尤利亚主教身上。比起战争或政治,这位主教更热衷于艺术和科学,所以最终他的身边并没有多少士兵,而是成天被一群著名的人文学者包抄着。好比说,有受俸牧师伊斯特凡·斯蒂尔拉塞尔,也就是4年后记载1514年战争的陶利努斯;还有执事长约翰·巴拉巴西,也就是莱纳德的侄子以及未来的乔纳德主教。由于急于维持总督对他的信任,这位主教早早就动身去了奥尔福德,但却颇合时宜地在走之前忘了将教皇的诏书交给牧师们。等他回到家时,正好赶上红衣主指正式废弃了十字军,所以他痛快坐享因疏忽大意带来的政治利益,使特兰西瓦尼亚免遭匈牙利的不幸命运。——作者注 [6]宝城科罗日瓦(Kincses Kolozsvár)不久之后就变成了这座城市的圆满昵称。——作者注 [7]克伦斯塔城往常被罗马尼亚人称为布拉索夫(Braov),被匈牙利人称为布拉什(Brassó)。——作者注 (未完待续,关注书虫子,做思想体操) |