周末和朋友聊天,谈到了 ChatGPT 的一些话题。其中我们讨论的一个点是:中文等语言的语料库是否足够用?或者说,人类在互联网的的信息,不管是什么语言,都足够给人工智能用于回答问题吗?
我对这两个回答的问题都是否定的。我们还有太多的信息,尤其是知识并没有存在于互联网上,甚至还没有数字化。人工智能(目前)还没办法凭空创造出新的知识类信息。过去几十年互联网的突飞猛进让我们有一种一切都已上网的错觉。但实际上如果我们深挖现实,会发现还有相当大比例的知识并没有上网。去年用我自己的经历写了一篇文章,正好借此机会同步到 Substack 里:
加拿大外交官诺曼·赫伯特 1957 年 4 月 4 号在开罗自杀,日本舆论一片哗然。几乎所有日本的文化人都在讨论这件事。诺曼之死的直接原因,是美国治安小委员会对其多年的审查。小委员会认为诺曼是一名共产党员——这在麦卡锡主义盛行的时代,无疑是一种社会性死亡。
加拿大、日本、美国。这三国家因为一个人联系到了一起。
诺曼虽是加拿大人,却在日本出生并长大。他的父母是来到日本的传教士。19 岁诺曼回到加拿大去多伦多大学读书,然后去了剑桥。毕业后因父母还在日本长野,并且他非常希望进行日本史研究,所以向加拿大外交部申请去日本工作。
回到日本后,诺曼完成了他的代表作之一《日本的士兵与农民:征兵的起源(Soldier and Peasant in Japan: The Origins of Conscription)》。里面有一句很出名的话,也是诺曼当时对日本时局的映射:
「要把他人变成奴隶,『自由人』是做不到的。相反,最残忍、最无耻的奴隶,会成为他人自由的最无情、最暴力的剥夺者。」
日美开战后,诺曼作为敌国成员被遣送回国。在莫桑比克停留日美政府交换回国人员的时候,他碰到了以前在哈佛大学做研究时认识的日本人都留重人。都留是精通马克思主义经济学的左翼自由主义知识分子,回日本的时候不敢带着他的那些资料和书信。于是都留拜托诺曼帮忙把这些东西都收好,书就给诺曼了。
战后,诺曼成为了占领军的一员回到了日本。作为一名虔诚的基督徒,也是作为和都留一样左翼自由主义的历史学家,他希望能为日本战后重建作出贡献。他工作极为出色,深受麦克阿瑟的器重。
可也是这时,美国兴起了麦卡锡主义风潮。麦卡锡主义如猎巫一般的寻找共产主义者。诺曼的政治立场自然受到了波及。不论在日本还是美国,他都有非常多的共产主义者朋友。所以 1942 年左右,FBI 便开始监控诺曼。恰巧他拜托都留的书和信,都留只带走了书。信就被美国政府拿走了。这些信也不乏和共产主义者的对话。
1950 年代开始,负责调查共产主义者的美国治安小委员会就开始对诺曼进行指控。1957 年,小委员会再次举行听证会,并且暗示诺曼等人试图阴谋推翻美国政府。正好当年都留重人应哈佛大学之邀去美国讲学,小委员会就要求都留参加听证会。
在军国主义日本呆了好些年的都留重人,根本没意识到美国已经不是他当年认识还在罗斯福新政余晖下的美国。对将到来的冲击毫无准备。他甚至以为自己作为哈佛大学的客人,不应该给大学添麻烦,就去参加听证会吧;小委员会也应该会看在客人的面子上,走个过场。
可等待他的是整整两天的听证会。也是这时,他才发现美国早已拿到了当年的书信。小委员会试图诱导都留指控其中的人是共产党员,当然也包括诺曼。都留努力在不指控任何人的同时,并且保护诺曼。最后只承认了几个已经被小委员会知道的人是共产党员,而且除了「是的」之外几乎什么都不多说。
8 天后,诺曼在埃及自杀。日本舆论界对整件事情进行了长篇报道,并且把诺曼之死的原因指向了都留重人的证词。都留因此承受了非常大的压力。
都留和诺曼的朋友,日本思想家鹤见俊辅为此写了一篇文章,叫《自由主义者的试金石》。鹤见认为,日本舆论界把矛头对准同为受害者的都留重人,是非常不对的。美国治安小委员会本身就没有权利去质询都留重人。鹤见俊辅写到:
「美国有时候是法西斯主义,有时是民主的。这就是为什么要把战争的受害者推到前台的原因:让受害者看起来像肇事者。」
而日本的媒体,恰恰没有意识到这件事情。成为了小委员会的帮凶。
不过鹤见俊辅同样没有对朋友都留重人客气,他也指出了问题:都留的确在努力保护诺曼,却在最后提供了三位共产主义者的名字。这三个人都是美国马克思主义纲领文件的起草者。鹤见认为在都留已经筋疲力尽的情况下,提供这三位已经被小委员会掌握名字的人是可以理解的。他自己肯定不会比都留做得更好。
但鹤见俊辅没有止步于此,他提出了一个非常重要的问题:都留是自由主义者,他努力保护和自己一样立场的诺曼。却没有同样努力去保护和自己立场不同的共产主义者。
鹤见俊辅说这件事情展示出了一个自由主义者的困境:世界上没有国家能说自己代表自由主义。所以现代的自由主义者需要研究自己要和什么样的体制合作。自由主义者可以和资本主义合作,也可以和共产主义合作。但是在不同的社会里,压力是不同的。在美国这样的资本主义社会,自由主义者的压力小,共产主义者的压力大。如果自由主义者不愿意承担和共产主义者合作带来的压力,那他/她就抛弃了自由主义的原理。所以,这是自由主义者的试金石。
七年之后,这篇文章被选为战后日本的代表性论文之一。
六十五年后,我开始研究这段历史。对于研究日本战后思想史,诺曼之死是无法回避的课题。所以我必须找出当年鹤见俊辅的原文来读一读。
我发现自己搁浅了。在互联网上。
鹤见的这篇论文,中文搜不到。可以理解。我不会日语,就继续用英文搜。也没有。
那用日文吧,打不了软件翻译呗。日文倒是好找,一下子就在日本的论文库里找到了,可是没有电子版。我接下来一周时间,在工作之余就在搜这篇文章。一无所获。只好求助场外人员,拜托可达在宾大的图书馆里帮我找找。可达说宾大图书馆的亚洲资料绝对够全,但可惜这篇也是真没有。
这是今年年初的事情了。四月底有一天晚上我睡前,突然想必须找到这篇文章。过了几天终于在一本书里发现有这篇文章。可书只能从日本网站买二手。这倒也不是大问题,代购还不简单吗?代购爽快的接了单,然后和我说:亲,中日之间的个人快递暂时停了,什么时候恢复还不确定哦。
退钱吧。
我突然发现,淘宝竟然还有日本论文代下载服务!于是找了一家,店主和我说查到了有,下班了帮我去图书馆下载。他还和我说,早半个小时下单当天就能好。没事,不差一晚上。美滋滋,我就等着第二天读了。
悲报,店家去了图书馆发现这篇根本不提供。
这种困难有可能难住我,有可能难不住,这次没有。《自由主义者的试金石》不是一篇孤立的论文,而是和其他一些论文同时发表在了《中央公论》的都留证言特集里。《中央公论》是日本出版至今的老牌重要杂志,理论上需要有每一期的存档。果不其然,当年的那期《中央公论》可以在图书馆里找到——只不过还是没有电子版。
并且 1957 年 6 月号的《中央公论》只能通过申请的方式,由图书馆复印后寄给店家。信还是挂号信。店家必须等收到信之后扫描给我,属于各种资料里最复杂的一种。于是从五月十三号到六月五号,我等了二十多天才收到论文的扫描版。
从今年年初到现在,半年过去了,我终于看到了这篇文章。这在互联网的时代似乎是不可思议的。即使日本并不以互联网发达出名,这种重要论文如此费功夫才能读到也似乎令人诧异。
不论是市值万亿美元的搜索引擎,还是各种越来越强大的人工智能,在这篇论文前都手足无措。这是我们共同搁浅的地方。
可这并不是什么令人意外的事情。如果你是做文史工作的,这可能是一种常态。举个例子,我国互联网产业足够发达了,可如果今天让你去试试找当地最有名博物馆的展陈目录估计也同样搁浅。就像是我在北京,想要知道某件国宝此刻是不是在故宫展出,大概率都只能去了才知道。
这样的例子还有很多,不说文史这么细的专业了。就算我今天想出去旅游,离开城市之外很多乡镇景点在网上的资料都不多,可能唯一的照片还是十年前拍的。在疫情年代,知道目的地的防疫政策似乎都不是在网上能直接得到解答的事情。
作为互联网和科技的从业者,我们这两年经常会谈论 Web3、区块链、NFT 什么的。Web3 这个概念就很有意思,它包含了一种暗示:Web、Web 2.0、Web3,这是一条向前的路。上一个时代已经发展完成了,它唯一需要做的就是等下一代技术开创新时代。Web3 时代不需要研究 Web 的东西,那都是上个世纪九十年代玩剩下的。一个技术完成之后,需要的就是下一个技术。
那把一篇论文、把博物馆的展陈目录放在网上算 Web 几呢?
今天的语境下,我们强调技术创新大过技术的扩散。可技术创新和技术扩散原本应该是同样重要的事情。对于「新」的追求成为了我们的信仰,至于技术扩散那最多算下沉市场。五环内玩腻了,再考虑吧。
我有一个朋友,他去非洲建大坝了。走之前他和我说:
「汉洋,你做的东西当然是高科技。我造的大坝在今天对中国人来说算不上啥高新技术。只要我们想,可以造出全世界最好的大坝。可对于非洲人来说,大坝就是比互联网好一万倍的高新技术。因为没有大坝就没有电,没有电就什么都没有。
电力,以及电力所托起的工业,将会从根本上改变这个国家人们的生活方式。他们的孩子,将会知道这个世界表现的形态,知道这个社会运转的原理,知道孟德尔,知道法拉第,知道该如何成为自己生活的主宰。他们将不再浑浑噩噩地生下许多后代,再看着
这些孩子中的大部分在长大成人之前就浑浑噩噩地天折,不知原因,也不去追究原因。他们将迎来一个完全不同的国家,完全不同的自己。」
在现在这个年代,科技很大程度上被窄化成了信息技术。而信息技术里,但凡不是风口的技术都羞于拿出来成为什么好的 idea。可梦想永远是幻想,这个世界不存在一个新技术被发明第二天就能风靡全球的情形。有的,只会是时间。
时间是技术更新的敌人,可我们也只能依靠时间和自己的努力来让新技术变成老技术,再让老技术被所有人都用上。不管是大坝,还是一篇无法被搜索到的论文。