神奇又平凡的语言——《语言本能》读书笔记

引言

关于语言的起源和本质,存在着两个主流的观点——文化创造论和语言本能论。

文化创造论的核心思想是,语言是人类文化的产物,是逐渐演化出来的交流工具,而非生物进化的结果。人类并没有天生的语言能力,语言之所以能学会,是因为人类有强大的一般智能和学习能力。

而在乔姆斯基和本书的作者平克等人的世界观里,语言是人类与生俱来的能力,先天基因搭好了大脑网络的语言框架。乔姆斯基认为,儿童必然拥有某种先天机制,它符合世界上所有语言的语法原则,即所谓的“普遍语法”。平克的观点在《语言本能》一书中,观点非常有趣,论证也非常精彩。

语言本能论

支持语言本能论的证据有学习的不可能性,似乎只有先天基因搭好了框架,只预留出一些参数的自由度,通过后天输入来优化,才有可能学会语言。例子有Gavagai难题。

Gavagai难题的表述是这样的。假设你到了一个新部落,你并不懂他们的语言,这时一只兔子飞奔而过,土著指着兔子大喊“Gavagai”。几乎所有人都能立刻推断出这个词指的是兔子。但为什么Gavagai不是毛茸茸的东西、飞奔的兔子、兔脚?

不知何故,婴儿总是能够排除不计其数的、在逻辑上同样成立的其他选项,直觉般地了解一个单词的正确含义。他们能够通过观察数量有限的某类事件,成功地对未来所有同类事件做出正确的概括,同时将与最初观察结果并不矛盾的无数错误概括排除在外。这是为什么呢?

如果没有大脑对语言的大量预设,是无法靠预料输入来习得语言的。上面这一论证是有弱点的,Gavagai难题揭示的似乎不只是语言学习的不可能性,而是学习本身的不可能性。如果把这作为先天预设的证据,那么我们提前写在大脑的逻辑和本能数量就是非常巨大的,当然事实也可能是这样的。

另外,儿童真的只是凭“直觉”判断出词语的含义的吗?有没有可能,一个年龄尚小的儿童就已经拥有了相当丰富的语言经验呢?

为什么一个三岁儿童能准确地识别物体?因为这个儿童看到的数据足够多!如果把孩子的眼睛看作是生物照相机,那他们每200毫秒就拍一张照,所以到3岁大的时候,一个孩子已经看了上亿张真实世界的图片。深度学习就用了这个思想,用足够大的数据集、配合高容量的模型,在没有明确规则指导的前提下,也能“学会”语义和物体识别。这种思路强调的并不是“先天语法”,而是统计意义上的归纳能力。而且从当前的大模型的语言能力来看,我觉得这一点是完全可能的。(虽然有时候并不合乎逻辑,但大体是通顺的。)

所以另一个观点也可以很好地解释这个学习不可能性这个论据:人类并不需要内置全部语言规则,只需要具备从复杂数据中提取结构的能力。

相比之下,我觉得语言的克里奥尔化现象更能证明语言本能论。

皮钦语(不同种族的劳工为了沟通而发明出的临时用语,缺乏既定的语法)也可以在很短的时间内转化为一种完整、复杂的语言,只要将一群正开始学习母语的孩子放到皮钦语的环境中就行。这种情况往往发生在从小离开父母、并由使用皮钦语的人照顾的孩子中。这些孩子并不满足于简单地重复这种支离破碎、片断式的语言形式,他们往往会注入前所未有的复杂语法,从而创造出一种具有丰富表现力的崭新语言。这种语言被称为“克里奥尔语”。

克里奥尔现象中的儿童并不是从大人的支离破碎的语句中被动地学习语言,而是主动构建语法,而且新语法比原语法更好。深度学习模型需要庞大输入才能学习语言,但孩子们在糟糕输入下仍然填补语法缺口,发展出完整语言系统,这表明语言能力并非靠数据的堆积,而是来自“本能”的强力驱动。仅用归纳能力和文化创造论不能很好地解释。

心语:思维的语言

初高中的时候做一些阅读题,论点是语言未来时态标记影响储蓄行为。英语等“强未来时标记”的语言,必须明确区分现在和未来时态,这种语法结构可能潜意识中将“未来”与“现在”割裂,导致未来事件在心理上显得更遥远,从而降低储蓄意愿。论据是使用无未来时标记语言的国家(如中国),国民储蓄率平均比强未来时标记语言国家高。

所以我以前是觉得语言是对思维有影响的。但是《语言本能》里面平克分析了“爱斯基摩语有关雪的词语更多”这个论断:

爱斯基摩人用来表示“雪”的词语多达几十个。言下之意非常明显:现实世界中的各种基本范畴并非客观存在,它们是文化强行输入的结果。

它违背了常识,但大家却深信不疑,因为每个人都觉得自己似乎在某个地方听到过它,而且它似乎蕴含着某种启示。

与人们的普遍看法相反,爱斯基摩语中有关“雪”的词语并不比英语多。

我又想了一下,之前我看到的观点其实经不起推敲,国家的经济水平等其他因素也可能导致国民储蓄率的参差。语法结构的差异不等同于思维差异。那语言和思维有什么关系呢?

人们很容易高估语言的能力,以为语言决定着我们的思维。实际上,语言不是思维的唯一方式。心智计算理论是认知科学的基础,无论是英语还是其他任何自然语言,都不能用作心智计算的介质。心语,才是思维的语言。

平克认为,语言并不决定思维,也不是思维的唯一方式。书中举了三个思维独立于语言的例子:第一个是婴儿,在未建立起语言系统之前就对数字敏感;第二是猴子,无法掌握语言,自然不能用语言思考,但却能根据叫声或者图像识别某只猴子的身份;第三是关于艺术家和科学家的,他们灵感爆发时,思维不再依靠语言,而是一幅幅“心象”。在日常生活中也能感受到一些,比如写数学题的时候,不是用自然语言思考的,而是用数学符号和图像。

比较有意思的是平克提了一个“在‘语言影响思维’的问题上,唯一引人注目的发现”,他说英文具有虚拟语气,比如 If John were to go to the hospital, he would meet Mary,这种语气可以很好地描述反事实的情形,但是汉语的语法特征使得其使用者无法轻易分辨出想象中的虚假世界。同样的情形用汉语描述是这样的:

相比之下,汉语就缺乏虚拟语气以及其他直接表示反事实的语法结构,因此表达起来颇为曲折,例如:“如果约翰去了医院——但他其实没去——但如果他去了,他就会碰到玛丽。”

我们可以很容易地发现中文也有直接表达类似的意思的句子,比如“如果当时约翰去了医院,他就会碰到玛丽”。或许是对中文的不了解,或许是对自己习惯语言根深蒂固的语法形式的认知限制,平克,一位语言学家,在不经意间流露出了偏见。

但这个反面例子却恰好证明了只用语言呈现出来的内容去判断人的思维是会产生偏差的。思维独立于语言,有自身的“心语”,语言更像是思维优秀的材料来源和理想的输出工具,而非思维本身。

结语

读了《语言本能》,我对每天习以为常的语言有了更多了解。我们只需要张开口,发出一些声响,就可以在彼此头脑间传递准确、可靠的新想法。语言真奇妙!

在人类语言巨浪中,还产生了像ChatGPT和DeepSeek这样的大模型,凭借语言的形状,模仿人类思维的路径。它们不“思考”,却能“说出”;未曾“意识”,却能“表述”(这是GPT自己说的)。这也提醒我们:语言可以生成世界,却不等同于世界;语言可指向思想,却并不等于思想本身。

语言是我们编织世界的方式,也是我们彼此触碰灵魂的桥梁。而理解语言的本能,便是在理解我们自己。