首页 » 语言本能:探索人类语言进化的奥秘 » 语言本能:探索人类语言进化的奥秘全文在线阅读

《语言本能:探索人类语言进化的奥秘》语法基因存在的间接证据

关灯直达底部

如果我们只关注大脑上一个个邮票大小的区域,我们恐怕永远都无法理解语言器官和语法基因。心智的计算处理是以错综复杂的神经网络为基础的,这些神经网络构成了我们的大脑皮质。数百万计的神经元分布于这些网络之中,每个神经元都和数千个神经元相连,并以千分之一秒的速度传递着各种信息。如果我们能将显微镜伸进大脑,近距离观察语言区域的神经回路,我们会看到怎样的景象呢?没有人知道答案,但我可以给出一个合理的猜测。具有讽刺意味的是,这是语言本能最为重要的方面,因为它是语言表达和理解能力的真正源头,但同时它也正是我们最不了解的一个方面。接下来,我将要从神经元的视角,为你展现语法信息的处理过程。你不必对其中的细节过于较真,我只想让你明白,语言本能其实与物理世界的因果定律合辙同轨,而不是一种披着生物学外衣的神秘论调。

神经网络模型的设计基于一个简化抽象的神经元。这个神经元能做的事情不多,它有时活跃,有时不活跃。在活跃时,它会沿着轴突(输出线路)向与它相连的其他神经元发出信号,各神经元之间的连接点被称作突触。突触可以分为兴奋性突触和抑制性突触,它们拥有的传递强度也各不相同。位于接收端的神经元会将来自兴奋性突触的所有信号相加,再减去来自抑制性突触的信号,如果差数超过了某个阈值,它就会变得活跃起来。

如果这个简化的神经网络足够庞大,它就可以成为一台计算机,从而计算出任何具体问题的答案。这就像我们在第2章所看到的图灵机一样——通过在纸上来回穿梭,它可以得出“苏格拉底会死”的结论。之所以这样说,是因为我们可以用一些简单的方式将这些模拟神经元连接起来,使之成为一个个的“逻辑门”(logic gate),以执行“与”“或”“非”等逻辑运算。逻辑“与”是指:若A为真,且B也为真,则“A与B”为真。因此,当所有的输入端都打开时,“与门”就会自行打开。假设模拟神经元的阈值为0.5,而两个输入突触的权重分别都小于0.5,但总和却大于0.5(假设分别为0.4),这便是“与门”,如图9-2左图所示。

图9-2 “与”“或”“非”

逻辑“或”是指:若A为真,或B为真,则“A或B”为真。因此,只要有一个输入端打开,“或门”就可以打开。为了实现这一点,每个突触的权重都必须大于这个神经元的阈值,比如说0.6,就像图9-2中间图所示。逻辑“非”是指:若A为假,则“非A”为真,反之亦然。因此,当输入端打开时,“非门”就关闭,当输入端关闭时,“非门”就打开,这一任务由抑制性突触来完成,如图9-2右图所示,这个抑制性突触的负值权重必须大到能关闭神经元的输出。

下面来看一下神经网络是如何计算一个适度复杂的语法规则的。在英语中,“Bill walks”中的屈折后缀“-s”的适用条件为:主语为第三人称、单数,且动词为现在时态,并表示习惯性动作(这就是语言学中的“体”),但动词不能是“do”“have”“say”“be”等不规则动词(例如可以说“Bill is”,但不能说“Bill be’s”)。一个由逻辑门构成的神经网络可以用图9-3的方式解决这一组逻辑关系。

图9-3 神经网络模型

首先,图9-3左下方有一组神经元代表屈折变化的各种特征,其中相关特征通过“与门”和一个代表“第三人称、单数、现在时、习惯体”(简称“三单现习”)的神经元相连。这个神经元会刺激屈折变形“-s”所对应的神经元,进而刺激代表音素[z]的神经元。如果句子使用的是规则动词,所有与后缀“-s”有关的计算就到此为止,例如“hit”的变化就是“hit+s”,“wug”的变化就是“wug+s”。至于词干的发音,则可以依据心理词典中的具体说明,通过相应的连接逐一复制到词干神经元中,只不过我并未在图中把这些连接画出来。但是,如果碰到像“be”这样的不规则动词,整个计算过程就必须被阻断,否则这个神经网络就会产生出“be’s”这样的错误形式,“三单现习”神经元也会向“is”(be的不规则形式)神经元发出信号。如果这个人一定要用动词“be”,那么代表“be”的神经元就会活跃起来,它也会向神经元“is”发出信号。由于和“is”相连的两个输入端是一个“与门”,所以只有当两个输入端同时打开时,“is”才会被激活。这就是说,当且仅当一个人想用“be”,同时又符合“三单现习”的条件时,“is”神经元才会被激活。“is”神经元通过一个“非门”抑制了“-s”变化,阻止了“ises”或“be’s”的产生,同时,它又分别激活了代表元音[i]和辅音[z]的神经元。当然,在描述过程中,我省略了大脑其他部分的许多神经元和神经连接。

这是我搭建的一个神经网络模型,但它是专为英语设计的,而一个真正的大脑必须通过学习才能掌握所需知识。现在让我们继续展开联想,将这个神经网络想象成一个婴儿的大脑,假设其中各组神经元都是与生俱来的。不过和图9-3不同的是,每个神经元向外伸出的箭头不只一个,而是有多个,这些箭头将它与另一组神经元中的任何一个连接起来。也就是说,这个婴儿天生就能“预料”到有与人称、数量、时态和体有关的后缀的存在,以及可能存在的不规则动词,但他并不清楚某一门特定语言的组合、后缀或者不规则动词。然而,通过不断强化箭头指向的某些突触(就像我在图9-3所画的那些箭头),并忽视其他的突触,婴儿就可以学到相应的语法知识。这个学习过程可以描述如下:当婴儿听到某个单词以[z]音作为后缀时,图9-3右下角的[z]音神经元就被激活,同时,当婴儿想到“三单现习”时,图9-3左下角的4个相关神经元也被激活。如果这种刺激不但会向前传导,也会向后传导,而且如果每个突触在被激活时都会得到强化,同时它的输出神经也被激活,那么所有将“第三人称”“单数”“现在时”“习惯体”连接起来的突触都会得到强化,而[z]音神经元也会得到强化。如果这个经验重复多次,婴儿的神经网络就会逐渐发展为成人模式,就像图9-3所画的一样。

让我们把画面再拉近一些。神经元和它们之间的潜在连接到底是如何铺设的呢?这是当今神经科学界的研究热点,而且我们已经对大脑的串联方式有了一些了解,当然,这里指的不是人类的语言区,而是果蝇的眼球、雪貂的丘脑,以及猫和猴子的视觉皮质。在出生时,神经元就已经在脑室的周壁排列妥当(脑室位于大脑半球的中心,是一个充满液体的空腔),它们一个个整装待发,即将奔赴大脑的不同区域。接下来,这些神经元开始沿着由胶质细胞构成的索道向外延伸(脑质细胞是一种支持细胞,它和神经元一起,构成了大脑的主体部分),它们朝着脑壳的方向前进,一直延伸到它们在大脑皮质的栖息地。大脑皮质不同区域的神经元之所以会形成连接,常常是因为目标区域所释放的某种化学物质。一旦“嗅到”这种化学物质的气味,神经元的轴突就会循着气味的方向生长开来,而且气味越浓,它就越往那里去,就像植物的根部会被水分和肥料吸引一样。轴突也对胶质细胞表面的某些特殊分子十分敏感,这些分子可以引导轴突的延伸方向,就像格林童话《糖果屋》(Hansel and Gretel)里面的汉斯和格莱泰跟随面包屑的指引一样。一旦轴突抵达目标区附近,就会生出更为精细的突触连接,因为延伸而来的轴突与目标神经元表面的某些分子可以严丝合缝地对接,就像钥匙和锁头一样。当然,最初的连接常常是非常随意的,因为神经元总是迫不及待地伸出轴突,而这可能会把它导向各种不合适的目标区。这些连接会相继死亡,这可能是因为目标区无法提供必要的化学物质供其存活,也可能是因为当胚胎大脑正式启动之后,这些连接没有得到足够的使用。

请随我继续神经奥秘的探索之旅,我们已经离“语法基因”不远了。对神经元起着引导、连接和保护作用的分子叫蛋白质,蛋白质又受基因的指导。所谓基因,就是染色体内部DNA的碱基序列。启动基因的是“转录因子”和其他调节分子,这些配件依附于DNA碱基序列的某个位置,并解压一个邻近区段,使得这个基因转录为RNA,然后再翻译成蛋白质。一般情况下,这些调节因子本身就是蛋白质,因此生物体的建构过程就是一个错综复杂的连锁反应:DNA制造蛋白质,其中一些蛋白质又与其他DNA相互作用,产生更多的蛋白质。某一蛋白质在制造时间或制造数量上的微小差异,都会对生物体的建构产生重大影响。

可见,单个基因很少对生物体的某一具体部件做出规定。相反,它指导的是蛋白质的释放。这些蛋白质是构成某种复杂配方的原料,能够对各类部件的塑造产生特定的作用,而这些部件同时又受到其他基因的影响。特别是大脑的连接回路,它与负责神经布线的基因有着非常复杂的关系。一个表面分子也许并不是用在某个单一的回路之中,而是为许多回路所共用,每个回路都是依据特定方式组合而成的。举例而言,假设细胞膜上有X、Y、Z三种蛋白质,某个轴突可能会连接到X、Y所在的表面上,而另一个轴突则可能连接到Y、Z所在的表面上。神经学家估计,用来构建大脑和神经系统的基因大约有3万个,这占到人类基因组的绝大部分。

而这一切都源自一个细胞,即受精卵。受精卵中包含了两个染色体的副本,其中一个来自母亲,另一个来自父亲。每个染色体都是在父母的生殖腺中,通过随机拼接的方式,将源自祖父母(外祖父母)的部分染色体组合而成的。

现在我们已经可以给语法基因下一个定义了:语法基因就是DNA的一个区段,它可以在特定的时间、特定的大脑部位为蛋白质的合成指定遗传密码,或者启动蛋白质的转录,从而指导、吸引或者黏合神经元构成一个网络。这个网络与经过学习而不断强化的突触相互配合,成为解决语法问题(例如选择词缀或单词)必不可少的计算工具。

那么语法基因是真实存在的吗?或许它只是一个绕来绕去的说法而已?布莱恩·达菲(Brian Duffy)在1990年创作了一幅漫画。一头直立行走的猪问农夫:“今天的晚餐是什么?不会是我吧?”农夫转头对朋友说道:“这就是那头移植了人类基因的猪。”然而,这个场景是否真的会发生呢?

目前,我们还无法直接验证人类身上的语法基因。但是,与生物学上的许多案例一样,如果某个基因与特定的个体差异(通常为病理差异)形成了对应关系,我们就能很容易地将其识别出来。

我们确切地知道,在精子和卵子中存在着某种物质,它会影响胎儿日后的语言能力,例如口吃、难语症(一种阅读障碍,患者往往无法在心中将音节拆分为音素),特定型语言障碍也具有家族性特点。当然,家族性并不一定代表着遗传性(比如饮食口味和资产财富也同样具有家族性特点),但上述三种病症却很可能与遗传有关,因为我们找不出任何环境因素来合理地解释为什么家族中有的人会患病,而有的人却完全正常。而且,同卵双胞胎的共同发病率要远远高于异卵双胞胎,前者拥有相同的生长环境和完全相同的DNA,后者也拥有相同的生长环境,但只有一半的DNA相同。例如,一对4岁大的同卵双胞胎读错同一个单词的概率要高于异卵双胞胎。此外,如果一个孩子患有特定型语言障碍,他的同卵双胞胎兄弟患上此种疾病的可能性高达80%;但如果是异卵双胞胎,可能性则只有35%。那么,从小就被收养的孩子在语言能力上是否与自己的亲生父母更为相似呢?这是一个有趣的问题,因为他们身上有着父母的DNA,却与父母不在一起生活。我还没有见到有关特定型语言障碍或难语症的收养研究,但根据一项研究结果显示,婴儿出生一年之内的语言能力(如词语量、口头模仿、词语搭配、含混表达以及单词理解等)与其生母的一般认知能力和记忆力有关,而与养父母无关。

英国的K氏家庭接连三代都出现特定型语言障碍,它的某些家族成员只能说出“Carol is cry in the church”这样的病句,或者不知该如何处理“wug”的复数形式。到目前为止,这个家族是最能表明语法障碍具有遗传性的活证据,即语法能力的缺陷与“单基因常染色体显性遗传”有关。这个引起广泛关注的观点是以孟德尔的遗传定律为依据的,我们找不到合理的环境因素来解释为什么家族中的某些成员会患上此种疾病,而同龄的其他成员却不受影响。例如,这个家族中有一对异卵双胞胎,其中一个是患者,另一个却完全正常。而且,这个家族中有53%的人患有此种疾病,而全社会的患病率大约只有3%。当然,从理论上说,你也可以认为是这个家族运气不好,因为他们毕竟不是从总人口中随机抽取出来的,而是因为高发病率才受到遗传学家的关注,但这种辩解显然是吹毛求疵。之所以说这种疾病是由单一基因造成的,是因为如果它涉及几个基因,而且每个基因都对语言能力具有某种程度的影响的话,那么家族成员的语法障碍应该会有轻重、缓急之别,因为他们所继承的有害基因肯定有多有少。但是这个家族的语法障碍表现出“全有或全无”的特点。无论是学校的人还是家里人,大家对谁存在缺陷、谁一切正常有一致的看法。而且在高普尼克的大多数测试中,家族患病成员的分数全都集中在量表的最低端,而正常成员的分数则集中在最高端,二者没有重叠的部分。那为什么说这个基因是位于常染色体(而非X染色体)之上,而且属于显性基因呢?这是因为在这个家族中,男性和女性的发病率是一样的。而且,在所有病例中,患者的父母之中都有一方是正常人。如果这个基因是常染色体隐性基因,那么只有在父母双方都患病的情况下,孩子才会发病。如果它是X染色体隐性基因,那么只有男性才会发病,女性只是携带者。如果它是X染色体显性基因,那么患病的父亲会将它传给女儿,而不会传给儿子,因为儿子的X染色体来自母亲,而女儿则有两条X染色体,一条来自母亲,一条来自父亲。但在这个家族中,有一位父亲虽然患病,但他的一个女儿却是正常的。

但是,与美联社、基尔帕特里克的说法正好相反,这个单一基因并不是负责整个语法回路的运行。我们前面说过,虽然一台复杂的机器需要许多部件才能正常运行,但只要一个部件出现问题,整个机器都可能瘫痪。事实上,也许这个基因根本没有参与语法回路的构建,只不过当它存在缺陷时,会制造出一种特殊的蛋白质,这种蛋白质会对某种化学过程产生阻碍作用,而这种化学过程恰巧是构建语法回路的必要条件。也许这个基因会导致大脑的某个区域过度生长,以至越过自己的领地,挤掉预留给语言的地盘。

不过,这个发现仍然值得关注。在K氏家族中,大部分语言受损的成员在智力上都处于中等水平,而在其他家族中,有些患者的智力还更高一些。高普尼克曾经研究过一个男孩,他的数学成绩在班上数一数二。因此,这种特定型语言障碍表明,在大脑发育过程中,一定存在某种受基因指导的生理活动,它专门负责搭建语言计算的神经回路,当这种生理活动遭到破坏时,就会引起语言障碍。这一生理活动影响的范围很广,不仅包括语音的发音区和听觉区,还牵涉语法处理所必需的神经机制。虽然语言受损的家庭成员在儿时都会出现发音问题,学会说话的时间也比正常人晚,但他们最终能够摆脱语音的问题,但语法问题却会相伴终生。例如,这个家族中的患者虽然常常漏掉后缀“-ed”或“-s”,但这并不是因为他们无法听懂或发出这个音,他们完全可以区分“car”和“card”,也从来不会将“nose”读成“no”。换句话说,他们是将一个单词的固定部分和根据语法而添加的部分区别对待,即便这两个部分拥有相同的发音。

同样有趣的是,这种语言障碍并不会摧毁全部的语法能力,也不会对语法的所有部分产生同等的影响。虽然语言受损的家族成员在变化时态、添加后缀等问题上存在困难,但他们并非不可救药,而只是比家族中的其他人更差一些而已。他们最常出现的毛病主要集中在词法和词形变化上,例如时态、人称和数量,其他方面则很少受到影响。举例而言,患者能够发现动词短语的错误,比如说“The nice girl gives”或“The girl eats a cookie to the boy”,他们也能听懂复杂的句子,并根据句子内容进行表演。我们已经知道基因是如何工作的,因此,如果单个基因与某种特定功能之间不存在对应关系,我们也不会感到奇怪。

到目前为止,我们已经找到了语法基因存在的间接证据,因为有些基因似乎会对处理语法的神经回路产生特定的影响。我们还不知道这个基因位于染色体的哪个位置,也不知道它会对大脑结构产生怎样的影响。不过,研究者已经开始对这个家族进行血液抽样,准备进行专门的遗传分析。此外,有人对另一些特定型语言障碍患者的大脑进行了扫描,结果发现,患者大脑的外侧裂周区缺乏正常人的不对称性。其他一些学者则开始对患者的语法能力和家族史进行更为仔细的检查,其中一些人觉得高普尼克的观点令人振奋,另一些人则将信将疑。他们试图弄清特定型语言障碍的遗传普遍性,以及这种疾病到底会引发哪些不同的症状。不出意外的话,你将在未来几年里看到不少来自神经学和遗传学的有趣发现。