Digital China Worldwide | 汉语新词资料库

汉语新词资料库

Visit Resource's Website

《汉语新词资料库》致力于收集与整理现代汉语新词,特别注重词源研究和历史语料的实际应用。所谓的现代汉语新词,不仅包括汉语自发生成的新名词,也涵盖那些可能源自日语的词彙。这个「可能」显示即使学界已有初步成果,我们依然期待未来能有更多新的发现。日语借词在现代汉语中的角色曲折多变;起初这些借词被忽视,但后来逐渐被视为理所当然。这两种观点都值得商榷。实际上,日语借词对汉语词彙产生了深远的影响,但日语借词背后的传播路径以及其所刺激的思想冲击,并非我们想像的如此当然。不论是对个别词源的研究,或是其整体传播的历程,对日语借词的理解仍需跨学科的整合。日语借词不仅是个语言现象,更为涉及到跨文化的知识交流和概念传播,对于研究过去一世纪东亚现代化的学者来说,掌握概念史至关重要,而日语借词在其过程中起到了关键作用。从 120 年前首次被纳入汉语词彙以来,关于日语借词的研究虽取得了一些成果,但这些成果似乎尚未经过历史事实的考验。目前看来,尚缺乏以具体历史语料来验证日语外来词研究的实例。本资料库旨在促进学术研究与历史语料之间的直接对话和相互验证,以揭示日语借词的真面目。

中国人一直深信自己的语言特别纯净而充满奥秘,毕竟中国自古以来是东亚的政治领袖与道德权威,对周边国家文化有著深远的影响。然而,到了清末,当中国人逐渐觉察到即使是邻近的小国也能对中文造成反向影响时,这种认识似乎对他们的自我认同构成了严峻挑战,引发了苦涩的自嘲情绪。在这样的语境中,新名词往往被当作直观的代罪羔羊。彭文祖在《盲人瞎马》一书中从前言责骂到卷末,表达了对新名词的强烈批判:「吁嗟乎,殊不知新名词之为鬼为崇,害国殃民以啓亡国亡种之兆,至于不可纪极也。」这反映了一种深刻的文化焦虑,认为新词的引入可能预示国家和民族的危机。

实际上,文化或语言上的相互交流不限于词彙,也并非从日语借词开始的。早从佛典翻译和宗教的引入开始,还包括外来统治者对汉语的深刻烙印,还使得至今北方官话和南方方言在发音变化上呈现明显差异。不仅如此,到了明末,西方的思想和词彙随著耶稣会士的到来而传入。然而,汉语词彙的影响自1900年代初以来达到了空前的高峰。

随著留日学生的返国,大量日语借词涌入了中文词彙库。学生带回的现代日语词典,乍看一下似无害,但长期处于沉寂中的中国社会,对新知已产生了极大的好奇心和渴望。每一个新引入的词彙都带来了一个新观念,每一个新观念都加剧了社会现代化的压力,促使社会进行转型并探索新的可能性。可想见,「革命」一词的引入不仅让变革成为可能,更让其成为必然的,「革命」一词在思想层次上的产生了突破,释放出的力量直接影响了中华民国的成立及其后续的一系列发展。

自20世纪初以来, 中文新词的研究持续进行,1903年《新尔雅》的出版标志著这一领域的重要开端。然而,由于当时仍缺乏西方语言学方法以及受到各种政治和社会因素的限制,日语借词研究直到战后才真正开始。

战后,学界对汉语新词的兴趣逐渐增强,学者们开始努力辨识哪些词彙来自日语的,并探索哪些因素可能有助于建立一个实用的分类系统。最初,中国学者的反应受到西方外来词框架的影响,西方理论主要通过一套语音演变原则,识别语音方面的相似程度。这种方法导致早期的现代汉语学者,如王力等人,对日语借词持冷漠甚至否定的态度。此外,由于日本自唐朝以来继承了汉字,部分学者混摇字和词的区别,认为日语借词基本上是中文固有的。这种观点忽视了借词在语义方面有所变化,也低估创造过程的关键作用。

但中国语言学的发展并未因此停滞。特别是在历史词彙学领域上,随著时间推移,越来越多的学者接受了一个观点:由于汉字作为东亚地区的「共同书写语言」(scripta franca)而被广泛使用,词彙的传播往往依靠书写而非口语。因此,仅依赖语音相似性来判断借词的做法已逐渐被质疑,学者们开始重视新的字组合(词形)、逐语素比较(morpheme-based comparisons)以及语义演变,认为这些因素是识别借词的重要标准。此外,现代汉语与古汉语在意义上的差异也已经广为人知,许多所谓的回归词(同形异义词带有新意义)实际上可以被视为新词。

从战后到 2000 年,和制汉语的研究发展出了独特的术语和方法论。其中一个里程碑是 1958 年王立达的借词研究以及1984年出版的《汉语外来词典》,这些作品正式承认和制汉语中日语借词的重要性。该时期的研究建立了一套独特的框架,采取了与西方不同的方法,并针对汉字的特性进行了调整。在这一时期,学术界对日语借词的分类达成了某种共识,大致将其分为三类:回归词(如「经济」),音译词(如「雷达」,音译自英文 ‘radar’),以及意义词(如「蜜月」,意译自英文 ‘honeymoon’)。回归词指的是那些在古汉语文献中已存在但被日本赋予新意义的词,音译词则反映外语发音的新词,以及意译词又称仿译词,是部分或完全地复制原词语素结构的词。

在当代汉语语言学中,日语借词的地位基本上已无争议。然而,由于分类方法尚未统一以及对历史资料的掌握程度不同,对不少个别词彙的看法仍存在争议,特别是在借词的子类型上,例如一些混合型借词,如借词与汉语语素的结合,或是在创造过程中直接模仿日语词的情况。最近,沈国威提出了「激活词」的新概念,指的是那些过去使用率较低但由于日本的影响而开始频繁使用的汉语词。

然而,尽管现代汉语借词研究具有创新之处,也存在一定的内部局限性。主要问题是,这些研究多半局限于中文的范畴内,很少涉及到日语,更不用说其他语言了。某些人似乎以为借词不曾跨越海洋、山脉或草原一样。除了陈力卫以日语发表大部分文章和少数在国外任教的学者之外,大多数借词研究很少涉及所谓的深层词源(deep etymology)。这与西方的词源学形成了鲜明对比,西方词源学不仅跨越多种语言(广度),还努力将单词甚至语素追溯到其印欧语根(深度)。对比之下,如果古汉语时期与罗马时期相类比,那么所构拟的印欧语时期则比夏朝还早几千年了。东西词源学上的差异,可能源于中国的词源学(词本位)和文字学(字本位)之间长期的相互不干涉。这种分隔导致了研究方法和重点各有所偏,在某一种程度上可能也限制了中文词源学的发展。

在此背景下,仍有许多议题待探索,这正是本数据库开发的初衷。此处,我们将简要概述还存在学术争议的地方。其中最关键的是历史词彙学中的所谓「造词者」(authorship)的问题。在一定意思上,造词者问题被忽略是可以理解的,毕竟这个问题几乎仅见于东亚新词的范畴内,而较少涉及到西方借词脉络。核心问题在于,西方的概念及其相关词彙很难直接用汉字记录,必然牵涉到书写系统的转换,进而由于汉字本身带有表义功能,所以使得问题变得更加复杂。

具体来说,即使是采用最直接的借用方式——音译,被音译的新词也必须经历相当程度的语音适应(phonetic adaption),而汉字并不是记录语音的最佳工具。尽管可以勉强使用汉字来纯粹表达音,比如将 ‘Gypsy’ 音译作「吉卜赛人」,但这种方式往往显得有些尴尬。实际上,中文通常避免采用这种翻译方略。此外,自 19 世纪中期以来直到战前,音译常被视为一种不雅的翻译方式(参考严复的「一名之立,旬月踟蹰」的名言),也被看作是承认中国或日本等国缺乏相应的观念和词彙的表现,这种承认似乎象征著一种自卑感,是不可接受且难以忍受的。

由于音译并非首选的借词方法,因此只剩下两种其他借词方法:意译(亦称仿造,calquing),即逐语素地模仿源词的结构;以及概念重构(conceptual remaking),即用定制的语素结构来表达外来概念。这些方法让外来词以更优雅且在文化上更可接受的方式融入东亚语言词彙。对于未受专业训练的华人来说,这些借词往往不引起怀疑,给人一种正常的中文词彙的感觉。

然而,当源词具有特殊或变异的结构时,仿造方法可能会遇到问题。例如,当词源来自较不熟悉的语言,如 ‘kangaroo’(澳洲东北原住民语言一词)或 ‘giraffe’(由未知非洲语言传到阿拉伯语 zarafa,再传至意大利语 giraffa),或来自拉丁文或古希腊文的复杂语素结构(如 ‘metamorphose’ 等),以及当词义透过隐喻发生变化,因而与原始语素结构失去直接联系时,如生物学上的 ‘cell’(细胞),其原意为小房间(拉丁语 cella)。但(生物学上的)‘cell’ 未被仿造为「小室」或「小间」,而是创造了全新概念「细胞」。此外,自然科学术语如化学元素的名称(‘hydrogen’,意为「源自水的」),或现代技术词彙(‘satellite’,来自拉丁文 satelles,「随从」)也带来挑战,主要是因为字面意义与其延伸意义之间常常存在显著差异,使得直译成中文时语义不通。

在这些情况下,便采用了最具挑战性的借词方法——基于外来词义创建新的词形。那些低估意义而强调词形概念的学者,通常不接受概念重构作为有效的借词方法。他们认为,语义借用很难证明,而且两个词之间几乎不可能有完全相同的语义这种情形存在,更何况不同语言之间。虽然这是事实,但当我们研究不同文字系统之间词彙是如何转换的,新词的形成往往是某种有意识的有目的的翻译过程,这一点是无法否认的。借的是意思,自创的是词形,因此,尽管概念重构是所有借词类型中最为勉强的一种,我们仍然认为其可算作借词。

概念重构需要翻译者深度理解目标语言的细微差异和复杂细节,并需进行多次精细调整。从明治维新前后开始,日本通过一项知识产业共同努力,使用汉字创造新词,大量翻译西方的知识,包含现代词彙和概念。正是凭借这些早期日本学者的卓越知识和语言敏感性,才得以创造出约 2000 至 3000 个新词,这些词专为我们的现代时代精心打造的。这不仅是语言上的成就,也搭建了一座文化桥樑,帮助将西方概念以有意义且易于接受的方式融入东亚语言。

尽管应当承认日本学者的重要贡献,但我们也应保持对历史的公正认识,并非所有新词都是日本人亲自创造的。除了前述佛典汉译词外,19 世纪后半期西方传教士创造的另一组重要新词也不可忽视。无论是字典、教科书、文章还是宗教文本,传教士们用中文创造了许多重要的历史文献,这些文献对教育和传教活动至关重要,也自当成为我们今天所关注的宝贵研究材料之一。

虽然当时许多西方文献在中国受到冷遇,甚至无痕迹失传,但其中一些作品被带入日本,成为西方知识翻译成日语的重要参考资料,例如伟烈亚力(Alexander Wylie, 1815-1887 年)早期的科学杂志《六合丛谈》,甚至罗存德(Wilhelm Lobscheid, 1822-1893 年)于 1866 至 1869 年之间所编的《英华字典》,日本人收买出版社全库存,并分发给全国各地的翻译所使用,对日本学术界影响力无可忽略。这种历史情况造就了一种独特的现象:最初由西方人所创造的中文词彙被纳入日语,随后被误以为是日语借词再次回归中文。这一借词路径突显了文化和语言交流的复杂现实,更加深了我们对词源与中国、日本及西方之间历史互动紧密交织的理解。这些所谓的汉语中的日语借词的西方来源已在作者《汉语中的西源和制汉语:学术评析与辞典资料建置》一篇论文中进行了讨论。

鉴于这一历史背景,我们面临的关键问题是,如何区分由西方人创造的中文词与正统的中文新词。在现行的标准框架下,通常将西方人创建的词称为「传教士译词」或类似的名称。我们建议,由于此分类的主要标准是「造词者」,因此可以将其作为评估借词性质的基本尺度。这一概念有助于区分日本人、中国人和西方人创造的借词,其标准客观明确。此外,这也能克服早期研究中常见的尴尬标准,即判断一个词是否具有「汉语特色」。正如我们今天所认识的,一个词即使充分表现出「中文特色」,仍可能是个借词,理由是该词不是由中国人而是由西方或日本人所创造,且在造词过程中已有意让新词符合汉语构词原则。

这种证明造词者的方法,在一定程度上需要证明每个词的来源。因此我们主要是通过其最早书证(earliest record)来区分词的类型:该词是首次出现在由西方作者撰写的中文文本中呢,还是在双语词典,或中国作者的文本,或是在日本资料中呢?通过追溯一个词到其最初的记录,我们可以推断出其造词者的身份,从而将作者、语言与词的创造联织在一起。尽管无法完全逃离理解词义的历史性演变,但使用最早书证提供了一个更客观的基础来评估借词性。

那么,当使用最早书证,来确定造词者身份的方法,书证本身就要承担重要的证明责任,因此评估历史记录的可靠性变得至关重要。具体来说,我们需要评估资料库中某个词目前所最早记录是否真的是该词的最早书证,以及在未来研究中发现更早记录的可能性有多大。虽然无法达到绝对的确定性,但通过分析资料库中从 1600 年至 1920 年间所有词的记录分布,并检查每个词的具体记录分布,我们可以运用核密度估计(Kernel Density Estimation)这一统计方法,来计算特定的可能性。核密度估计常用于时间序列分析,所以可以针对于每个词告提供一种数据告诉我们,对于书证的信赖程度有多高。有些情况,我们发现与学术界不同的最早书证进而判断该词是或不是借词,那么这种判断是否有说服力也要看最早书证的信赖度。

这种方法标志著与过往研究中常见的主观判断借词分类方法的一次转变。在我们的资料库中,我们承认借词的接受历史是复杂的,而且可能会因新发现而受到影响。随著新资料的添加,某些词的分类可能会有所变动,但这也有助于提高分类的整体稳健性。

近年来,在外来词语源研究领域,系统性整理近义词也是一个重要的发展。原则上,近义词可以组织成所谓的近义词词组(synset),其中主要分为两种:共时近义词词组(synchronic synset)包含了意义相似的当代词彙;而历时近义词词组(diachronic synset)则包括了那些较早或具有早期意义的词彙。近义词的历时研究尤其具有研究价值,因为在新术语形成的初期混乱中,尚未对特定词形达成共识,多个近义词可能同时出现,可以端倪出不同构词尝试背后的思想成分。随著时间的推移,逐渐形成共识,某些术语成为主流,而其他则逐步淘汰。这一词彙发展过程在不同术语间的持续时间各不相同,有些可能需要几代人时间才能达成共识,而有些则在几年内确立其地位。在这方面,黄河清所编纂的《近现代汉语辞源》一书对历史近义词词组的研究提供了重要贡献。

本资料库涵盖了共时及历时近义词词组二种,除此外我们也建立了自己的历时近义词词组。虽然从一开始就预计将近义词词组纳入资料库,但建立自有的历时近义词词组并非初衷。源于我们资源中包含了众多双语词典,因此这一结果也是自然形成的,所以资料库也有了一套较为罕见的历时多语近义词词组,捕捉了不同语言和时期概念的演化与相互连结。

本资料库收录了来自台湾教育部网上资源的约60万条现代中文术语,覆盖广泛的学术领域。

  • 《汉语外来语词典》,岑麒祥 ,1984。
  • 〈和制汉语一目览〉载于《汉字百科大事典》,佐藤武义,1996。
  • 《美意识的种子—和制汉词对中国现代文学的影响》,周圣来,2016。
  • 《清末民初和改革开放从来的日源借词及其汉化研究》,曲紫瑞,2016。
  • 《交错的文化史 – 早期传教士汉学研究史稿》,张西平,2017。
  • 《近现代汉语辞源》,黄河清,2020。
  • 《现代汉语外来词研究》,高名凯、刘正埮,1958。
  • 《现代汉语中从日语借来的词彙》,王立达,1958。
  • 《中国人留学日本史》,実藤恵秀, 1981。
  • 《汉语外来词词典》高名凯、刘正埮、麦永乾、史有为,1984。
  • 《跨语际实践》(原书名:Translingual Practice), 刘禾,1995。
  • 《近现代汉语新词词源词典》, 2001。
  • 《观念史研究 - 中国现代重要政治术语的形成》,金观涛、刘青峰,2010。
  • 《日本明治时期北京官话课本词汇研究》,陈明娥,2014。
  • 《现代汉语词典中的日语藉词研究》,森田聪,2016。
  • 《明清汉语外来词史研究》,赵明,2016。
  • 《新华外来词词典》, 史有为,2019。
  • 《汉语近代二字词研究:语言接触与汉语的近代演化》,沈国威,2019a。
  • 《一名之立旬月踟蹰:严复译词研究》,沈国威,2019b。
  • 《近代中日词彙交流研究:汉字新词的创制、容受与共享》,沈国威,2020。
  • 《清末民初词彙研究》,张烨,2019。
  • 《东往东来–近代中日之间的语词概念》,陈力卫,2019。
  • 《近代中日词彙交流的轨迹》,朱京伟,2020。   在搜索功能方面,资料库提供了多种搜索选项,让使用者能够根据自己的兴趣和直觉查找并比较语词,包含未知的语词,从而鼓励学者们独立探索借词的各种脉络和路径。

在语义方面,我们为每个中文术语提供了多种语言的翻译,主要包括来自各类英汉词典的实际历史来源翻译。此外,考虑到佛典汉译词的重要性,我们提供了以下三本佛教词典的数据:

  • (1)《佛学大辞典》,丁福保编,1922。
  • (2)《五译合璧集要》(“Pentaglot Dictionary of Buddhist Terms”)Raghu Vira, 1961。
  • (3)唐法师舍支迦拉席玛的《法师翻译的法华经词彙表》(“A Glossary of Kumārajīva’’s Translation of the Lotus Sutra”),Seishi Karashima, 2001。

上述这三本词典可在 https://glossaries.dila.edu.tw 公开访问。

所有日文词彙、翻译、文本来源及日期数据均来自「中纳言」资料库,该资料库隶属于日本国语研究所,并且已获得合法授权。

本资料库的建立旨在为研究现代汉语中的新词提供一个整合性平台。目前,我们认为学术界在以下几个方面仍有发现的潜力,需要持续的学术工作:

  • 基础资料的整合
  • 学术界与历史资料的对话
  • 佛典汉译词(梵文术语)与日语借词的整合
  • 早期与现代学术研究的比较
  • 分析西方作者的中文文本及其中的新词
  • 统一并整合过去的各种分类和标准
  • 借词分类的客观方法的进一步发展和整合

目前,资料库的三项功能使用受限,包括:

  • 生成词表:按特定标准(如学者、时间、语言等)生成词表。
  • 研究数据:为特定学者生成词表。
  • 历史语料:查询个别历史语料的词表及相关图像档案。   本资料库最终目的是促成学术评估与历史语料之间的对话、互证。我们提供了几项量化的评判方法,主要是学术界普遍认为某词是否为借词,以及现代学术对于每一个别词有多高的共识程度等统计数据。然后,最重要的乃是能将学术评估与历史证据进行直接对比。在某些情况下,历史证据支持学术分类,而在其他情况下,则显示出不同的分类。所有这些讯息都可以在每个词的摘要中轻松查阅。

(截取自原网站。)