漢語新詞資料庫
《漢語新詞資料庫》致力於收集與整理現代漢語新詞,特別注重詞源研究和歷史語料的實際應用。所謂的現代漢語新詞,不僅包括漢語自發生成的新名詞,也涵蓋那些可能源自日語的詞彙。這個「可能」顯示即使學界已有初步成果,我們依然期待未來能有更多新的發現。日語借詞在現代漢語中的角色曲折多變;起初這些借詞被忽視,但後來逐漸被視爲理所當然。這兩種觀點都值得商榷。實際上,日語借詞對漢語詞彙產生了深遠的影響,但日語借詞背後的傳播路徑以及其所刺激的思想衝擊,並非我們想像的如此當然。不論是對個別詞源的研究,或是其整體傳播的歷程,對日語借詞的理解仍需跨學科的整合。日語借詞不僅是個語言現象,更爲涉及到跨文化的知識交流和概念傳播,對於研究過去一世紀東亞現代化的學者來說,掌握概念史至關重要,而日語借詞在其過程中起到了關鍵作用。從 120 年前首次被納入漢語詞彙以來,關於日語借詞的研究雖取得了一些成果,但這些成果似乎尚未經過歷史事實的考驗。目前看來,尚缺乏以具體歷史語料來驗證日語外來詞研究的實例。本資料庫旨在促進學術研究與歷史語料之間的直接對話和相互驗證,以揭示日語借詞的真面目。
中國人一直深信自己的語言特別純淨而充滿奧秘,畢竟中國自古以來是東亞的政治領袖與道德權威,對周邊國家文化有著深遠的影響。然而,到了清末,當中國人逐漸覺察到即使是鄰近的小國也能對中文造成反向影響時,這種認識似乎對他們的自我認同構成了嚴峻挑戰,引發了苦澀的自嘲情緒。在這樣的語境中,新名詞往往被當作直觀的代罪羔羊。彭文祖在《盲人瞎馬》一書中從前言責罵到卷末,表達了對新名詞的強烈批判:「吁嗟乎,殊不知新名詞之為鬼為崇,害國殃民以啓亡國亡種之兆,至於不可紀極也。」這反映了一種深刻的文化焦慮,認為新詞的引入可能預示國家和民族的危機。
實際上,文化或語言上的相互交流不限於詞彙,也並非從日語借詞開始的。早從佛典翻譯和宗教的引入開始,還包括外來統治者對漢語的深刻烙印,還使得至今北方官話和南方方言在發音變化上呈現明顯差異。不僅如此,到了明末,西方的思想和詞彙隨著耶穌會士的到來而傳入。然而,漢語詞彙的影響自1900年代初以來達到了空前的高峰。
隨著留日學生的返國,大量日語借詞湧入了中文詞彙庫。學生帶回的現代日語詞典,乍看一下似無害,但長期處於沉寂中的中國社會,對新知已產生了極大的好奇心和渴望。每一個新引入的詞彙都帶來了一個新觀念,每一個新觀念都加劇了社會現代化的壓力,促使社會進行轉型並探索新的可能性。可想見,「革命」一詞的引入不僅讓變革成為可能,更讓其成為必然的,「革命」一詞在思想層次上的產生了突破,釋放出的力量直接影響了中華民國的成立及其後續的一系列發展。
自20世紀初以來, 中文新詞的研究持續進行,1903年《新爾雅》的出版標誌著這一領域的重要開端。然而,由於當時仍缺乏西方語言學方法以及受到各種政治和社會因素的限制,日語借詞研究直到戰後才真正開始。
戰後,學界對漢語新詞的興趣逐漸增強,學者們開始努力辨識哪些詞彙來自日語的,並探索哪些因素可能有助於建立一個實用的分類系統。最初,中國學者的反應受到西方外來詞框架的影響,西方理論主要通過一套語音演變原則,識別語音方面的相似程度。這種方法導致早期的現代漢語學者,如王力等人,對日語借詞持冷漠甚至否定的態度。此外,由於日本自唐朝以來繼承了漢字,部分學者混搖字和詞的區別,認爲日語借詞基本上是中文固有的。這種觀點忽視了借詞在語義方面有所變化,也低估創造過程的關鍵作用。
但中國語言學的發展並未因此停滯。特別是在歷史詞彙學領域上,隨著時間推移,越來越多的學者接受了一個觀點:由於漢字作為東亞地區的「共同書寫語言」(scripta franca)而被廣泛使用,詞彙的傳播往往依靠書寫而非口語。因此,僅依賴語音相似性來判斷借詞的做法已逐漸被質疑,學者們開始重視新的字組合(詞形)、逐語素比較(morpheme-based comparisons)以及語義演變,認為這些因素是識別借詞的重要標準。此外,現代漢語與古漢語在意義上的差異也已經廣為人知,許多所謂的回歸詞(同形異義詞帶有新意義)實際上可以被視為新詞。
從戰後到 2000 年,和製漢語的研究發展出了獨特的術語和方法論。其中一個里程碑是 1958 年王立達的借詞研究以及1984年出版的《漢語外來詞典》,這些作品正式承認和製漢語中日語借詞的重要性。該時期的研究建立了一套獨特的框架,採取了與西方不同的方法,並針對漢字的特性進行了調整。在這一時期,學術界對日語借詞的分類達成了某種共識,大致將其分為三類:回歸詞(如「經濟」),音譯詞(如「雷達」,音譯自英文 ‘radar’),以及意義詞(如「蜜月」,意譯自英文 ‘honeymoon’)。回歸詞指的是那些在古漢語文獻中已存在但被日本賦予新意義的詞,音譯詞則反映外語發音的新詞,以及意譯詞又稱仿譯詞,是部分或完全地複製原詞語素結構的詞。
在當代漢語語言學中,日語借詞的地位基本上已無爭議。然而,由於分類方法尚未統一以及對歷史資料的掌握程度不同,對不少個別詞彙的看法仍存在爭議,特別是在借詞的子類型上,例如一些混合型借詞,如借詞與漢語語素的結合,或是在創造過程中直接模仿日語詞的情況。最近,沈國威提出了「激活詞」的新概念,指的是那些過去使用率較低但由於日本的影響而開始頻繁使用的漢語詞。
然而,儘管現代漢語借詞研究具有創新之處,也存在一定的內部局限性。主要問題是,這些研究多半局限於中文的範疇內,很少涉及到日語,更不用說其他語言了。某些人似乎以爲借詞不曾跨越海洋、山脈或草原一樣。除了陳力衛以日語發表大部分文章和少數在國外任教的學者之外,大多數借詞研究很少涉及所謂的深層詞源(deep etymology)。這與西方的詞源學形成了鮮明對比,西方詞源學不僅跨越多種語言(廣度),還努力將單詞甚至語素追溯到其印歐語根(深度)。對比之下,如果古漢語時期與羅馬時期相類比,那麼所構擬的印歐語時期則比夏朝還早幾千年了。東西詞源學上的差異,可能源於中國的詞源學(詞本位)和文字學(字本位)之間長期的相互不干涉。這種分隔導致了研究方法和重點各有所偏,在某一種程度上可能也限制了中文詞源學的發展。
在此背景下,仍有許多議題待探索,這正是本數據庫開發的初衷。此處,我們將簡要概述還存在學術爭議的地方。其中最關鍵的是歷史詞彙學中的所謂「造詞者」(authorship)的問題。在一定意思上,造詞者問題被忽略是可以理解的,畢竟這個問題幾乎僅見於東亞新詞的範疇內,而較少涉及到西方借詞脈絡。核心問題在於,西方的概念及其相關詞彙很難直接用漢字記錄,必然牽涉到書寫系統的轉換,進而由於漢字本身帶有表義功能,所以使得問題變得更加複雜。
具體來說,即使是採用最直接的借用方式——音譯,被音譯的新詞也必須經歷相當程度的語音適應(phonetic adaption),而漢字並不是記錄語音的最佳工具。儘管可以勉強使用漢字來純粹表達音,比如將 ‘Gypsy’ 音譯作「吉卜賽人」,但這種方式往往顯得有些尷尬。實際上,中文通常避免採用這種翻譯方略。此外,自 19 世紀中期以來直到戰前,音譯常被視為一種不雅的翻譯方式(參考嚴復的「一名之立,旬月踟躕」的名言),也被看作是承認中國或日本等國缺乏相應的觀念和詞彙的表現,這種承認似乎象徵著一種自卑感,是不可接受且難以忍受的。
由於音譯並非首選的借詞方法,因此只剩下兩種其他借詞方法:意譯(亦稱仿造,calquing),即逐語素地模仿源詞的結構;以及概念重構(conceptual remaking),即用定制的語素結構來表達外來概念。這些方法讓外來詞以更優雅且在文化上更可接受的方式融入東亞語言詞彙。對於未受專業訓練的華人來說,這些借詞往往不引起懷疑,給人一種正常的中文詞彙的感覺。
然而,當源詞具有特殊或變異的結構時,仿造方法可能會遇到問題。例如,當詞源來自較不熟悉的語言,如 ‘kangaroo’(澳洲東北原住民語言一詞)或 ‘giraffe’(由未知非洲語言傳到阿拉伯語 zarafa,再傳至意大利語 giraffa),或來自拉丁文或古希臘文的複雜語素結構(如 ‘metamorphose’ 等),以及當詞義透過隱喻發生變化,因而與原始語素結構失去直接聯繫時,如生物學上的 ‘cell’(細胞),其原意為小房間(拉丁語 cella)。但(生物學上的)‘cell’ 未被仿造為「小室」或「小間」,而是創造了全新概念「細胞」。此外,自然科學術語如化學元素的名稱(‘hydrogen’,意為「源自水的」),或現代技術詞彙(‘satellite’,來自拉丁文 satelles,「隨從」)也帶來挑戰,主要是因為字面意義與其延伸意義之間常常存在顯著差異,使得直譯成中文時語義不通。
在這些情況下,便採用了最具挑戰性的借詞方法——基於外來詞義創建新的詞形。那些低估意義而強調詞形概念的學者,通常不接受概念重構作為有效的借詞方法。他們認為,語義借用很難證明,而且兩個詞之間幾乎不可能有完全相同的語義這種情形存在,更何況不同語言之間。雖然這是事實,但當我們研究不同文字系統之間詞彙是如何轉換的,新詞的形成往往是某種有意識的有目的的翻譯過程,這一點是無法否認的。借的是意思,自創的是詞形,因此,儘管概念重構是所有借詞類型中最為勉強的一種,我們仍然認為其可算作借詞。
概念重構需要翻譯者深度理解目標語言的細微差異和複雜細節,並需進行多次精細調整。從明治維新前後開始,日本通過一項知識產業共同努力,使用漢字創造新詞,大量翻譯西方的知識,包含現代詞彙和概念。正是憑借這些早期日本學者的卓越知識和語言敏感性,才得以創造出約 2000 至 3000 個新詞,這些詞專為我們的現代時代精心打造的。這不僅是語言上的成就,也搭建了一座文化橋樑,幫助將西方概念以有意義且易於接受的方式融入東亞語言。
儘管應當承認日本學者的重要貢獻,但我們也應保持對歷史的公正認識,並非所有新詞都是日本人親自創造的。除了前述佛典漢譯詞外,19 世紀後半期西方傳教士創造的另一組重要新詞也不可忽視。無論是字典、教科書、文章還是宗教文本,傳教士們用中文創造了許多重要的歷史文獻,這些文獻對教育和傳教活動至關重要,也自當成爲我們今天所關注的寶貴研究材料之一。
雖然當時許多西方文獻在中國受到冷遇,甚至無痕迹失傳,但其中一些作品被帶入日本,成為西方知識翻譯成日語的重要參考資料,例如偉烈亞力(Alexander Wylie, 1815-1887 年)早期的科學雜誌《六合叢談》,甚至羅存德(Wilhelm Lobscheid, 1822-1893 年)於 1866 至 1869 年之間所編的《英華字典》,日本人收買出版社全庫存,並分發給全國各地的翻譯所使用,對日本學術界影響力無可忽略。這種歷史情況造就了一種獨特的現象:最初由西方人所創造的中文詞彙被納入日語,隨後被誤以爲是日語借詞再次回歸中文。這一借詞路徑突顯了文化和語言交流的複雜現實,更加深了我們對詞源與中國、日本及西方之間歷史互動緊密交織的理解。這些所謂的漢語中的日語借詞的西方來源已在作者《漢語中的西源和製漢語:學術評析與辭典資料建置》一篇論文中進行了討論。
鑑於這一歷史背景,我們面臨的關鍵問題是,如何區分由西方人創造的中文詞與正統的中文新詞。在現行的標準框架下,通常將西方人創建的詞稱為「傳教士譯詞」或類似的名稱。我們建議,由於此分類的主要標準是「造詞者」,因此可以將其作為評估借詞性質的基本尺度。這一概念有助於區分日本人、中國人和西方人創造的借詞,其標準客觀明確。此外,這也能克服早期研究中常見的尷尬標準,即判斷一個詞是否具有「漢語特色」。正如我們今天所認識的,一個詞即使充分表現出「中文特色」,仍可能是個借詞,理由是該詞不是由中國人而是由西方或日本人所創造,且在造詞過程中已有意讓新詞符合漢語構詞原則。
這種證明造詞者的方法,在一定程度上需要證明每個詞的來源。因此我們主要是通過其最早書證(earliest record)來區分詞的類型:該詞是首次出現在由西方作者撰寫的中文文本中呢,還是在雙語詞典,或中國作者的文本,或是在日本資料中呢?通過追溯一個詞到其最初的記錄,我們可以推斷出其造詞者的身份,從而將作者、語言與詞的創造聯織在一起。儘管無法完全逃離理解詞義的歷史性演變,但使用最早書證提供了一個更客觀的基礎來評估借詞性。
那麼,當使用最早書證,來確定造詞者身份的方法,書證本身就要承擔重要的證明責任,因此評估歷史記錄的可靠性變得至關重要。具體來說,我們需要評估資料庫中某個詞目前所最早記錄是否真的是該詞的最早書證,以及在未來研究中發現更早記錄的可能性有多大。雖然無法達到絕對的確定性,但通過分析資料庫中從 1600 年至 1920 年間所有詞的記錄分佈,並檢查每個詞的具體記錄分佈,我們可以運用核密度估計(Kernel Density Estimation)這一統計方法,來計算特定的可能性。核密度估計常用於時間序列分析,所以可以針對於每個詞告提供一種數據告訴我們,對於書證的信賴程度有多高。有些情況,我們發現與學術界不同的最早書證進而判斷該詞是或不是借詞,那麼這種判斷是否有說服力也要看最早書證的信賴度。
這種方法標誌著與過往研究中常見的主觀判斷借詞分類方法的一次轉變。在我們的資料庫中,我們承認借詞的接受歷史是複雜的,而且可能會因新發現而受到影響。隨著新資料的添加,某些詞的分類可能會有所變動,但這也有助於提高分類的整體穩健性。
近年來,在外來詞語源研究領域,系統性整理近義詞也是一個重要的發展。原則上,近義詞可以組織成所謂的近義詞詞組(synset),其中主要分為兩種:共時近義詞詞組(synchronic synset)包含了意義相似的當代詞彙;而歷時近義詞詞組(diachronic synset)則包括了那些較早或具有早期意義的詞彙。近義詞的歷時研究尤其具有研究價值,因為在新術語形成的初期混亂中,尚未對特定詞形達成共識,多個近義詞可能同時出現,可以端倪出不同構詞嘗試背後的思想成分。隨著時間的推移,逐漸形成共識,某些術語成為主流,而其他則逐步淘汰。這一詞彙發展過程在不同術語間的持續時間各不相同,有些可能需要幾代人時間才能達成共識,而有些則在幾年內確立其地位。在這方面,黃河清所編纂的《近現代漢語辭源》一書對歷史近義詞詞組的研究提供了重要貢獻。
本資料庫涵蓋了共時及歷時近義詞詞組二種,除此外我們也建立了自己的歷時近義詞詞組。雖然從一開始就預計將近義詞詞組納入資料庫,但建立自有的歷時近義詞詞組並非初衷。源於我們資源中包含了眾多雙語詞典,因此這一結果也是自然形成的,所以資料庫也有了一套較為罕見的歷時多語近義詞詞組,捕捉了不同語言和時期概念的演化與相互連結。
本資料庫收錄了來自台灣教育部網上資源的約60萬條現代中文術語,覆蓋廣泛的學術領域。
- 《漢語外來語詞典》,岑麒祥 ,1984。
- 〈和製漢語一目覽〉載於《漢字百科大事典》,佐藤武義,1996。
- 《美意識的種子—和製漢詞對中國現代文學的影響》,周聖來,2016。
- 《清末民初和改革開放從來的日源借詞及其漢化研究》,曲紫瑞,2016。
- 《交錯的文化史 – 早期傳教士漢學研究史稿》,張西平,2017。
- 《近現代漢語辭源》,黃河清,2020。
- 《現代漢語外來詞研究》,高名凱、劉正埮,1958。
- 《現代漢語中從日語借來的詞彙》,王立達,1958。
- 《中國人留學日本史》,実藤恵秀, 1981。
- 《漢語外來詞詞典》高名凱、劉正埮、麥永乾、史有為,1984。
- 《跨語際實踐》(原書名:Translingual Practice), 劉禾,1995。
- 《近現代漢語新詞詞源詞典》, 2001。
- 《觀念史研究 - 中國現代重要政治術語的形成》,金觀濤、劉青峰,2010。
- 《日本明治時期北京官話課本詞匯研究》,陳明娥,2014。
- 《現代漢語詞典中的日語藉詞研究》,森田聰,2016。
- 《明清漢語外來詞史研究》,趙明,2016。
- 《新華外來詞詞典》, 史有爲,2019。
- 《漢語近代二字詞研究:語言接觸與漢語的近代演化》,沈國威,2019a。
- 《一名之立旬月踟躕:嚴復譯詞研究》,沈國威,2019b。
- 《近代中日詞彙交流研究:漢字新詞的創制、容受與共享》,沈國威,2020。
- 《清末民初詞彙研究》,張燁,2019。
- 《東往東來–近代中日之間的語詞概念》,陳力衛,2019。
- 《近代中日詞彙交流的軌跡》,朱京偉,2020。 在搜索功能方面,資料庫提供了多種搜索選項,讓使用者能夠根據自己的興趣和直覺查找並比較語詞,包含未知的語詞,從而鼓勵學者們獨立探索借詞的各種脈絡和路徑。
在語義方面,我們為每個中文術語提供了多種語言的翻譯,主要包括來自各類英漢詞典的實際歷史來源翻譯。此外,考慮到佛典漢譯詞的重要性,我們提供了以下三本佛教詞典的數據:
- (1)《佛學大辭典》,丁福保編,1922。
- (2)《五譯合璧集要》(“Pentaglot Dictionary of Buddhist Terms”)Raghu Vira, 1961。
- (3)唐法師舍支迦拉席瑪的《法師翻譯的法華經詞彙表》(“A Glossary of Kumārajīva’s Translation of the Lotus Sutra”),Seishi Karashima, 2001。
上述這三本詞典可在 https://glossaries.dila.edu.tw 公開訪問。
所有日文詞彙、翻譯、文本來源及日期數據均來自「中納言」資料庫,該資料庫隸屬於日本國語研究所,並且已獲得合法授權。
本資料庫的建立旨在為研究現代漢語中的新詞提供一個整合性平台。目前,我們認為學術界在以下幾個方面仍有發現的潛力,需要持續的學術工作:
- 基礎資料的整合
- 學術界與歷史資料的對話
- 佛典漢譯詞(梵文術語)與日語借詞的整合
- 早期與現代學術研究的比較
- 分析西方作者的中文文本及其中的新詞
- 統一並整合過去的各種分類和標準
- 借詞分類的客觀方法的進一步發展和整合
目前,資料庫的三項功能使用受限,包括:
- 生成詞表:按特定標準(如學者、時間、語言等)生成詞表。
- 研究數據:為特定學者生成詞表。
- 歷史語料:查詢個別歷史語料的詞表及相關圖像檔案。 本資料庫最終目的是促成學術評估與歷史語料之間的對話、互證。我們提供了幾項量化的評判方法,主要是學術界普遍認為某詞是否為借詞,以及現代學術對於每一個別詞有多高的共識程度等統計數據。然後,最重要的乃是能將學術評估與歷史證據進行直接對比。在某些情況下,歷史證據支持學術分類,而在其他情況下,則顯示出不同的分類。所有這些訊息都可以在每個詞的摘要中輕鬆查閱。
(截取自原網站。)