2018年5月15日 星期二

認識台語第二課:解構漢字迷思

若要以「語言」來認識「台語」,首要的是必須破除對「漢字」的迷思。

我們太習慣漢字了!以致於經常會以下這幾個迷思:

  • 每一個漢字都是一張圖(a photogram or a logogram),代表一種意思(表意,an ideogram)。

首先,漢字絕對不是「圖」;圖片,往往帶有某種言人人殊的意思,但文字則是指向某種「特定意思」的符號,同時也是指向某種「特定聲音」的符號,並且,文字是一種具有社會共識的符號,不同於「圖」所具有的高度變異性。不少人誤以為漢字是一種圖,這當然是完全錯誤的觀念。

其次,「漢字是象形字(logogram)」,這種觀念也不對。依照許慎(C.E. 58 - C.E. 124)《說文解字》將漢字依造字原則分為六大類,即「六書」:象形、指事、會意、形聲、轉注、假借。這個六書的分類法也為後世採用至今,其中除了「轉注」一類的漢字有較多爭議外,其餘五類漢字較無爭議。我們就用六書的分類來考慮漢字演變的歷史。用具體的形象設計出來的漢字,包括了象形、指事、會意這三類的字,而他們都是較早期出現的漢字。這跟世界各地的早期文字發展相吻合:用符號表達具體事物,而較少抽象思維,這是文字發展的第一步。不過,由於象形、指事、會意這三類字的符號跟口語發音較少有直接關連,並且大多是具體事物的表達,根本不夠用於表現真正的口語,所以大量的假借字就出現了:假借字是借用前三類字的符號,來表達發音相同,但意思不同的語音(許慎:...假借者,本無其字,依聲託事...);假借字的用法近似日文中的「音讀」字,或台語漢字歌仔冊的用字 - 只管發音,不管那個「字」本來的意思,而賦予其他的意思。簡單講,所謂「假借字」是百分之百的表音文字。

根據中國學者姚孝遂統計,殷商時代的甲骨文中,假借字佔了70%。

假借字雖然解決了字不夠用的問題,不過,卻帶來了同音異義的字過多,識讀不易的問題。為了解決這個問題,遂有「形聲字」的發展 - 形聲字,就是以假借字作為表達聲音的符號(聲符),在再其旁邊再加上表達意義的符號(形符),用這種方式來區別同音不同義的字。

假借字和形聲字加總起來,在現代中文的常用漢字裡,已經超過了總數的90%。漢字,如何會是象形字呢?文字必須與口語的聲音產生連結,這樣的文字才能確實有用;跟世界各地的其他文字比較,漢字毫無例外的也是這樣從原始的象形、具體,往表音、抽象發展。



漢字是表意字(ideogram),這是大眾最一般的對漢字的誤解。表意的意思是,看到漢字就知道它的意思。然而,除了跟語言無關的數學符號之外,「表意文字」事實上是不可能存在的。因為人類要能夠閱讀,必須要經過學習,而無論是漢字或者是羅馬字(a b c d...)(或其他拼寫系統),「閱讀」在大腦內部的神經活動都是經由相同的機制進行:左大腦的腹路徑(ventral pathway or “what” pathway),主功能是辨識常見文字並與聲音產生連結,以及左大腦的背路徑(dorsal pathway or “where” pathway),主要用將文字與聲音產生連結。學者針對日文(包含純表音的假名系統,和表音功能較弱的漢字系統)閱讀的研究顯示,閱讀漢字時,左大腦的腹路徑活動較旺盛,且右腦關於空間活動的區域也會有較明顯的活躍;而閱讀假名時,左大腦的背路徑活動較強,且關於聽覺辨識的神經活動也相對較活躍。這顯示了漢字和拼寫字在大腦活動中的差異,同時也指出了,閱讀雖然是視覺活動,其實是跟聽覺相關的。總之,閱讀漢字在理解意思上並不具有較高的優越性,完全不仰賴聽覺活動的「看到字,就知道意思」是不可能的。



  • 漢字就是一個一個的字。
這是一個非常普遍的迷思。

一般人看到漢字都以為是一個一個有含意的「字」,不過,像是「葡萄」「窈窕」「猩猩」呢?他們是兩個字組成的一個詞彙嗎?

我們在這邊要先拋開一般的以為,來重新定義一下字跟詞。這裡所謂的字就是「a word」,是人們在說話時可以被切割出來的具有意義的最小單位:依此定義,「葡萄」「窈窕」「猩猩」都是一個「字」(或者,稱其為詞彙也可以)。

但是,「葡萄」「窈窕」「猩猩」都可以被拆解成兩個單位,兩個符號呢!每一個符號代表一個音節,我們在說話時並不會單獨使用其中一個音節 - 因為這兩個音節必須組合在一起才能構成「說話時有意思的單位」- 這些其實是雙音節的字(雙音節的詞彙),而且因為他們不能夠再被切割了,是具有語意的最小單位,所以把它們叫做單純詞(simple word) 。

華文裡面很多單純詞都是單音節的,像是:人、天、地、花...,所以一般很容易誤解華文的每一個音節符號都等於一個字,其實華文的單純詞有單音節的、雙音節的、多音節的。

現在考慮一個情況:「我」是一個單音節的單純詞,而「我們」是一個?「我們」不是單純詞,因為它可以被切割成「我」和「們」。「我」的意思比較清楚,是單數的第一人稱代名詞,那「們」呢?「們」無法獨立使用,它一定要跟人稱名詞結合在一起才行,比如:你們、他們、人們、學生們...,「們」這種詞,就是所謂的後綴(suffix)(有些較年輕的人會把「們」的使用擴張到非人的事物上,如狗兒們、小鳥們)。

「我」和「們」,組合起來的詞叫做合成詞(compound word),而他們都是詞素(morpheme)- 也就是說話時用的「字」可以被切割出的最小的有語意功能的單位。
華文的特性就是很多單純詞是單音節的,並且它的詞彙跟詞素的比例接近1:1,以至於人們容易有華文一個符號就是一個字的錯覺啦。

  • 一個漢字就能表達形、音、意。
對於自由詞素來說,比如「我」這個「字」,他的確能表達形音義,不過這也沒什麼特別的,因為只要是自由詞素,實詞(content words),通常是動詞、名詞、形容詞,不管哪一種文字,都具有形(orthographic,拼、寫)、音(phonological,發音)、意(semantic,語意);形音意具備並不是漢字特有的。

相對於實詞,有些詞素的意思不是那麼清楚,比如我們的「們」,這些詞具有文法上的功能,他們是虛詞( function word)。虛詞是具有明顯的形跟音但是意思不明,而文法功能明確的詞素。

中國有歷史悠久的文字學,專門研究「漢字」成為一門學問。不過,這門學問其實與現代的語言學關係不大,對於要了解一種語言或書寫系統(writting systems)的幫助也不大。本文跳出這個框架,以書寫的符號來定義漢字。總結:漢字是一種書寫符號,這些符號跟世界上其他的書寫系統一樣,都包含有形音意的訊息;如果一個符號代表一個明確的意思,它通常是單音節的詞素,如果兩個符號必須不可分割才能完整的表達一個明確的意思,這些是雙音節(或以上)的字,並且通常包含了兩個或兩個以上的音素與音節。

若我們考慮音素文字(如:a b c d,cat dog banana), 或者音節文字(如:あ か さ た な,はは  あなた),它們在「形(orthographic)」的表現上相對簡單,並且相對的更直接的跟發音連結。學者在2017年發表的一篇研究報告指出,分析了116種書寫系統後,發現人類在書寫符號的偏好上受到視覺認知的限制。漢字並沒有被納入這篇報告的分析中,因為漢字的「形」相對的複雜,部件繁多(直、橫、撇、點、勾、捺...),表達意思的形符、部首,表達聲音的聲符,並且由於漢字的這些特性,學習者往往需要經過一個較陡的學習曲線,才能正確地連結符號跟語音。如前所述,漢字不是單純的象形字,也不是單純的表意字,將他稱為符號文字(logographic characters)是較為適當的。