數據看台語:數百萬人會說,卻幾乎沒人書寫

在台灣,約有 1,900 萬人多少會說台語(台灣閩南語,Tâi-gí),加上海外的閩南語社群更達數千萬。但它幾乎只活在口說之中。理解這件事的數據,同時說明了台語的世代傳承為何面臨危機,以及純文字工具為何照顧不到絕大多數會說的人。

世代斷崖

行政院主計總處 2020 年人口普查:6 歲以上國人以台語為主要使用語言者佔 31.7%。但平均值掩蓋了斷崖:65 歲以上是 65.9%,6 到 14 歲只剩 7.4%。教育部本土語言資源網引用的研究,依聯合國教科文組織(UNESCO)的語言活力指標,將台語的世代傳承評估為介於「不安全」與「明確危險」之間、較接近後者。同一批研究顯示:在家使用台語的比例,從 1945 年前出生世代的 71.4% 掉到 1986 至 1994 年世代的 22.3%(葉高華,2013);另一份 2003 年的研究發現,12 歲以下兒童常在家使用母語的比例不到 17%。

說得流利,寫的人少

台語並非沒有文字:19 世紀傳教士創造的白話字(Pe̍h-ōe-jī)承載了台灣第一份報紙,2006 年教育部公告的台羅拼音是現行標準,台語漢字也持續使用。但絕大多數說得流利的人,從未學過任何一套台語書寫系統;這個語言是在家裡、用聲音傳下來的。2022 年,Meta 發表了他們稱為「第一個為以口語為主的語言打造」的 AI 語音翻譯系統,選擇的語言正是閩南語,一個 Meta 形容為「缺乏標準書寫形式」的語言。

這對翻譯工具的意義

活在聲音裡的語言,需要聽得懂、講得出的工具。這正是本專案想做的事:說台語,翻成英文或中文;輸入或說中文、英文,聽到台語,同時為想學文字的人並列三種書寫系統。

免費聽台語、說台語 →

資料來源

行政院主計總處 109 年人口及住宅普查 · 教育部本土語言資源網(語言活力評估) · Meta AI 閩南語語音翻譯(2022) · 白話字歷史

延伸閱讀:台語常用語(附發音)台語語音輸入Google 翻譯有台語嗎?