關於台語(Tâi-gí)

台語,又稱台灣閩南語、Tâi-gí 或 Taigi,是閩南語的一種變體。在台灣,約有 1,900 萬人多少會說台語;海外的閩南語變體另有數千萬使用者。台語不是華語的方言;只會華語的人聽台語,幾乎一句都聽不懂。它有自己的語音系統,傳統上計為七個聲調(其中兩個只出現在入聲音節);日常詞彙也自成一格,並有來自日語與台灣南島語言的借詞。

台語的文字

台語主要活在口說之中,但它有三種書寫系統,本工具三者並列呈現。台語漢字以漢字書寫;白話字(Pe̍h-ōe-jī)是較早的羅馬字,由 19 世紀的西方傳教士所創、經長老教會在台灣推廣,是許多台灣信徒最早學會閱讀的文字;台灣第一份印刷報紙(1885 年)即以白話字發行。這份深厚的教會文獻傳統,正是許多台灣基督徒至今偏好白話字的原因。2006 年教育部公告的台羅拼音(Tâi-lô)即以白話字為基礎修訂而成,現為學校與官方教材的標準;兩者僅有少數拼寫差異(如 ch→ts、oa→ua、ⁿ→nn 等)。

壓制與復興

在台灣近代史的大部分時期,台語是街頭巷尾的語言。日本統治(1895 至 1945 年)把它趕出學校與公共生活。國民政府更進一步:自 1946 年起、貫穿整個戒嚴時期(1949 至 1987 年),課堂、政府與廣播只用華語(國語),學童在學校說台語會被處罰、被嘲笑,連以羅馬字印行的台語聖經都遭沒收。於是一整代父母默默不再把語言傳下去,想讓孩子少吃苦頭。這個選擇在數百萬個家庭裡重複發生,可能比任何一道禁令傷得更深。

語言隨著民主回來了。1987 年解嚴後,台語電視、流行音樂與政治造勢重新出現;2001 年起,每個國小學生每週都要上一堂本土語言課;2019 年《國家語言發展法》讓台語成為國家語言。但每週一兩個小時、而且常以華語授課,仍不足以養出會說台語的人。研究者依聯合國教科文組織(UNESCO)的語言活力指標,將台語的世代傳承評估為介於「不安全」與「明確危險」之間、較接近後者;許多年輕人聽得懂台語,卻說不出口。讓台語繼續被聽見,正是本專案的初衷。

關於本工具

台語英語翻譯是一個免費的語音翻譯工具,支援英語、台語、中文之間的互譯。輸入或開口說,即可聽到翻譯結果;台語並列顯示漢字、台羅與白話字。直接在瀏覽器中使用,免安裝、免註冊、完全免費。Google 翻譯、Microsoft 與 DeepL 至今完全不支援台語;而一個活在聲音裡的語言,需要的是聽得懂、講得出的工具,不只是文字對文字。

使用訣竅

  • 請說或輸入完整的句子。模型以自然語音訓練,翻譯完整句子的效果遠勝於單字。
  • 請在安靜的環境錄音,並讓手機靠近說話的人。
  • 閒置一段時間後的第一次翻譯需要幾分鐘等待服務喚醒;之後每次翻譯只需數秒,建議過程中保持頁面開啟。
  • 雙向對話請使用「對話」分頁:將手機平放在兩人之間,上半部朝向說台語的一方。
  • 點擊「慢速」可以 70% 的速度重播台語語音,聲調保持不變。

運作方式

每一筆翻譯都經過文字處理,因此您隨時能看到系統聽到什麼、正在說什麼:

  • 翻譯: 採用開源語言模型 Taigi-Llama,以數十萬組平行句子微調,可在英語、華語與台語(漢字及羅馬字)之間互譯。
  • 語音辨識: 台語與中文採用聯發科開源的 Breeze ASR 模型(以約一萬小時合成台語語音訓練);英語端採用 OpenAI Whisper。
  • 台語語音與羅馬字: 台語語音與台羅拼音來自意傳科技的「媠聲 SuíSiann」開放服務,並以開源 taibun 函式庫作為備援。

致謝

本工具的台語語音由「媠聲 SuíSiann」合成。這是彰化的意傳科技(Ìthuân)打造並維護的開放服務,程式碼以 MIT 授權開源。沒有他們,這個工具就無法開口說話。歡迎直接造訪他們的網站: suisiann.ithuan.tw

這是一個獨立的開放專案,不隸屬任何公司。發現翻譯錯誤或想提供協助,歡迎透過意見回饋表單與我們聯繫。語言現況的數據與來源,請見台語語言現況

開始翻譯台語 →