項目編號: | ITP/030/23LP |
項目標題: | 廣東話和英語轉錄與及書面翻譯 |
研發單位: | LSCM研發中心 |
概要: | 近年來, 隨着媒體聯絡、新聞、數碼新聞和社交媒體對粵語轉錄的需求日益增加, 一個穩定和有系統的的轉錄服務對於減輕人類轉錄者的負擔和提高其生產力至關重要。一直以來, 轉錄都不是一件容易的事。不同的轉錄人員對需要轉錄的材料會有不同的觀點和理解, 導致轉錄結果出現不同程度的差異。更糟糕的是, 粵語對話偶爾會夾雜英語, 這增加了轉錄任務的複雜性。更重要的是, 轉錄和翻譯材料的保密性亦必須考慮。在這種情況下, 用戶不能依賴第三方的在線轉錄服務, 因此轉錄服務的獨立性相當重要。 爲了克服上述的困難和限制,我們建議開發一個自成一體的離線廣東話自動語音識別系統, 與及一個廣東話到書面中文的翻譯引擎, 以達到以上所提及的目的。 我們的研發工作涉及: (1) 粵語音頻和譯本的數據收集 (2) 粵語–書面中文平行文集的數據收集 (3) 開發粵語音頻自動語音識別系統 (4) 開發粵語到書面中文的翻譯引擎 (5) 爲整個系統開發用戶界面 |
項目統籌員: | 岑松德博士 |
資助金額: | 港幣兩百七十八萬 |
項目週期: | 2023年9月30日 - 2025年3月31日 |