项目编号: | ITP/030/23LP |
项目标题: | 广东话和英语转录与及书面翻译 |
研发单位: | LSCM 研发中心 |
概要: | 近年来, 随着媒体联络、新闻、数码新闻和社交媒体对粤语转录的需求日益增加, 一个稳定和有系统的的转录服务对于减轻人类转录者的负担和提高其生产力至关重要。一直以来, 转录都不是一件容易的事。不同的转录人员对需要转录的材料会有不同的观点和理解, 导致转录结果出现不同程度的差异。更糟糕的是, 粤语对话偶尔会夹杂英语, 这增加了转录任务的复杂性。更重要的是, 转录和翻译材料的保密性亦必须考虑。在这种情况下, 用户不能依赖第三方的在线转录服务, 因此转录服务的独立性相当重要。 为了克服上述的困难和限制,我们建议开发一个自成一体的离线广东话自动语音识别系统, 与及一个广东话到书面中文的翻译引擎, 以达到以上所提及的目的。 我们的研发工作涉及: (1) 粤语音频和译本的数据收集 (2) 粤语–书面中文平行文集的数据收集 (3) 开发粤语音频自动语音识别系统 (4) 开发粤语到书面中文的翻译引擎 (5) 为整个系统开发用户界面 |
项目统筹员: | 岑松德博士 |
资助金额: | 港币两百七十八万 |
项目周期: | 2023年9月30日 - 2025年3月31日 |