物流及供应链多元技术研发中心 > 研发范畴 > 项目资料库
项目资料库
项目编号: ITP/054/19LP
项目标题: 服务机器人自适应语音定位系统
研发单位: LSCM 研发中心
概要: 可靠的语音识别是服务机器人至关重要的功能。项目的主要目标是开发基于视觉的波束形成器技术,并实现实时高质量的语音采集。通过视觉信息构建立体面部模型,并且可以定位嘴部位置。
波束形成器基于立体角和距离信息, 优化采集口部位置声音。关键研究方向是实现视音频同步和语音处理。针对立体图像特征,可以重构深度点云。进一步运用深度相机作为冗余传感器,以适应不同应用场景。波束形成器调整有限脉冲响应(FIR)滤波器系数,并使阵列模式优化, 采集坐标。
技术核心问题是建立对准与波束形成器滤波器系数和图像帧,重点研究校准算法以实现视觉音频同步。通过使用服务机器人平台
进行系统整合和性能演示。
项目统筹员: 黎振伟先生
资助金额: 港币二百七十九万
项目周期: 2020年2月24日至2021年5月16日
  1. Print
  2. Share
  • Next
  • Previous
  • Back to List