物流及供应链多元技术研发中心 > 研发范畴 > 项目资料库
项目资料库
项目编号: ITP/051/23LP
项目标题: GPT 安全测试平台
研发单位: LSCM 研发中心
概要: 使用 GPT 的担忧之一是它可能会受到攻击而产生恶意内容,从而导致错误讯息的传播、舆
论操纵和诈欺。 在这个专案中,我们强调测试平台在满足基于人工智慧的模型的安全需求
方面的重要性。 该计画建议专门针对 GPT 攻击创建测试平台。 探索的一种重要攻击技术是
提示注入,其中精心设计的提示操纵 GPT 忽略指令或执行意外操作。 尽管正在发现有关攻
击技术的新研究,但针对即时注入攻击的防御仍处于早期阶段。 该计画的另一个建议是开
发评估框架来衡量即时注入攻击的影响、成功机率和加权弹性得分。 可交付成果包括攻击
资料集的建构、每次攻击的平均影响指标的测量、攻击成功机率的计算以及加权弹性分数
的确定。 此外,我们还将评估 3 种常见的 GPT 模型,包括不同国家开发的线上版本和在地
化版本。
项目统筹员: 岑松德博士
资助金额: 港币二百七十九万
项目周期: 2024年2月1日 - 2025年1月31日
  1. Print
  2. Share
  • Next
  • Previous
  • Back to List