ChatGPT的广东话“讲唔正”,只因为技术限制吗?|端闻 Podcast

我们听到的 AI 口音,它展现的不是直接的现实,而是权力的现实。
OpenAI 开发的人工智慧对话模型ChatGPT。摄:Florence Lo/Reuters/达志影像
端传媒八周年 异乡人 端闻 | 新闻播客 香港 人工智能 发展 电影 科技 语言 音乐

端闻 podcast 的报导和制作都依赖端传媒会员的订阅付费支持。如果你喜欢我们的播客报导,请成为端传媒会员,支持我们持续产出,也让更多人透过音频获取深度报导和多元观点。

立即订阅,可享端闻听众特别优惠:畅读月费会员9折畅读年费会员85折尊享年费会员8折

收听并关注“端闻”YouTube | Apple Podcasts | Spotify 或使用节目的 RSS Feed,在任意播客应用订阅收听。

2023年9月,OpenAI 首次推出了 ChatGPT 的语音功能,开放用户以语音与人工智能模型对话。然而,此功能在广东话方面存在明显问题。许多广东话使用者测试后发现,除了发音不准确,ChatGPT 的广东话表现出普通话的特征。

对此,语音合成系统开发者黄冠能认为,尽管语音合成技术已相对成熟,但由于市场需求与经济效益的考量,广东话一直未能受到应有的重视。香港中文大学电子工程系教授 Tan Lee 则表示,ChatGPT 的广东话表现,反映的是投入资源的问题。

目前,整个人工智能世界依然以英语为主导。在谈论自然语言时,指的其实是英语,这使得未来人类与机器交互的主要语言为英语。然而,从数据上看,英语在全球的使用比例远低于其在互联网上的文本比例。这说明技术放大了全球的权力不平衡。

此外,OpenAI 的公开信息也越来越少,导致外界无法理解其偏差的产生过程,从而无法进行监督和校正。

本期“端闻”,端传媒国际组主编陈婉容和特约撰稿人 Anita 分享她们对这一现象的观察与分析,展示了技术原理的演进,并揭示了AI 语音技术在处理低资源语言时所面临的挑战。

期待你跟我们分享想法,邮箱地址:podcast@theinitium.com


【制作团队】

出品:端传媒音频

监制:甯卉

主持:杨静

编辑:HY

制作人:陈莉雅

剪辑、声音设计:王伯维,“缰河媒体工作室”、Alex Sun、李白

主题音乐:Axel Kacoutié

读者评论 1

会员专属评论功能升级中,稍后上线。加入会员可阅读全站内容,享受更多会员福利。
  1. 这个topic之前是不是有做过文字版新闻?