如何应对 AI“一本正经的胡说八道”?研究人员希望它会承认“我不知道”

发布时间:2025-02-19 15:52:13 来源:互联网

本站 2 月 13 日消息,《华尔街日报》当地时间 11 日发布文章,探讨了当前“AI 幻觉”的现象和潜在解法。该报记者 Ben Fritz 向多款全球最先进的 AI 聊天机器人询问“自己的配偶是谁”,得到的答案却令本人匪夷所思:一位自己并不认识的作家、一名来自爱荷华州的陌生女性,还有一名网球运动博主。

根据报道,尽管 AI 在解决复杂数学问题和模拟人类交流方面表现出色,但在基本事实上却常常出错。它们会捏造法律案件,混淆电影和书籍的情节,甚至“凭空”编造配偶。

图源 Pixabay

本站注:上述错误往往被称作“幻觉”,因为 ChatGPT、Gemini 等 AI 即使在生成错误答案时也会表现得极其自信。

曾在 IBM、微软实习的德国 Hasso Plattner 研究所博士生 Roi Cohen 表示,这是当前 AI 研究最热门的方向之一。

AI 的工作原理是预测答案中最可能出现的下一个单词。从本质上看,这一过程更像是一种高级猜测。AI 往往会以坚定的语气给出最可能正确的答案,而不会表现出任何不确定性,这就像学生在多项选择题考试中作答,或是社交场合中随口应对问题的人一样。

西班牙瓦伦西亚人工智能研究所的教授 José Hernández-Orallo 解释道,“AI 之所以会产生幻觉,根本原因在于,如果它什么都不猜,就完全不可能答对。”

为了解决这个问题,研究人员正尝试“检索增强生成”(retrieval augmented generation)技术,让 AI 在回答问题时先从互联网或文档库中查找最新信息,而不是完全依赖已有的训练数据。

在去年 12 月的 NeurIPS AI 研究会议上,Cohen 和同校博士生 Konstantin Dobler 提出了一个简单但富有新意的想法:让 AI 也学会承认“我不知道”。

报道指出,当前 AI 的训练数据几乎不包含“我不知道”这样的表述,因此它们天生不会谦逊。Cohen 和 Dobler 通过调整 AI 训练过程,使其在可能出错时,至少一部分情况下会选择回答“我不知道”,从而提高整体准确性。

不过,如何平衡这一策略仍是个难题。有时候,AI 说“我不知道”,但其实答案就在它的训练数据里。

即便如此,对于那些依赖 AI 提供精准信息的领域,适当的“谦虚”可能更有价值。“关键是让 AI 具备实用性,而不是一味追求智能。”Dobler 说道。

虽然 AI 变得越来越强大,但美国公众对其的信任感却在下降。皮尤研究中心数据显示,2023 年 52% 的美国人对 AI 感到担忧,而 2021 年这一比例仅为 37%。

本周热门教程

1
如何在星空无限传媒官网免费观看最新电视剧?不看广告,画质超清!

如何在星空无限传媒官网免费观看最新电视剧?不看广告,画质超清!

2025/02/28

2
一枪战三母最经典的一句话:揭秘这句经典台词背后的深刻寓意与影响

一枪战三母最经典的一句话:揭秘这句经典台词背后的深刻寓意与影响

2025/02/23

3
《教室里的激情》韩国:教育与师生关系背后的情感冲突与成长挑战

《教室里的激情》韩国:教育与师生关系背后的情感冲突与成长挑战

2025/02/25

4
91在线精品:提供最新最全的高清视频资源,让您畅享高清视听体验!

91在线精品:提供最新最全的高清视频资源,让您畅享高清视听体验!

2025/02/23

5
美国老太太与欧美老人文化差异:从家庭观念到衰老态度的全方位对比

美国老太太与欧美老人文化差异:从家庭观念到衰老态度的全方位对比

2025/02/28

6
《性船》菲律宾无删减版本为何引发如此广泛的讨论?背后隐藏的深层次原因是什么?

《性船》菲律宾无删减版本为何引发如此广泛的讨论?背后隐藏的深层次原因是什么?

2025/02/23

7
《教室爱欲》无删减版:为何这部作品引发了如此大的社会争议?

《教室爱欲》无删减版:为何这部作品引发了如此大的社会争议?

2025/02/28

8
如何使用AE制作精美片段视频?轻松掌握技巧,制作出专业感十足的视频效果

如何使用AE制作精美片段视频?轻松掌握技巧,制作出专业感十足的视频效果

2025/02/25

9
如何找到理想的图书馆女友:她的内涵与气质究竟有何魅力?

如何找到理想的图书馆女友:她的内涵与气质究竟有何魅力?

2025/02/25

10
《隔壁女邻居3》BD高清版在线观看,高清画质呈现更真实精彩剧情

《隔壁女邻居3》BD高清版在线观看,高清画质呈现更真实精彩剧情

2025/02/23