每日新讯网
网站首页 时代探索每日新讯新讯视评视觉聚焦社会热点发展论坛民生观察 成为会员
图闻纪实诗坛荟萃焦点网谈探索创新热点追踪每日瞭望新锐观点地方风采监督与法印象中国新讯视窗关注民生人民视点社会纵横法治前沿快闪中国深度观察生态环境关于我们免责声明联系我们 人员查询
  • 浙江
  • 新疆
  • 内蒙古
  • 吉林
  • 重庆
  • 辽宁
  • 贵州
  • 四川
  • 海南
  • 云南
  • 福建
  • 台湾
  • 江西
  • 湖南
  • 湖北
  • 河南
  • 广西
  • 江苏
  • 安徽
  • 山东
  • 青海
  • 甘肃
  • 陕西
  • 山西
  • 河北
  • 黑龙江
  • 天津
  • 上海
  • 北京
  • 广东
  • 宁夏
  • 西藏
每日新讯网 > 焦点网谈 > 生成式AI“幻觉”困境如何破解

生成式AI“幻觉”困境如何破解

来源:中国青年网 | 时间:2025-02-01 17:17:08 | 点击:636

人工智能(AI)技术正以前所未有的速度发展,生成式AI凭借其惊人的创造力,不断刷新人们的认知。然而,即便是看似“聪明绝顶”的AI,也难逃“幻觉”的困扰。这里的“幻觉”,指的是AI生成看似合理但实际不准确或虚假的信息。

英国《自然》杂志网站在1月22日的报道中指出,AI“幻觉”可能会引发严重后果,科学家正各出奇招,力求降低其发生率。这些措施包括增加事实核查、对AI进行“脑部扫描”等,以促进AI的健康、高效发展。

主因是数据模糊

各种生成式AI,包括由大语言模型驱动的聊天机器人,常常会编造信息。它们有时会模糊事实与虚构,在看似真实的陈述中夹杂错误信息。这既是其创造力的体现,也是其不足之处。

美国佐治亚理工学院理论计算机科学家桑托什·威姆帕拉解释称,大语言模型的设计原理并非输出准确事实,而是通过模式识别生成答案。其内部复杂的运行机制迄今仍像一个“黑匣子”,人们难以洞悉其推理过程。

美国加州Vectara公司旨在减少生成式AI的“幻觉”。其联合创始人阿姆尔·阿瓦达拉表示,在训练过程中,这些模型会压缩数万亿个单词间的关系,随后通过一个庞大的网络模型重新展开这些信息。尽管这些模型能够重构出接近98%的训练内容,但剩下2%的内容却会让其“误入歧途”,生成不准确或虚假信息。

导致AI出现“幻觉”的原因多种多样,其中训练数据中的模糊性和错误是常见因素。也有人认为,即使训练数据准确无误,AI也有可能产生“幻觉”。这种现象与某一事实的稀缺程度密切相关。因此,即使经过人类反馈调整过的聊天机器人,也无法完全避免出错。

多领域面临考验

AI的“幻觉”可能会给人们的工作和生活带来较大影响。

在新闻领域,大语言模型可能生成虚假新闻事件,扰乱信息传播秩序,误导公众认知。Vectara公司针对文档内容开展的研究表明,一些聊天机器人编造事实、虚构信息的几率高达30%。世界经济论坛发布的《2025年全球风险报告》显示,错误和虚假信息是2025年全球面临的五大风险之一。

在法律领域,它可能引用虚构的法律条文和案例。比如,2023年美国律师史蒂文·施瓦茨就因“轻信”ChatGPT,在法庭文件中引用了并不存在的法律案例。而在医学领域,它可能提供错误的诊断和治疗建议,危及患者生命。

《自然》在报道中指出,AI“幻觉”在科学参考文献方面出现错误的情况也极为普遍。2024年的一项研究发现,各类聊天机器人在提及参考文献时的出错率在30%至90%之间。它们至少会在论文标题、第一作者或发表年份上出现偏差。虽然聊天机器人都带有警告标签,提醒用户对重要信息进行二次核实。但如果用户对聊天机器人的回复深信不疑,可能会引发一系列问题。

多举措减少“幻觉”

为进一步提升AI的精确度,科学家正想方设法降低其“幻觉”。

例如,增加模型训练参数和训练时长可有效减少“幻觉”。但这种方法需要付出高昂的计算成本,并可能削弱聊天机器人的其他能力,如机器学习算法对未知数据的预测和处理能力。

此外,使用更大、更干净的数据集进行训练,也是降低AI模型“幻觉”出现的有效途径。然而,当前可用数据的有限性限制了这一方法的应用。

检索增强生成(RAG)技术也为减少AI“幻觉”提供了新思路。该方法通过让聊天机器人在回复问题前参考给定的可信文本,从而确保回复内容的真实性,以此减少“幻觉”的产生。在医疗和法律等需要严格遵循经过验证的知识的领域,RAG技术备受青睐。

不过,美国斯坦福大学计算机科学家米拉柯·苏兹根表示,尽管RAG能提升内容真实性,但其能力有限。苏兹根团队的研究表明,一些为法律研究开发的、号称“无幻觉”的RAG增强模型虽有所改进,但仍存在不足。

开发者也可以使用一个与AI训练方式不同的独立系统,通过网络搜索对聊天机器人的回复进行事实核查,谷歌的“双子星”系统便是一个典型例子。该系统提供了“双重核查响应”功能:内容如果突出显示为绿色,表示其已通过网络搜索验证;内容如果突出显示为棕色,则表示其为有争议或不确定的内容。但是,这种方法计算成本高昂且耗时,而且系统仍会产生“幻觉”,因为互联网上错误信息泛滥。

在去年6月出版的《自然》杂志上,英国牛津大学科学家刊发论文称,他们利用“语义熵”,通过概率来判断大语言模型是否出现了“幻觉”。语义熵是信息熵的一种,被用于量化物理系统中所包含的信息量。通过评估AI模型在特定提示词下生成内容的不确定性,来计算模型的困惑程度,从而为用户或模型提供警示,提醒其采取必要的循证措施,确保更准确的答案输出。

美国卡内基梅隆AI研究人员安迪·邹采用的方法是在大语言模型回答问题时,绘制其内部计算节点的激活模式。他形象地称之为“给AI做脑部扫描”。利用不同的计算节点活动模式,可以告诉我们AI模型是在“说真话”,还是在“胡说八道”。(记者 刘 霞)

责任编辑:蒋宇骏


【作者:】

文章评论
评论
全部评论
更多推荐

全国人大代表、商丘市第一人民医院重症医学科主任陈培莉:以医者初心守护百姓健康

每日新讯网  商丘日报融媒体记者 李岩      全国两会期间,全国人大代表,商丘市第一人民医院重症医学科主任陈培莉,带着临床一线的救治故事与基层调研心声,聚焦医疗卫生强基工程与重症医学科建设,讲述基

书法家--李鑫华纪念中国抗日战争暨世界反法西斯战争胜利80周年举行线上书法展

每日新讯网   袁志华      李鑫华一一一正阳书家(北京中轴线上的书法家)李鑫华,1956年元月北京生人。中国教育科学研究院研究员(正高级)。 教育部全国书法艺术教育指导委会委员。  &

谷爱玲U型场地决赛 因为天气原因被迫推迟

每日新讯网  刘铮.编辑:王云

袁雨亭桐柏山行医赋·并序

每日新讯网  文/王九峰      袁雨亭公,于公元1928年出生在商丘柘城,累世悬壶,堪称歧黄世家。公自幼饱受熏陶,立志做名医生,少年时期便追随父祖习医乡里。1948年柘城解放,县人民医院宣告成立。

国家大剧院新年音乐会交响乐《红旗颂》

每日新讯网 王云.国家大剧院新年音乐会交响乐《红旗颂》编辑:王云

特朗普:“无论难易”都要得到格陵兰岛

央视网消息:在袭击委内瑞拉之后,美国政府近期持续发表要得到格陵兰岛的言论。当地时间9日,美国总统特朗普又发表言论称,美国需要得到格陵兰岛。现阶段他尚未考虑“购买”格陵兰岛的资金问题。他希望以“容易的方式”达成交易,但如果...

一声轰鸣划破云霄一飞冲天 解锁歼-20十五载砺剑长空非凡征程↓

央视网消息:2026年1月11日是歼-20战机首飞15周年的日子。2011年1月11日,歼-20战机成功首飞,标志着中国空军正式迈入“隐身时代”。15年来,歼-20战机从技术验证走向实战化演训,从单机飞行走向体系化作战,...

小西天文物亮相国家典籍博物馆 部分为首次对外展出

“既往未来——小西天文物撷珍与悬塑艺术特展”日前在国家典籍博物馆拉开帷幕,其中部分碑刻、造像、典籍均是首次对外展出。  山西隰县小西天是《黑神话:悟空》的热门取景地,因保存1978尊明代塑像闻名。现场50组84件珍贵文物...

津巴布韦强降雨已致61人死亡

新华社哈拉雷1月7日电(记者许正)津巴布韦民防部门官员7日接受新华社记者采访时说,该国自去年10月进入雨季后遭遇连续强降雨,目前已造成61人死亡、10人受伤。  民防部门说,尤其在圣诞和新年假期期间,该国多地强降雨持续,...

因数据造假 日本继续暂停对滨冈核电站重启审查

  △日本滨冈核电站(资料图)  有关日本中部电力公司疑似在滨冈核电站3号和4号机组(静冈县)重启审查中,蓄意低估作为抗震设计大致标准的“基准地震动”问题,1月7日,日本原子能规制委员会就继续暂停重启审查达成一致。  日...

2025
02/01
17:17
浏览量: 636
大字号
分享
今日热点
2024台北国际旅展开幕

2024台北国际旅展开幕

共绘亚洲品牌新蓝图 ——第19届亚洲品牌盛典在北京举行

共绘亚洲品牌新蓝图 ——第19届亚洲品牌盛典在北京举行

"扁担电工"担起乡亲情

"扁担电工"担起乡亲情

豫东枢脉﹒通联天下——商丘市物流业“十五五”发展展望

豫东枢脉﹒通联天下——商丘市物流业“十五五”发展展望

活“荔”湾区  共赢未来

活“荔”湾区 共赢未来



友情链接

  • 人民网
  • 中国经济网
  • 中国警察网
  • 中国长安网
  • 新华网
  • 中国台湾网
  • 中国政府网
  • 光明网
  • 求是网
  • 中国经济网
  • 中国新闻网
  • 每日新闻网
  • 央视网
  • 法制网
  • 中国青年网
  • 关于我们         联系我们         免责声明         人员查询

    • 扫码看全网内容

    地址:北京石景山区古城南街9号院绿地环球文化城6号楼18层1828 联系电话:微信连线:13601098485 18611141167
    网站备案/许可证工信部:京ICP备2026003365号-2 京公网安备11010702003003号
    每日新讯网www.everydaynews.com.cn 统一社会信用代码:91110102MA0093EQ6R
    广播电视节目制作、互联网文化活动、软件开发与数据处理 电影电视剧摄制与发行、电脑动画设计、音像制品制作 常年律师顾问:北京赢和律师事务所