• 我的订阅
  • 头条热搜
全国政协委员周鸿祎:AI“幻觉”具有两面性
中新网北京3月3日电(记者 谢艺观)“AI‘幻觉’有利于文学创作,但在AI安全方面,‘幻觉’确实会带来严重问题。”全国政协委员、360集团创始人周鸿祎近日在北京接受中新网等媒体采访时谈及AI“幻觉”的两面性。AI“幻觉”...……更多
大幅减缓幻觉 百融云创大模型精度测评结果出炉
...考试”名叫检索增强生成基准测评,这是对大模型处理“幻觉问题”的能力测评,也是对大模型生成内容准确性的测评。尽管大模型带来令人兴奋的技术进步,但“幻觉”一直是制约其发展的主要挑战之一。大模型出现幻觉,轻...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...为科研助手方面非常有前景,但也面临着重大挑战,包括幻觉、过于依赖过时的预训练数据,并且缺乏透明的信息出处,条条对科研领域都是重大弊病。就拿幻觉来说,实验中让GPT-4引用最新文献时,它在CS、生物医学等领域伪...……更多
国网杭州供电公司“光擎”智脑大模型上线助力电网智能化管理升级
...复杂连接关系的理解,难以完成精准数值计算,容易产生幻觉、生成错误信息,且大模型有上下文长度限制,对复杂任务的响应时间过长。这些问题导致通用大模型无法在电网调度等对数据实时性、准确性要求高的场景下直接应...……更多
...八道”,拼凑、嫁接甚至编造事实,这种现象被称为“AI幻觉”。而随着技术的发展,“AI幻觉”的复杂性和隐蔽性也在不断提升。无论是此次数据谣言,还是此前“大妈摆摊卖水果被罚16万元”“被压在地震废墟下的小男孩”等...……更多
专家:openai语音转写工具存在重大缺陷
...家指出,这些生成的文本(IT之家注:业内通常称为“AI幻觉”)可能涉及种族言论、暴力措辞,甚至杜撰的医疗建议。专家们认为,这一问题尤其令人担忧,因为Whisper已被广泛应用于全球多个行业,包括用于翻译和转录访谈内...……更多
错误率从10%降至0.01%,领英全面分享LLM应用落地经验
...估多达 500 个日常对话并获取相关指标:整体质量得分、幻觉率、AI 违规、连贯性、风格等。自动评估工作目前仍在进行中。如果没有自动评估,工程师只能目测结果并在一组有限的示例上进行测试,并且要延迟 1 天以上才能了...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...的回答。因此碰到问题与场景无关时,模型也更容易出现幻觉。这种模型有可能只是记住了正样本对,而非真正地理解被问及的场景、物体、以及具体的指令。 2. 由于在造数据的过程中,人类标注员或者生成式大语言模型是按...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...帮助未来的人工智能模型更加中立和公平,并减少噪音、幻觉和不相关的信息,从而提高训练的效率和模型的准确性。根据已知的信息,草莓计划改进了推理、逻辑以及规划和开展研究的能力,可以让模型自主进行实验、分析数...……更多
...据质量和模型训练等方面的原因,人工智能可能会出现‘幻觉’等问题,生成不准确的回答。因此,对于人工智能提供的建议应保持谨慎态度,结合实际情况进行人工核实和判断,确保建议的准确性和适用性。”娄飞鹏说。业内...……更多
他承认了!“或对特朗普案,有重要影响”!
...AI“一本正经地胡说八道”或“说谎”的现象被称为“AI幻觉”,指模型所具有的一种输出欺骗性数据或没有任何已知事实内容的倾向,很多是由于训练数据错误或不足,以及模型本身的偏见,当前仍未能找到完美的解决方法。...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...提供更多选择。 一家主要保险公司将提供专门的AI风险幻觉保险:genAI对幻觉或错误的倾向改变了风险管理和复杂风险转移策略的计算方式。尽管保险公司一直在努力弥补涉及AI幻觉的保险漏洞,但鉴于genAI的预期增长,先锋保...……更多
Runway开发通用世界模型,想让AI更好地模拟世界
...当我们惊叹于大语言模型竟然能够流畅地与我们对话时,幻觉问题让大模型们时不时“胡言乱语”或“答非所问”的情况也让实际的使用体验大打折扣。而这种问题并不仅仅存在于大语言模型领域,在AI扩图和AI视频生成中也屡...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输...……更多
...提升医患双方对AI技术的信任程度,核心之一在于抑制AI幻觉,即AI生成不准确或误导性信息。”赵鹏分析,AI幻觉产生有很多原因,比如作为概率模型,大模型不可能实现100%精准;在反馈微调过程中,使用者不同的偏好也会带来...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...等模型。尤其在数学问答等方向表现媲美70B参数模型;在幻觉等任务中,Ovis-1.6的幻觉现象和错误率显著低于同级别的模型,展现了更高的生成文本质量和准确性。5、全部开源可商用:Ovis系列模型License采用 Apache 2.0。Ovis 1.0、1.5...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...前插入的特定bug,即CBI(critique-bug inclusion)有没有出现幻觉或者挑剔现象,指出了不存在的问题对整体有用性的主观评级,包含上述内容并考虑风格和整体的实用性在训练CriticGPT的过程中,除了RLHF方法,团队将奖励模型与搜索...……更多
携手全球龙头企业,商汤科技与罗氏诊断达成合作
...信息场景时,常常“掉链子”——答非所问、理解有误、幻觉频发,在体外诊断(IVD)这样对准确性要求极高的行业中,显然难以胜任。针对这一痛点,商汤科技携手全球领先的体外诊断企业罗氏诊断,共同推出面向IVD专业场景...……更多
埃隆・马斯克推出grok聊天机器人
...异之一。然而,就像所有AI聊天机器人一样,Grok也存在“幻觉”问题,即生成包含虚假或误导信息的回应。这种现象在所有大型语言模型(LLM)中都普遍存在,包括ChatGPT。近日,一个Grok尴尬的“幻觉”在社交媒体上引起热议。...……更多
构建数字经济新引擎:枫清科技 高雪峰解读AI技术的未来趋势
...行业场景的落地过程中也暴露出一系列问题,如大模型“幻觉”现象、推理能力不足、解释性差等。这些问题导致很多企业面临大模型“好玩不好用”的困境。如何真正推动大模型技术在企业场景中的深度应用,成为当前AI产业...……更多
...意使用风险。也有业内人士指出,生成式人工智能存在“幻觉”,特别是深度推理模型的逻辑自洽性提升,使得AI生成内容真假难辨。带有算法偏差的虚假信息会被新一代AI系统循环学习,形成恶性循环,影响公众信任和社会稳...……更多
9块9 AI复活亲人 科技奇迹还是情感幻觉
...告别,妄图在生死之间做拉扯。这是一种安慰,还是一种幻觉? 01 AI「复活」故人分几步 用科技复活人类,是科幻电影乃至整个影视界的「超级母题」。 2013 年的科幻惊悚剧《黑镜》第二季的《马上回家》,用一整集展现了 AI ...……更多
江南观察|MCP协议赋能人机协同研究新机遇
...能还未能达到通用人工智能(AGI)的高度,AI起伏不定的幻觉特征与驳杂表现,也让一些研究者心存疑虑。模型上下文协议(Model Context Protocol,MCP)作为AI领域的新技术,提供了一种沟通大语言模型与外部数据及工具之间的联通...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
Apple Intelligence提示词原来是这样,还告诉大模型:别幻觉
...人将选择这些问题的答案,这将有助于减少撰写回复时的幻觉。请输出最佳问题及每个问题的可能答案 / 选项。不要问回复片段中已经回答的问题。问题应简短,不超过 8 个字。答案也应简短,约 2 个字。请以 JSON 格式输出,包...……更多
2024年最重要的趋势,可能影响你的工作
...个重大的技术挑战。(图/unsplash)第二个重大的困境是AI幻觉。因为AI是一种概率模型,所以它不可避免地会出现幻觉。这种幻觉既是好事,也是坏事。好事就是它代表了AI具有想象力和融合性,有组合式创新和增量式创新的能力...……更多
不同量级参数模型性能同样优秀 夸克大模型再登行业评测榜首
...性。在医疗健康领域,夸克大模型已经可以将问答内容的幻觉率降低至5%,处在行业领先水平。夸克推进搜索革新,自研大模型打造技术新底座在互联网高速发展的30余年中,搜索曾经高效地满足了用户主动获取信息的需求。但...……更多
朱啸虎:AI的赚钱风向,彻底变了!
...不容易。为什么AIGC很难落地?最主要就两个问题:一是幻觉问题;二是结果不可控。一旦AI有幻觉就会出错,而且你不知道什么时候会出错,每次结果还都不一样,所以结果不可控。随着大家对幻觉的研究越来越多,发现造成幻...……更多
OpenAI「补票」AI 搜索,SearchGPT 没有野心
...人质疑。尽管生成式搜索被认为是未来的搜索模式,但其幻觉问题仍然限制其发展。当地时间 7 月 25 日,OpenAI 宣布推出由 AI 驱动的搜索引擎 SearchGPT,并开启邀请测试,标志着 OpenAI 正式进军搜索引擎市场,直接对打谷歌、Bing...……更多
AWS搭载“最强大模型”!40亿美元投向OpenAI竞对
...与Claude 2相比,Claude 3最明显的迭代体现在多模态能力、幻觉的降低、长文本能力等方面。例如借助视觉能力,Claude 3可以理解图表、图形、报告等文件,并从中提取数据。▲Claude 3的多模态能力在准确率方面,Claude 3大幅改善了...……更多
更多关于社会的资讯:
长白时评评论员 久泰平到12月7日,为期五天的吉林雪假悄然落幕。不同于寻常假期的匆匆而过,这场以冰雪为主题的专属时光,不仅为孩子们的童年相册添上了斑斓一页
2025-12-07 07:16:00
为进一步贯彻落实习近平文化思想,深化推进“杭州文化研究工程”,12月6日,由浙江大学主办,杭州城市文化研究中心(浙江大学杭州文化研究中心)
2025-12-07 07:21:00
12月6日,从太原市保障性住房开发建设有限公司(以下简称市保障房公司)了解到,12月8日至12月13日,将在小店区长治路109号阳光国际酒店3层阳光厅举行“锦绣汾东”项目的选房活动
2025-12-07 07:32:00
农业银行青州益都支行在下班前五分钟接待了这样一位客户,她手提一兜零钱进入,问工作人员还能不能存上这些零钱,说自己今天来的晚了点
2025-12-07 07:46:00
这两天,踏入杭州市第十二届老年生活博览会的“科技+养老”的特展区,空气里弥漫着一种安静却充满力量的氛围。不再是沉重的负担
2025-12-07 07:52:00
12月5日,2025年度“杭州市诚信艺术机构评选”结果揭晓。经过严格评审,全市共有10家单位荣获“2025年度杭州市艺术品行业诚信艺术机构”称号
2025-12-07 07:52:00
12月6日,“洞天行履——宋人自然秩序的审美转译”第二届宋韵艺术美学论坛暨第十届“两宋论坛”研讨会在中国国际设计博物馆举行
2025-12-07 07:52:00
最近,不少杭州市民收到了这样一条短信:“尊敬的用户,由于业务升级,您之前办理的‘绑卡租车’功能即将在2025年12月底取消
2025-12-07 07:52:00
厦门网讯(厦门日报记者 卫琳)昨日,民建厦门市委召开第十八届中小企业发展年会暨AI赋能生态大会,围绕“智创生态,赋新致远——AI与中小企业创新融合”主题
2025-12-07 08:04:00
剧院“演奏家”进公园 市民现场点歌不亦乐乎
这里没有预告,无需门票,甚至没有一张正式的座椅。在北京紫竹院公园的竹林深处,当熟悉的旋律响起,往来的游客便会驻足,汇聚成里三层外三层的听众
2025-12-07 07:52:00
上门换俩灯泡,收费240元。不久前,消费者张先生预约上门维修服务时的遭遇,让不少网友产生共鸣。便宜材料高价卖,人工费用糊涂账
2025-12-06 07:47:00
“北山街迪士尼”的摩天轮怎么拆了?已运转15年了准备换新
摩天轮全景。记者 顾心言 摄近日有网友在社交平台发帖:“西湖边青少年宫的摩天轮怎么拆掉了?”不少网友跟帖评论:“这个摩天轮
2025-12-06 08:18:00
近日,中国铁路哈尔滨局与沈阳局联合推出旅游计次票。作为东北地区首次推出的15日有效期跨省旅游计次票,通过“高铁+旅游”模式
2025-12-06 08:18:00
12月5日,香港特区政府医务卫生局局长卢宠茂表示,大埔宏福苑火灾所有伤者均已脱离危险期,仍有30人留院。卢宠茂表示,79名伤者已全部脱离危险期,其中49人已出院。
2025-12-06 08:18:00
“最强大脑”齐聚杭州 2025年“院士专家杭州行”圆满举办
院士们观看云深处科技机器人跳舞。记者 江玥 摄12月5日,为期5天的“2025院士专家杭州行”活动在杭州圆满收官。潘云鹤
2025-12-06 08:18:00