• 我的订阅
  • 头条热搜
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...可能由于小数点后数位不同,大模型在比较过程中产生了幻觉。经过两轮提问后,智谱清言给出了正确回答。当记者把问题换成“9.9与9.11谁大”,零一万物的万知大模型等同样在一开始给出错误答案,当记者进一步追问“9.11减9...……更多
共赢生成式AI时代
...界第一个支持流式输出;在同等智能级别,输出最快;在减少幻觉、应对困难开放型问题上,准确度是ClaudeAI2.1的两倍;更好的开箱即用体验,无需过多优化提示词,拒绝率更低。ClaudeAI3推出了三个模型High(最快)、Sona(性能与功能平衡)、Opu...……更多
AI落地之夜,聊聊要未来的爆发还是要当下的效果|阿里云创业者社群
...里的落地能力。但目前技术仍然不够稳定。GPT4仍然存在幻觉问题,GPT5泛化能力、模型解决复杂任务的能力在提升,但尚未确定推出时间。更重要的是,中国大模型还在追赶的路上,目前国内的头部模型,只能在部分性能上比肩G...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...的风险挑战。除了这两个例子以外,多模态大模型还存在幻觉、偏见、隐私泄漏等各类安全威胁或社会风险,会严重影响它们在实际应用中的可靠性和可信性。这些漏洞问题到底是偶然发生,还是普遍存在?不同多模态大模型的...……更多
...并不准确,只能作为诊断的参考,甚至可能出现一些“AI幻觉”,最终的诊断还是要靠医生。基于大模型出具的所谓“处方”到底有多大的可信度?同样是使用DeepSeek,医生和患者看到的“处方”是否一样?成伟从技术层面给出...……更多
chatgpt引爆新一轮人工智能革命代表事例
...聪明又无脑的人类模仿者,它们的结果输出只是一种数字幻觉。已经有迹象表明,该技术可能产生看起来可信但并不值得信赖的结果。例如,去年底,Facebook母公司Meta展示了一个名为Galactica的生成式系统,该系统使用学术论文作...……更多
...确性与可靠性,问答准确率高达92%,有效解决大模型的“幻觉”问题。系统支持腾讯混元、DeepSeek等多种AI引擎,为企业提供灵活的技术选择。该平台支持PDF、Word、Excel、CSV、PPT、TXT等多种文档格式的深度解析,具备先进的视觉AI...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...更快的推理速度; 此外,Memory3 提高了事实性并减轻了幻觉,并能够快速适应专业任务。方法介绍记忆电路理论有助于确定哪些知识可以存储为显式记忆,以及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作...……更多
...融入到科学思想的碰撞中。” 近未来型脑洞:“大模型幻觉”何解大模型是当下正火的AI概念。但大模型普遍存在“一本正经地胡说八道”的现象,这被称为“大模型幻觉”。在知乎上就有这样一个问题:当大模型幻觉完全消...……更多
李彦宏再谈开源:开源模型是智商税,永远应该选择闭源模型
...。问:在金融、医疗等这些比较严谨的领域,生成式AI的幻觉问题,怎么破解?李彦宏:今天,应该说你会很少发现幻觉问题了,尤其是用最大规模、最强大模型的时候,已经很少出现幻觉问题了。为什么呢?一开始,纯粹用原...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...域任务,但经过分析,该模型还可能产生大量错误信息或幻觉信息,并且无法进行自我纠正。因此,作者提出要在这一阶段通过更强模型的反馈来纠正模型内部的错误知识,进一步提升模型领域性能。他们参考 StaR [1] 迭代式训...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...效运行。 开悟大模型智能应用中台针对大模型应用中的幻觉问题及与业务系统的对接难题,提供了一个便捷的模型应用构建环境。该平台优化了客户本地数据与大模型的结合方式,以更好地发挥数据的价值,并支持各类自有数...……更多
...实际使用中特定场景下,每次输入文字量有限,且出现“幻觉”的情况也有发生。张时佳强调,目前使用结果来看,大模型并非万能的,还需要工作人员进行把关。辽宁省12345热线平台技术部部长 张时佳:话务量增长是非常快的...……更多
云计算一哥终于搞多模态了:一口气6个大模型,还有个3nm芯片!
...排。最后,也是更为重要的一点,便是防止大型语言模型幻觉导致的事实错误的功能——自动推理检查(Automated Reasoning checks),这是Amazon Bedrock Guardrails中新增的一项功能。这种新的防护措施,旨在通过数学验证来确保LLMs生成...……更多
...统化、可传承化。但同时,必须认识到算法可能存在的“幻觉”或偏见,尤其在关乎生命健康的医疗场景中,安全性始终是第一原则。二、技术路径:大模型与经典算法,各有千秋、互补共进大模型技术具备强大的自然语言理解...……更多
调用量激增约30倍!文心大模型火了,李彦宏:AI应用将迎爆发期!
...去两年来,AI行业发生的最大的变化是大模型基本消除了幻觉,让AI从“一本正经地胡说八道”变得可用、可被信赖。基于技术的快速迭代,李彦宏判断,AI应用即将迎来爆发期。作为一家深耕AI领域长达10年,投入超过1700亿的科...……更多
如何跑赢生成式AI竞赛?云计算大厂揭秘组合拳:自研大模型只是开胃菜
...能,你可以限制AI应用只在特定领域回答问题。针对模型幻觉问题,可行技术之一是自动推理,亚马逊云科技在诸多幕后服务中都运用了该技术。这是一种能够从数学角度证明某事正确的AI形式,通常被用于验证系统是否按照既...……更多
Nature重磅:击败人类数学家,AI首次攻破经典数学难题
...大型语言模型(LLMs)与自动“评估器”配对,从而防止幻觉和错误想法。通过在这两个组件之间来回迭代,最初的解决方案会演变成新的知识。这项研究首次利用了 LLMs 在挑战科学或数学中的开放问题。FunSearch 发现了上限集问...……更多
大模型应用疯狂加速,洗牌却在静悄悄进行了
...自身的技术能力,保证正确答案的输出。 与业界消除“幻觉”的通用做法不同,混元大模型并没有为大模型增加搜索或者知识图谱等外挂,而是从源头上解决问题。具体来说,混元大模型从第一行代码开始,就采用了预训练阶...……更多
LLM数学性能暴涨168%,微软14人团队力作!合成数据2.0秘诀曝光,智能体生成教学
...基准的性能。另外,通过 AgentInstruct 方法,成功地将模型幻觉减少31.34%,同时达到了与GPT-4(教师)相当的质量水平。表8显示了使用/不使用RAG的MIRAGE上所有模型的结果。总之,AgentInstruct生成教学方法,为模型后训练生成大量多...……更多
当一个清华教授问AI觉得自己革了谁的命
...越来越重要教育领域对准确性和可靠性的需求极高,AI的幻觉率问题可能会影响教材内容的质量和学习效果。教育系统可以加入关于信息识别、批判性思维和数据素养的课程,以帮助学生识别和处理潜在的错误信息每个独立的个...……更多
史上最严中文真实性评估:OpenAI o1第1豆包第2,其它全部不及格
...会产生错误输出或缺乏证据支持的答案,这就是所谓的“幻觉”问题,极大地阻碍了通用人工智能技术(如大语言模型)的广泛应用。此外,评估现有大语言模型的真实性能力也颇具难度。例如,大语言模型通常会生成冗长的回...……更多
数势携手百川发布大模型联合解决方案,推动中国大模型价值落地
...应用方面,百川智能认为搜索增强是关键,能够有效解决幻觉、时效性差、专业领域知识不足等阻碍大模型应用的核心问题。一方面,搜索增强技术能有效提升模型性能,并且使大模型能“外挂硬盘”,实现互联网实时信息+企...……更多
NeurIPS | 消除多对多问题,清华大规模细粒度视频片段标注新范式
...用大模型技术实现这一过程?(2)研究证明大模型存在幻觉问题,如果利用大模型进行标注,如何设计一种方法保证标注数据的质量?为此,该研究设计了自动细粒度视频标注系统 VERIFIED(图 1 (c)),通过大模型生成富含静态...……更多
大模型、物联网平台国际先进!浪潮智能生产两项成果通过科技评价
...)、提示词优化、智能体构建等核心技术,有效降低模型幻觉率、提升场景适配精度。产品层面已打造智能体矩阵,通过数据采集、知识提炼到智能决策的闭环设计,解决制造企业智能化升级中的关键技术难题。目前,智产大模...……更多
齐鲁医院发布国内首个心肌病专科大模型
...达基于大模型技术打造的医学循证推理引擎,已成功地将幻觉问题控制在了医疗级安全阈值内,打破了生成式AI信任壁垒,“齐鲁·心智”大模型将实现医生与AI助手的双向进化、人机协同,让模型在千万次临床实践中学习医生的...……更多
智慧芽发布AI助手“芽仔-生物医药”,大模型革新信息检索模式
...医药创新场景的能力已超越通用大模型,并能有效减少‘幻觉’。基于该大模型推出的‘芽仔-生物医药’,不仅能显著提升效率,更将凭借其强大的知识整合与分析能力,提供全面、精准的情报洞察,助力药企加速新药和新疗...……更多
连发两款模型“补课”,百度AI成色如何?
...多个层面的技术优化,包括注意力机制、模型架构、模型幻觉等方面。据介绍,文心4.5采用自研的FlashMask动态注意力掩码,降低了计算冗余和存储开销,可提升模型长序列建模能力和训练效率,优化了长文处理能力和多轮交互表...……更多
大模型成私人导游,一键规划Citywalk,港大MIT联合出品
...、POI距离过远的情况。除了这个例子外,GPT有时还会出现幻觉,生成不存在的POI。 概括而言,ITINERA具有以下特色:动态信息:实时更新POI和当前热门活动 个性定制:优先考虑个人喜好而非仅考虑热门景点 多样约束:灵活应对...……更多
国内首个!中关村科金发布企业知识大模型
...判断三个层面,在他看来,目前大模型最为人诟病的是有幻觉问题,对低频常理的事实回答得不好,经常被人们认为一本正经的胡说八道,但可以通过一些其他的手段解决。比如,外挂一些知识库或者符号推进引擎,解决事实判...……更多
更多关于科技的资讯:
河北日报讯(张晓超、李娜)11月19日,辛集市教育北路高架桥上空,一架搭载高清摄像头与专业传感器的无人机缓缓升空,按照预设航线开展桥梁日常检测
2025-12-05 14:56:00
烟台南山学院斩获省部级科技奖荣誉
近日,2025年度中国纺织工业联合会科学技术奖励大会在北京人民大会堂隆重召开。烟台南山学院“针织经编一体成型3D智能织造关键技术及应用”项目斩获“技术发明奖二等奖”
2025-12-05 15:00:00
盐城盐都:“芯”智散热赋能 科创驱动前行
江南时报讯 以科创破局散热赛道,以匠心赋能产业升级。乘着聚焦“3+3”产业体系、培育新兴产业的发展浪潮,盐城市盐都区已在第三代半导体多个细分领域形成显著集聚优势
2025-12-05 15:07:00
中新建电力集团发电产业:智慧电厂新蓝图
近日,中新建电力集团天河热电分公司与上海电气集团举行了一场关键的技术交流会。会议聚焦于天河热电的智慧化升级,上海电气团队在会上系统性地展示了其先进的智慧电厂整体架构规划
2025-12-05 15:09:00
日前,建行河北省分行2025年“人工智能+”劳动技能竞赛顺利结束。全省共有111支队伍选送90项作品参加初赛,经过严格的初审选拔
2025-12-05 15:09:00
全国首台套!助力煤矸石全量高值转化
12月1日,由中能建装配式建筑产业发展有限公司投资建设运营的山西大同千万吨级煤矸石综合利用新技术示范项目陶粒中试线成功建成投运
2025-12-05 15:10:00
如何“反内卷”?54.5%职场人将“优化薪酬激励机制”列为首选
什么是“好工作”?工作有哪些特质会让员工有“好”感受?日前,智联招聘通过问卷调研的方式,对平台用户展开调研,回收3525份有效样本
2025-12-05 15:26:00
国航举办“国航+”生态主题发布会
海外网北京12月5日电(记者严冰)12月5日,中国国际航空股份有限公司(以下简称“国航”)在北京举办“云端无界 凤启耀星河——‘国航+’生态主题发布会”
2025-12-05 15:33:00
乐购房山│实惠购—荟品仓城市奥莱北京首店盛大开业!
12月5日,国内仓储式品牌特卖开创者荟品仓,在房山区瑞来广场盛大开业,带来北京首家城市奥莱门店。近1万平方米超大空间、300+全球知名品牌及1-3折极致折扣
2025-12-05 15:55:00
易生支付“智慧分账”赋能安心鲜生 驱动社区零售全国布局
在社区零售数字化转型加速深化的背景下,易生支付与“社区新零售”新兴企业陕西安心鲜生正式达成合作。依托易生支付的深厚技术积淀与成熟系统能力
2025-12-05 16:09:00
ED用药怎么选?金钢鸟领衔西地那非口崩片品牌阵营,购买渠道全解析
第91届全国药交会上,金鸿药业金钢鸟枸橼酸西地那非口崩片的亮相,让“枸橼酸西地那非品牌选择”“哪里有售”等问题成为行业热议焦点
2025-12-05 16:09:00
苏州黄埭镇推动“产学研”深度融合
江南时报讯 日前,苏州冠鸿智能装备有限公司与中南大学计算机学院“跨界”合作,联合启动轮式双臂机器人研发项目,致力于推动创新成果向现实生产力加速转化
2025-12-05 16:13:00
近邻碰碰:以 “邻里经济”打造智慧社区消费新生态 —— 专访小门神传媒科技集团董事长付信中
鲁网12月4日讯“远亲不如近邻”,这句家喻户晓的俗语,如今被小门神传媒科技集团董事长付信中赋予了全新的商业内涵。由其集团研发推出的近邻碰碰 AI 智慧惠民设备
2025-12-05 16:47:00
今年双十一,A4纸大小的巨型吊牌成为女装电商的“标配”。这种硬材质、高存在感的“防白嫖神器”,在社交平台引发热议,同时也揭露了线上服装行业的信任危机
2025-12-05 17:00:00
龙岩联通“5G+AI+无人机”项目荣获第八届“绽放杯”5G应用征集大赛全国优秀奖
东南网龙岩12月5日讯(通讯员 曹可煊)近日,第八届“绽放杯”5G应用征集大赛全国赛圆满落幕。龙岩联通为华电连城风电打造的“智驭低空——构建‘5G+AI+无人机’绿电智能运维新范式”项目
2025-12-05 17:16:00