• 我的订阅
  • 头条热搜
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...在人工智能领域,大型预训练模型(如 GPT 和 LLaVA)的 “幻觉” 现象常被视为一个难以克服的挑战,尤其是在执行精确任务如图像分割时。然而,最新发表于 NeurIPS 2024 的研究《Leveraging Hallucinations to Reduce Manual Prompt D……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...的风险挑战。除了这两个例子以外,多模态大模型还存在幻觉、偏见、隐私泄漏等各类安全威胁或社会风险,会严重影响它们在实际应用中的可靠性和可信性。这些漏洞问题到底是偶然发生,还是普遍存在?不同多模态大模型的...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...着模态的增加,输入输出空间的分布更加广泛,并增加了幻觉现象,使得全模态对齐变得更加复杂。在不到两周的时间内,北大对齐小组基于 Llama-3.2-Vision 的 11B 预训练版本进行后训练 (Post-Training) 对齐微调得到 Beaver-Vision-11B,...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...关性,以此可以做更好的语义计算和语义的召回。大模型幻觉也是阻碍应用的关键挑战之一。那么,引入了 RAG、知识库之后,大模型就能解决幻觉问题了吗?其实不然,而且有些幻觉问题不仔细观察便难以察觉。举个例子,比...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...等模型。尤其在数学问答等方向表现媲美70B参数模型;在幻觉等任务中,Ovis-1.6的幻觉现象和错误率显著低于同级别的模型,展现了更高的生成文本质量和准确性。5、全部开源可商用:Ovis系列模型License采用 Apache 2.0。Ovis 1.0、1.5...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...推出一项创新性研究,旨在防止大型AI模型被恶意应用于有害任务。他们提出了一种名为“自毁模型”的新技术,通过这一方法,即使大型模型是开源的,也可以在面对有害任务时自动降低其性能,从而抵制恶意滥用。研究人员...……更多
李彦宏:大模型已基本解决幻觉问题 发布两大“超级有用”AI技术
...24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“...……更多
当一个清华教授问AI觉得自己革了谁的命
...越来越重要教育领域对准确性和可靠性的需求极高,AI的幻觉率问题可能会影响教材内容的质量和学习效果。教育系统可以加入关于信息识别、批判性思维和数据素养的课程,以帮助学生识别和处理潜在的错误信息每个独立的个...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...包括三个阶段:研究思路生成、实验实现和实验执行。该框架在多项机器学习任务中有效促进了研究进展。源代码链接:https://github.com/du-nlp-lab/MLR-Copilot 论文链接:https://arxiv.org/pdf/2408.14033 Demo 链接……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...如图1(c)所示。然而,作者发现重叠切分策略引入了某些幻觉,导致性能下降而不是提高。方法思路作者提出了Mini-Monkey,一个轻量级的多模态大型语言模型,旨在减轻切分策略引起的锯齿效应。方法框图如图2所示。图2裁切在文...……更多
如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
...al Grounding 的新功能,可以通过语境分析降低 75% 的大模型幻觉的产生。应用层则定位于企业级生成式 AI 助手,核心产品是 AI 助手 Amazon Q 为核心的一系列开箱即用 AI 应用集合。这一层主要针对有大模型使用意愿,但不想投入过...……更多
国内首个!中关村科金发布企业知识大模型
...判断三个层面,在他看来,目前大模型最为人诟病的是有幻觉问题,对低频常理的事实回答得不好,经常被人们认为一本正经的胡说八道,但可以通过一些其他的手段解决。比如,外挂一些知识库或者符号推进引擎,解决事实判...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...将面临挑战。此外,大模型的商业化进程相对滞后,而高幻觉率的存在也给产业应用带来隐患。面对这些挑战,何晓冬博士提出,让大模型在产业中先行先试,是推动技术生态良性发展的有效途径。在此背景下,据介绍,京东在...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...续并加强了小钢炮系列最强端侧 OCR 能力的传统优势。在幻觉评测榜单Object HalBench上,MiniCPM-V 2.6 的幻觉水平(幻觉率越低越好)优于GPT-4o、GPT-4V、Claude 3.5 Sonnet 等众多商用模型。实时视频理解,首次上端!睁开端侧「眼睛」,...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...400K LRV-Instruct 数据集,分别用于学习视觉指令跟随和减轻幻觉。需要注意的是,减轻幻觉在机器人场景中起着重要作用,因为机器人 MLLM 需要基于真实场景生成任务规划,而不是想象中的场景。例如,现有的 MLLMs 可能公式化地...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...效运行。 开悟大模型智能应用中台针对大模型应用中的幻觉问题及与业务系统的对接难题,提供了一个便捷的模型应用构建环境。该平台优化了客户本地数据与大模型的结合方式,以更好地发挥数据的价值,并支持各类自有数...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
【新智元导读】DeepMind最近的研究提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多种任务上的表现,增强了模型的泛化性和鲁棒性,为实现更类人...……更多
信号表征指数级强、内存节省35%,量子隐式表征网络
...阴影区域表示高频误差。最新的研究引入了一个突破性的框架将隐式神经表征扩展到图像生成。更具体地说,该框架利用以随机分布为输入的超网络来生成隐式表征网络的参数。随后,这些生成的参数被分配给隐式表征网络。最...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...进行了升级。同时,vivo为三方开发者构建了连接服务的框架和平台,让人找服务的同时,服务也主动匹配人的需求。另外,vivo构建了个人智能系统框架,通过本地化知识图谱,基于端侧大模型能力,建立人与设备共同的记忆。...……更多
宇航员亲述太空中神秘“诡异幻觉”,内外有何奇异力量?
...到深邃无尽的孤独。然而,最让人着迷的,却是那些诡异幻觉,宇航员们私下里亲述出来的,关于内外有何奇异力量的故事。宇航员太空中神秘“诡异幻觉”的描述:身心在太空中的变化宇航员们在太空中面临着长时间的失重状...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...来说,被识别对象的静态外观并不是很重要,有时甚至是有害的。例如,在视频中一个人拿着足球进行篮球的投篮动作,如果模型仅仅是根据物体的静态外观来理解视频,那么模型可能会因为在视频中识别到足球而错误地认为这...……更多
2023内容科技应用典型案例:传播大脑科技(浙江)股份有限公司打造传播大模型
...信息。知识增强技术:为缓解大模型在结果生成过程中的幻觉问题,引入知识增强技术与外部知识库进行交互,以补充和约束模型的输出,从而提高信息的准确性和完整性。长文本建模技术:通过长文本建模和切片方式突破大模...……更多
宇航员在太空遇到的“诡异幻觉”,或许是空间环境对大脑的影响
...挑战,还必须要应对一种与现实纠缠在一起的令人困惑的幻觉。这些“诡异幻觉”来自于空间环境对大脑的意想不到的影响,犹如一场神秘而令人着迷的交错之旅。究竟是什么造成了这个世界与现实的分裂?这些幻觉是大脑的自...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...提供更多选择。 一家主要保险公司将提供专门的AI风险幻觉保险:genAI对幻觉或错误的倾向改变了风险管理和复杂风险转移策略的计算方式。尽管保险公司一直在努力弥补涉及AI幻觉的保险漏洞,但鉴于genAI的预期增长,先锋保...……更多
“AI+作业”进入中学课堂,成又一个拍照搜题软件?
...应用的探索阶段,“大模型本身是一个概率模型,它有AI幻觉,因此有时也会出错,”他补充,“在大模型本身的出错概率和我们教学中要求的严谨性这两者之间还存在矛盾。”另一方面,AI技术的使用,反而可能会加剧教育的...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...前插入的特定bug,即CBI(critique-bug inclusion)有没有出现幻觉或者挑剔现象,指出了不存在的问题对整体有用性的主观评级,包含上述内容并考虑风格和整体的实用性在训练CriticGPT的过程中,除了RLHF方法,团队将奖励模型与搜索...……更多
ChatGPT确实会看人下菜!OpenAI官方报告揭示大模型的刻板印象
...种族信息,其响应质量都差不多,即不同分组的准确度和幻觉率基本是一致的。他们还发现,名字与性别、种族或文化背景的关联确实有可能导致语言模型给出的响应带有有害刻板印象,但这种情况很少出现,大概只有整体案例...……更多
更多关于科技的资讯:
全球康养峰会发布2025年十大康养趋势
鲁网2月6日讯2025年1月28日,全球康养峰会(Global Wellness Summit)美国佛罗里达州迈阿密举行
2025-02-06 17:14:00
本文转自:人民网章斐然 陈键 罗知之这个春节,喜讯连连。6日中午,历经5年、追求极致、挑战各种“不可能”的《哪吒之魔童闹海》电影票房逼近58亿元
2025-02-06 17:31:00
奋斗筑梦想 实干向未来——记烟台联通省级服务标兵智慧家庭工程师吴新颖
胶东在线2月6日讯吴新颖,一名坚守在烟台联通第二营销中心北岛服务站16年的智家工程师,日常负责宽带安装与维修,他始终将客户满意度视作工作的至高准则与不懈追求
2025-02-06 17:35:00
潍坊昌乐:企业复工复产忙 冲刺首季“开门红”
大众网记者 焦雪 通讯员 张磊 刘宁宁 潍坊报道一年之计在于春,开局起势见精神。浓浓的年味儿还未散去,潍坊市昌乐县已经吹响了复工复产的“集结号”
2025-02-06 17:44:00
2025年初抖音电商推出9大扶持措施来帮助商家降低经营成本,近期部分政策开始密集落地。2月6日,抖音电商规则中心更新了调整保证金和“0元入驻”的新规则
2025-02-06 17:44:00
2025开年,DeepSeek助力企业AI招聘系统放大招!
新年伊始,万象更新。如果说2024年是AI大模型百花齐放的一年,那么2025年便是大模型落地应用遍地开花的一年。在AI应用如雨后春笋般破土而出之际
2025-02-06 18:00:00
开工大吉:乘2024创新东风,启2025泳池设备新征途
春回大地,万物复苏。不知不觉间,春节假期的余额已经归“零”。千家万户依然沉浸于阖家团圆的新春佳节美好氛围之际,广州千叶在一片祥和气氛中全面开工
2025-02-06 18:45:00
京东培育钻石购物节7日开启 每满300减40还可叠加品类优惠
情人节礼物怎么选?如何能既有创意又能显得独一无二?2月7日,京东黄金珠宝携手小白光、中南钻石、凯丽希、芮爱等知名品牌开启培育钻石购物节
2025-02-06 19:13:00
哪吒2登顶中国影史票房冠军 带火周边潮玩 新品盲盒上架即售罄
2月6日,“高开疯走”的《哪吒之魔童闹海》(以下简称“哪吒2”)刷新影史纪录,成了近两年春节档观众最“满意”影片,登顶中国电影票房总榜冠军
2025-02-06 19:14:00
春节期间,蒙牛集团充分利用假期消费场景,在全国各大商超、专卖店以及线上电商、小程序等渠道加大市场推广力度,全面实现新年产销“开门红”
2025-02-06 19:14:00
雷军回应小米SU7 Ultra车标是金的:花80万买车 满足下虚荣感不过分
快科技2月6日消息,近日,有网友发现,小米SU7 Ultra量产版的车标变成了碳纤维+金色,对此雷军表示,车标是金的,随后引发网友热议
2025-02-06 12:43:00
河南老板拿170万的玛莎拉蒂当套圈奖品 有人半小时花300元
快科技2月6日消息,日前,“河南商丘一老板用170万元的玛莎拉蒂当套圈奖品”的话题,引起网友关注。网友发布的视频中,一处套圈摊位中间摆放了一台玛莎拉蒂总裁
2025-02-06 12:43:00
GaaS陷入低潮 大锤创始人遭辞退
潜水教练出身的迈克尔·康德雷(Michael Condrey,图左)以EA Visceral工作室首席运营官身份与格伦·斯科菲尔德(Glen Schofield
2025-02-06 12:43:00
奔驰:30年前我们发布了ESP 彻底改写了汽车安全史
快科技2月6日消息,梅赛德斯-奔驰今日发文纪念ESP(电控车辆稳定行驶系统)全球首次亮相30周年。1995年2月6日,奔驰与博世合作研发的ESP在第7代S级车(W140系列)上首次应用
2025-02-06 13:43:00
《哪吒2》成中国影史票房新冠军 手办爆火售罄 泡泡玛特回应
快科技2月6日消息,今日,电影《哪吒之魔童闹海》总票房(含点映及预售)超越《长津湖》,位列中国电影票房总榜榜首,影片也带火了盲盒手办的销售
2025-02-06 13:43:00