• 我的订阅
  • 头条热搜
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...在人工智能领域,大型预训练模型(如 GPT 和 LLaVA)的 “幻觉” 现象常被视为一个难以克服的挑战,尤其是在执行精确任务如图像分割时。然而,最新发表于 NeurIPS 2024 的研究《Leveraging Hallucinations to Reduce Manual Prompt D……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...此前模型相似的局限性,仍然不完全可靠,存在事实性“幻觉”并出现推理错误,可能自信地在其预测中犯错。同时,它的使用价格也更贵,其API价格是Chat-GPT API 使用价格的15-30倍。GPT-4实现多项突破,晋升“考霸”相较GPT-3.5,...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...的风险挑战。除了这两个例子以外,多模态大模型还存在幻觉、偏见、隐私泄漏等各类安全威胁或社会风险,会严重影响它们在实际应用中的可靠性和可信性。这些漏洞问题到底是偶然发生,还是普遍存在?不同多模态大模型的...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...着模态的增加,输入输出空间的分布更加广泛,并增加了幻觉现象,使得全模态对齐变得更加复杂。在不到两周的时间内,北大对齐小组基于 Llama-3.2-Vision 的 11B 预训练版本进行后训练 (Post-Training) 对齐微调得到 Beaver-Vision-11B,...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...关性,以此可以做更好的语义计算和语义的召回。大模型幻觉也是阻碍应用的关键挑战之一。那么,引入了 RAG、知识库之后,大模型就能解决幻觉问题了吗?其实不然,而且有些幻觉问题不仔细观察便难以察觉。举个例子,比...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...等模型。尤其在数学问答等方向表现媲美70B参数模型;在幻觉等任务中,Ovis-1.6的幻觉现象和错误率显著低于同级别的模型,展现了更高的生成文本质量和准确性。5、全部开源可商用:Ovis系列模型License采用 Apache 2.0。Ovis 1.0、1.5...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...踪一切」模型SOLAMI:首个端到端社交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术分享群...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...推出一项创新性研究,旨在防止大型AI模型被恶意应用于有害任务。他们提出了一种名为“自毁模型”的新技术,通过这一方法,即使大型模型是开源的,也可以在面对有害任务时自动降低其性能,从而抵制恶意滥用。研究人员...……更多
NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成
...华大学等机构的研究团队联合提出了一种全新的统一算法框架,名为无训练指导(Training-Free Guidance, 简称 TFG)。这一框架无缝整合现有的无训练指导方法,凭借理论创新和大规模实验验证,成为扩散模型条件生成领域的重要里...……更多
...像,处理更大的文本块。对于AI聊天机器人此前暴露出的幻觉、偏见等缺陷,GPT-4也有所改进。但专家指出,这并不意味着这些缺陷已被修复,GPT-4仍会做错最基础的算术题。另据介绍,和ChatGPT不同,使用GPT-4需每月支付20美元的...……更多
李彦宏:大模型已基本解决幻觉问题 发布两大“超级有用”AI技术
...24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“...……更多
当一个清华教授问AI觉得自己革了谁的命
...越来越重要教育领域对准确性和可靠性的需求极高,AI的幻觉率问题可能会影响教材内容的质量和学习效果。教育系统可以加入关于信息识别、批判性思维和数据素养的课程,以帮助学生识别和处理潜在的错误信息每个独立的个...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...面实现了改进,成为了首个将生成和判别任务统一在同一框架内的条件生成模型。这意味着,BiGR 不仅是一个好的图像生成器,同时还是一个强大的特征提取器,二者是相互促进的关系。 论文标题:BiGR: Harnessing Binary Latent Codes f...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D:无需训练的「图生视频...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...包括三个阶段:研究思路生成、实验实现和实验执行。该框架在多项机器学习任务中有效促进了研究进展。源代码链接:https://github.com/du-nlp-lab/MLR-Copilot 论文链接:https://arxiv.org/pdf/2408.14033 Demo 链接……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...如图1(c)所示。然而,作者发现重叠切分策略引入了某些幻觉,导致性能下降而不是提高。方法思路作者提出了Mini-Monkey,一个轻量级的多模态大型语言模型,旨在减轻切分策略引起的锯齿效应。方法框图如图2所示。图2裁切在文...……更多
GPT-4就是冲着赚钱来的!
...nAI官方给出的信息是:GPT-4 相对于早期的模型已经减轻了幻觉问题,经过多次迭代和改进后,它在 OpenAI 的内部对抗性真实性评估中得分比最新的 GPT-3.5 模型高 40%。对此,笔者利用ChatGPT Plus的GPT-4通道对“胡编乱造”的问题进行...……更多
如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
...al Grounding 的新功能,可以通过语境分析降低 75% 的大模型幻觉的产生。应用层则定位于企业级生成式 AI 助手,核心产品是 AI 助手 Amazon Q 为核心的一系列开箱即用 AI 应用集合。这一层主要针对有大模型使用意愿,但不想投入过...……更多
国内首个!中关村科金发布企业知识大模型
...判断三个层面,在他看来,目前大模型最为人诟病的是有幻觉问题,对低频常理的事实回答得不好,经常被人们认为一本正经的胡说八道,但可以通过一些其他的手段解决。比如,外挂一些知识库或者符号推进引擎,解决事实判...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...将面临挑战。此外,大模型的商业化进程相对滞后,而高幻觉率的存在也给产业应用带来隐患。面对这些挑战,何晓冬博士提出,让大模型在产业中先行先试,是推动技术生态良性发展的有效途径。在此背景下,据介绍,京东在...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...续并加强了小钢炮系列最强端侧 OCR 能力的传统优势。在幻觉评测榜单Object HalBench上,MiniCPM-V 2.6 的幻觉水平(幻觉率越低越好)优于GPT-4o、GPT-4V、Claude 3.5 Sonnet 等众多商用模型。实时视频理解,首次上端!睁开端侧「眼睛」,...……更多
ChatGPT张口就来的“病”应该怎么“治”?
...章,让 ChatGPT 如此「自信胡扯」的原因,是 AI 产生了「幻觉」。那么,是什么让 AI 大语言模型产生了「幻觉」,业界又是如何看待 AI 幻觉的?01.ChatGPT「张口就来」「幻觉(Hallucinations)」一词源于人类心理学,人类的幻觉是指...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...400K LRV-Instruct 数据集,分别用于学习视觉指令跟随和减轻幻觉。需要注意的是,减轻幻觉在机器人场景中起着重要作用,因为机器人 MLLM 需要基于真实场景生成任务规划,而不是想象中的场景。例如,现有的 MLLMs 可能公式化地...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...效运行。 开悟大模型智能应用中台针对大模型应用中的幻觉问题及与业务系统的对接难题,提供了一个便捷的模型应用构建环境。该平台优化了客户本地数据与大模型的结合方式,以更好地发挥数据的价值,并支持各类自有数...……更多
...包括用于数字虚拟人的扩散模型和3维NerF结构的生成模型框架、基于能量的扩散模型框架。吕家俊告诉36氪,用这些自研框架开发的图片视频应用,具有生成结果质量高,清晰度高,多样性好等特点。一个例证是,基于这些架构...……更多
去年股价跌去四分之三的meta 元宇宙的故事才刚刚开始
...术,在世界范围内,还真没有谁能说它不行。 深度学习框架这个东西大家晓得伐?这个东西是用来方便开发训练深度学习模型的,相当于 AI 界的操作系统。在 17 、 18 年这会儿,市场上占据最多使用率的,还是人谷歌大名鼎鼎...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
【新智元导读】DeepMind最近的研究提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多种任务上的表现,增强了模型的泛化性和鲁棒性,为实现更类人...……更多
更多关于科技的资讯:
富士胶片生命科学创新合作中心开放日圆满落幕
2025年2月21日,富士胶片(中国)投资有限公司生命科学事业部在其位于苏州医疗器械科技产业园的创新合作中心(Innovation &
2025-02-26 07:56:00
麦澜德打造行业领军企业
昨日,在江宁高新区麦澜德医疗科技公司内,工作人员正在生产女性盆底生殖康复诊疗设备。作为第八批全国制造业单项冠军企业,该公司专注于女性全生命周期物理技术干预整体方案研发及产业化
2025-02-26 07:57:00
宁企合作研发医疗信创自助机出院患者“零跑腿” “刷脸”就医更省心南报网讯(通讯员胡晓靓记者夏思宇)“您好,请正对屏幕‘刷脸’支付
2025-02-26 07:57:00
“雨花制造”销往50多个国家,外贸出口额占销售额40%——生产线奏响“春天序曲” “单项冠军”出海忙□南京日报/紫金山新闻记者肖凡 通讯员庄佳琪2月25日一早
2025-02-26 07:59:00
美国一机场险发生两机相撞:客机降落时一公务机突然横穿跑道
快科技2月26日消息,据央视报道,当地时间2月25日上午8点48分,美国西南航空公司2504号航班在芝加哥中途国际机场降落时
2025-02-26 08:04:00
京东承担骑手五险一金所有成本 专家分析每单外卖要贵:你真支持吗
快科技2月26日消息,之前京东发出公告称,目前外卖骑手的平均薪酬远低于京东快递小哥,为了薪酬公平性,未来一段时期签约的外卖全职骑手缴纳五险一金的所有成本
2025-02-26 08:04:00
DeepSeek开源周才第二天 有些公司就已经坐不住了
哥几个,走过路过别错过,今天的 AI 圈可以说是格外热闹了。真正 “Open” 的 DeepSeek ,打出开源周的第二发炮弹
2025-02-26 08:04:00
3899元起!小米有品众筹折叠键盘主机:插上屏幕就能用
快科技2月26日消息,小米有品众筹上线了口袋玲珑全尺寸折叠键盘多功能主机,是一款键盘形态的电脑,展开后尺寸为30×11×1
2025-02-26 08:04:00
2月24日小店区消息,该区打造的“数通小店”数字社区管理服务平台近日成功接入DeepSeek-R1大模型,实现人工智能深度赋能政务服务系统
2025-02-26 08:26:00
4950亿美元市值:腾讯坐稳中国互联网第一宝座!小米靠高端1年激增122%
快科技2月26日消息,依靠微信和诸多热门游戏等,腾讯依然是中国互联网的No.1。最新数据显示,腾讯成为2024年中国互联网企业市值冠军
2025-02-26 08:34:00
国内首款RAP主动式温控航空箱研发成功:可确保复杂环境下精准控温
快科技2月26日消息,据报道,中国国际海运集装箱(集团)股份有限公司成功研发出国内首款RAP主动式温控航空箱。长期以来
2025-02-26 08:34:00
极越车机APP现大量故障 车主担忧软件维护已无人负责
快科技2月26日消息,“极越无声-我们发声”公众号日前发文称,极越APP现系统故障,车主们质疑软件维护是否已无人负责。据介绍
2025-02-26 08:34:00
手机NFC碰一下就被盗刷视频系摆拍!支付宝:不解锁无法支付
快科技2月26日消息,前段时间,有网传视频称手机放兜里被人碰了一下钱就没了,但其实此视频是摆拍,造谣者已经被行拘。该事件近日登上了央视新闻
2025-02-26 08:34:00
曝特斯拉中国满血版FSD正测试验证中 美中工程师接力部署优化
快科技2月26日消息,据“晚点Auto”报道,特斯拉日前推送的软件更新,不同于美国版FSD功能,真正的“满血版”FSD还在测试优化中
2025-02-26 08:34:00
临沂市兰山区:三大提升行动 ,助力工业经济“开门红”
大众网记者 滕立军 通讯员 文胜爱 陈笑 临沂报道零部件空中智能投放、油液智能加注、产线装配自动化拧紧……2月24日,在位于临沂市兰山区的临工农机智能工厂
2025-02-26 08:54:00