• 我的订阅
  • 头条热搜
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...在人工智能领域,大型预训练模型(如 GPT 和 LLaVA)的 “幻觉” 现象常被视为一个难以克服的挑战,尤其是在执行精确任务如图像分割时。然而,最新发表于 NeurIPS 2024 的研究《Leveraging Hallucinations to Reduce Manual Prompt D……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...此前模型相似的局限性,仍然不完全可靠,存在事实性“幻觉”并出现推理错误,可能自信地在其预测中犯错。同时,它的使用价格也更贵,其API价格是Chat-GPT API 使用价格的15-30倍。GPT-4实现多项突破,晋升“考霸”相较GPT-3.5,...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...的风险挑战。除了这两个例子以外,多模态大模型还存在幻觉、偏见、隐私泄漏等各类安全威胁或社会风险,会严重影响它们在实际应用中的可靠性和可信性。这些漏洞问题到底是偶然发生,还是普遍存在?不同多模态大模型的...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...着模态的增加,输入输出空间的分布更加广泛,并增加了幻觉现象,使得全模态对齐变得更加复杂。在不到两周的时间内,北大对齐小组基于 Llama-3.2-Vision 的 11B 预训练版本进行后训练 (Post-Training) 对齐微调得到 Beaver-Vision-11B,...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...关性,以此可以做更好的语义计算和语义的召回。大模型幻觉也是阻碍应用的关键挑战之一。那么,引入了 RAG、知识库之后,大模型就能解决幻觉问题了吗?其实不然,而且有些幻觉问题不仔细观察便难以察觉。举个例子,比...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...等模型。尤其在数学问答等方向表现媲美70B参数模型;在幻觉等任务中,Ovis-1.6的幻觉现象和错误率显著低于同级别的模型,展现了更高的生成文本质量和准确性。5、全部开源可商用:Ovis系列模型License采用 Apache 2.0。Ovis 1.0、1.5...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...踪一切」模型SOLAMI:首个端到端社交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术分享群...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...推出一项创新性研究,旨在防止大型AI模型被恶意应用于有害任务。他们提出了一种名为“自毁模型”的新技术,通过这一方法,即使大型模型是开源的,也可以在面对有害任务时自动降低其性能,从而抵制恶意滥用。研究人员...……更多
...像,处理更大的文本块。对于AI聊天机器人此前暴露出的幻觉、偏见等缺陷,GPT-4也有所改进。但专家指出,这并不意味着这些缺陷已被修复,GPT-4仍会做错最基础的算术题。另据介绍,和ChatGPT不同,使用GPT-4需每月支付20美元的...……更多
NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成
...华大学等机构的研究团队联合提出了一种全新的统一算法框架,名为无训练指导(Training-Free Guidance, 简称 TFG)。这一框架无缝整合现有的无训练指导方法,凭借理论创新和大规模实验验证,成为扩散模型条件生成领域的重要里...……更多
李彦宏:大模型已基本解决幻觉问题 发布两大“超级有用”AI技术
...24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“...……更多
当一个清华教授问AI觉得自己革了谁的命
...越来越重要教育领域对准确性和可靠性的需求极高,AI的幻觉率问题可能会影响教材内容的质量和学习效果。教育系统可以加入关于信息识别、批判性思维和数据素养的课程,以帮助学生识别和处理潜在的错误信息每个独立的个...……更多
撞墙还是新起点?自回归模型在图像领域展现出Scaling潜力
...面实现了改进,成为了首个将生成和判别任务统一在同一框架内的条件生成模型。这意味着,BiGR 不仅是一个好的图像生成器,同时还是一个强大的特征提取器,二者是相互促进的关系。 论文标题:BiGR: Harnessing Binary Latent Codes f...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D:无需训练的「图生视频...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...包括三个阶段:研究思路生成、实验实现和实验执行。该框架在多项机器学习任务中有效促进了研究进展。源代码链接:https://github.com/du-nlp-lab/MLR-Copilot 论文链接:https://arxiv.org/pdf/2408.14033 Demo 链接……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...如图1(c)所示。然而,作者发现重叠切分策略引入了某些幻觉,导致性能下降而不是提高。方法思路作者提出了Mini-Monkey,一个轻量级的多模态大型语言模型,旨在减轻切分策略引起的锯齿效应。方法框图如图2所示。图2裁切在文...……更多
GPT-4就是冲着赚钱来的!
...nAI官方给出的信息是:GPT-4 相对于早期的模型已经减轻了幻觉问题,经过多次迭代和改进后,它在 OpenAI 的内部对抗性真实性评估中得分比最新的 GPT-3.5 模型高 40%。对此,笔者利用ChatGPT Plus的GPT-4通道对“胡编乱造”的问题进行...……更多
如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
...al Grounding 的新功能,可以通过语境分析降低 75% 的大模型幻觉的产生。应用层则定位于企业级生成式 AI 助手,核心产品是 AI 助手 Amazon Q 为核心的一系列开箱即用 AI 应用集合。这一层主要针对有大模型使用意愿,但不想投入过...……更多
国内首个!中关村科金发布企业知识大模型
...判断三个层面,在他看来,目前大模型最为人诟病的是有幻觉问题,对低频常理的事实回答得不好,经常被人们认为一本正经的胡说八道,但可以通过一些其他的手段解决。比如,外挂一些知识库或者符号推进引擎,解决事实判...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...将面临挑战。此外,大模型的商业化进程相对滞后,而高幻觉率的存在也给产业应用带来隐患。面对这些挑战,何晓冬博士提出,让大模型在产业中先行先试,是推动技术生态良性发展的有效途径。在此背景下,据介绍,京东在...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...续并加强了小钢炮系列最强端侧 OCR 能力的传统优势。在幻觉评测榜单Object HalBench上,MiniCPM-V 2.6 的幻觉水平(幻觉率越低越好)优于GPT-4o、GPT-4V、Claude 3.5 Sonnet 等众多商用模型。实时视频理解,首次上端!睁开端侧「眼睛」,...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...400K LRV-Instruct 数据集,分别用于学习视觉指令跟随和减轻幻觉。需要注意的是,减轻幻觉在机器人场景中起着重要作用,因为机器人 MLLM 需要基于真实场景生成任务规划,而不是想象中的场景。例如,现有的 MLLMs 可能公式化地...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...效运行。 开悟大模型智能应用中台针对大模型应用中的幻觉问题及与业务系统的对接难题,提供了一个便捷的模型应用构建环境。该平台优化了客户本地数据与大模型的结合方式,以更好地发挥数据的价值,并支持各类自有数...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
【新智元导读】DeepMind最近的研究提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多种任务上的表现,增强了模型的泛化性和鲁棒性,为实现更类人...……更多
信号表征指数级强、内存节省35%,量子隐式表征网络
...阴影区域表示高频误差。最新的研究引入了一个突破性的框架将隐式神经表征扩展到图像生成。更具体地说,该框架利用以随机分布为输入的超网络来生成隐式表征网络的参数。随后,这些生成的参数被分配给隐式表征网络。最...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...OpenGVLab的开源项目全方位覆盖了通用模型架构、高效训练框架及超高性能的预训练模型,助力社区用极低的数据量快速满足多场景、多任务、高性能的AI模型训练,并供所有对人工智能技术感兴趣的人士自由体验。OpenGVLab还提供...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...进行了升级。同时,vivo为三方开发者构建了连接服务的框架和平台,让人找服务的同时,服务也主动匹配人的需求。另外,vivo构建了个人智能系统框架,通过本地化知识图谱,基于端侧大模型能力,建立人与设备共同的记忆。...……更多
更多关于科技的资讯:
本文转自:人民日报中国锦屏地下实验室——在极深地下探寻前沿领域(新春走基层·探访新质生产力)本报记者  王明峰  林  渊《人民日报》(2025年02月04日第 02 版)从四川西昌市驱车两个多小时
2025-02-04 05:45:00
效率提升20倍近日,记者走进杭州大雅信息科技有限公司(以下简称“大雅科技”),看到了一番忙碌的景象:设计师们正忙着出设计图
2025-02-04 08:00:00
日本“灾害级大雪”来袭:官方呼吁非必要不外出
快科技2月3日消息,就在今日,日本气象部门预报,该国多地4日起将遭遇今冬以来最强寒潮,部分地区恐出现“灾害级”强降雪。受强冷空气及冬季气压分布影响
2025-02-04 00:11:00
蛇年春节,我市消费市场一片红红火火,餐饮、文旅和影院作为传统的“三驾马车”依然强劲,而今年又有了生力军,在国补政策的加持下
2025-02-04 07:46:00
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
北京时间2月3日上午,OpenAI正式推出面向深度研究领域的智能体产品深度研究(Deep research)功能。 曾经一位经验丰富的行业分析师需要花费数天甚至数周才能完成的专业研究报告
2025-02-04 04:25:00
消防通道乱停阻碍出警:小区民众齐心协力掀翻两台车
2月3日消息,消防通道是“生命通道”,在火灾等紧急情况下,它能为消防救援提供便利,确保人员迅速疏散和消防车辆快速到达现场
2025-02-03 23:41:00
华硕官方解释Q-Release Slim快拆设计:方法正确不会损伤板卡
快科技2月3日消息,近日有用户反映质疑华硕的PCIe Q-Release Slim快拆设计方案不完善、存在缺陷,有可能会损伤显卡的金手指
2025-02-03 23:41:00
微软砍刀部发声:弃用Win11/10功能并不是终点
快科技2月3日消息,微软时不时会在其官方网站上宣布停用某项Windows功能或服务,而这些被弃用的功能通常是使用率太低
2025-02-03 22:41:00
印度、日本双双发射区域导航卫星:都是2025年的第一次
快科技2月3日消息,北京时间1月29日8点23分,印度使用GSLV-F15火箭成功发射了NVS-02区域导航卫星,而在4天后的2月2日16点30分
2025-02-03 17:40:00
《哪吒2》百万条锁链有多难做:特效老师电脑开机开了2个小时
快科技2月3日消息,《哪吒之魔童闹海》毫无意外拿下春节档票房冠军,影片爆火背后,是制作团队的用心。据悉,比起前作《哪吒之魔童闹海》整个故事更宏大
2025-02-03 18:10:00
D8888次动车出发!吉祥又霸气
快科技2月3日消息,对于国人来说,8、6都是吉利数字,连续出现更是吉利翻倍,今天就来看看超级吉祥、超级霸气的D8888次动车列车
2025-02-03 18:10:00
1nm工艺!曝台积电将建设全球最先进晶圆厂
快科技2月3日消息,最新报道称,全球最大晶圆代工厂台积电正计划在中国台湾台南建设一座拥有最先进1nm工艺节点制程技术产线的晶圆厂
2025-02-03 18:10:00
全网最低价!百度智能云上线DeepSeek-R1/V3:还有限时免费
快科技2月3日消息,今天百度智能云正式宣布DeepSeek-R1和DeepSeek-V3模型已在百度智能云千帆平台上架
2025-02-03 19:10:00
活久见!美国超市冷藏柜拉出一只活狼:现场群众无不吃惊
快科技2月3日消息,世界之大,无奇不有,近日,美国芝加哥Aldi超市发布公告称,超市冷藏柜中有只狼,当警方赶到现场后用工具将狼抓住
2025-02-03 19:40:00
阿里云支持一键部署DeepSeek-V3/R1!仅需3步、0代码
快科技2月3日消息,今天阿里云宣布,阿里云PAI Model Gallery支持云上一键部署DeepSeek-V3、DeepSeek-R1
2025-02-03 19:40:00