• 我的订阅
  • 头条热搜
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...在人工智能领域,大型预训练模型(如 GPT 和 LLaVA)的 “幻觉” 现象常被视为一个难以克服的挑战,尤其是在执行精确任务如图像分割时。然而,最新发表于 NeurIPS 2024 的研究《Leveraging Hallucinations to Reduce Manual Prompt D……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...的风险挑战。除了这两个例子以外,多模态大模型还存在幻觉、偏见、隐私泄漏等各类安全威胁或社会风险,会严重影响它们在实际应用中的可靠性和可信性。这些漏洞问题到底是偶然发生,还是普遍存在?不同多模态大模型的...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...着模态的增加,输入输出空间的分布更加广泛,并增加了幻觉现象,使得全模态对齐变得更加复杂。在不到两周的时间内,北大对齐小组基于 Llama-3.2-Vision 的 11B 预训练版本进行后训练 (Post-Training) 对齐微调得到 Beaver-Vision-11B,...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...关性,以此可以做更好的语义计算和语义的召回。大模型幻觉也是阻碍应用的关键挑战之一。那么,引入了 RAG、知识库之后,大模型就能解决幻觉问题了吗?其实不然,而且有些幻觉问题不仔细观察便难以察觉。举个例子,比...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...等模型。尤其在数学问答等方向表现媲美70B参数模型;在幻觉等任务中,Ovis-1.6的幻觉现象和错误率显著低于同级别的模型,展现了更高的生成文本质量和准确性。5、全部开源可商用:Ovis系列模型License采用 Apache 2.0。Ovis 1.0、1.5...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...推出一项创新性研究,旨在防止大型AI模型被恶意应用于有害任务。他们提出了一种名为“自毁模型”的新技术,通过这一方法,即使大型模型是开源的,也可以在面对有害任务时自动降低其性能,从而抵制恶意滥用。研究人员...……更多
李彦宏:大模型已基本解决幻觉问题 发布两大“超级有用”AI技术
...24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“...……更多
当一个清华教授问AI觉得自己革了谁的命
...越来越重要教育领域对准确性和可靠性的需求极高,AI的幻觉率问题可能会影响教材内容的质量和学习效果。教育系统可以加入关于信息识别、批判性思维和数据素养的课程,以帮助学生识别和处理潜在的错误信息每个独立的个...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...包括三个阶段:研究思路生成、实验实现和实验执行。该框架在多项机器学习任务中有效促进了研究进展。源代码链接:https://github.com/du-nlp-lab/MLR-Copilot 论文链接:https://arxiv.org/pdf/2408.14033 Demo 链接……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...如图1(c)所示。然而,作者发现重叠切分策略引入了某些幻觉,导致性能下降而不是提高。方法思路作者提出了Mini-Monkey,一个轻量级的多模态大型语言模型,旨在减轻切分策略引起的锯齿效应。方法框图如图2所示。图2裁切在文...……更多
如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
...al Grounding 的新功能,可以通过语境分析降低 75% 的大模型幻觉的产生。应用层则定位于企业级生成式 AI 助手,核心产品是 AI 助手 Amazon Q 为核心的一系列开箱即用 AI 应用集合。这一层主要针对有大模型使用意愿,但不想投入过...……更多
国内首个!中关村科金发布企业知识大模型
...判断三个层面,在他看来,目前大模型最为人诟病的是有幻觉问题,对低频常理的事实回答得不好,经常被人们认为一本正经的胡说八道,但可以通过一些其他的手段解决。比如,外挂一些知识库或者符号推进引擎,解决事实判...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...将面临挑战。此外,大模型的商业化进程相对滞后,而高幻觉率的存在也给产业应用带来隐患。面对这些挑战,何晓冬博士提出,让大模型在产业中先行先试,是推动技术生态良性发展的有效途径。在此背景下,据介绍,京东在...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...续并加强了小钢炮系列最强端侧 OCR 能力的传统优势。在幻觉评测榜单Object HalBench上,MiniCPM-V 2.6 的幻觉水平(幻觉率越低越好)优于GPT-4o、GPT-4V、Claude 3.5 Sonnet 等众多商用模型。实时视频理解,首次上端!睁开端侧「眼睛」,...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...400K LRV-Instruct 数据集,分别用于学习视觉指令跟随和减轻幻觉。需要注意的是,减轻幻觉在机器人场景中起着重要作用,因为机器人 MLLM 需要基于真实场景生成任务规划,而不是想象中的场景。例如,现有的 MLLMs 可能公式化地...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...效运行。 开悟大模型智能应用中台针对大模型应用中的幻觉问题及与业务系统的对接难题,提供了一个便捷的模型应用构建环境。该平台优化了客户本地数据与大模型的结合方式,以更好地发挥数据的价值,并支持各类自有数...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
【新智元导读】DeepMind最近的研究提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多种任务上的表现,增强了模型的泛化性和鲁棒性,为实现更类人...……更多
信号表征指数级强、内存节省35%,量子隐式表征网络
...阴影区域表示高频误差。最新的研究引入了一个突破性的框架将隐式神经表征扩展到图像生成。更具体地说,该框架利用以随机分布为输入的超网络来生成隐式表征网络的参数。随后,这些生成的参数被分配给隐式表征网络。最...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...进行了升级。同时,vivo为三方开发者构建了连接服务的框架和平台,让人找服务的同时,服务也主动匹配人的需求。另外,vivo构建了个人智能系统框架,通过本地化知识图谱,基于端侧大模型能力,建立人与设备共同的记忆。...……更多
宇航员亲述太空中神秘“诡异幻觉”,内外有何奇异力量?
...到深邃无尽的孤独。然而,最让人着迷的,却是那些诡异幻觉,宇航员们私下里亲述出来的,关于内外有何奇异力量的故事。宇航员太空中神秘“诡异幻觉”的描述:身心在太空中的变化宇航员们在太空中面临着长时间的失重状...……更多
美国东北大学提出视频数据增强方法,能让视频模型学到更好的表征
...来说,被识别对象的静态外观并不是很重要,有时甚至是有害的。例如,在视频中一个人拿着足球进行篮球的投篮动作,如果模型仅仅是根据物体的静态外观来理解视频,那么模型可能会因为在视频中识别到足球而错误地认为这...……更多
2023内容科技应用典型案例:传播大脑科技(浙江)股份有限公司打造传播大模型
...信息。知识增强技术:为缓解大模型在结果生成过程中的幻觉问题,引入知识增强技术与外部知识库进行交互,以补充和约束模型的输出,从而提高信息的准确性和完整性。长文本建模技术:通过长文本建模和切片方式突破大模...……更多
宇航员在太空遇到的“诡异幻觉”,或许是空间环境对大脑的影响
...挑战,还必须要应对一种与现实纠缠在一起的令人困惑的幻觉。这些“诡异幻觉”来自于空间环境对大脑的意想不到的影响,犹如一场神秘而令人着迷的交错之旅。究竟是什么造成了这个世界与现实的分裂?这些幻觉是大脑的自...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...提供更多选择。 一家主要保险公司将提供专门的AI风险幻觉保险:genAI对幻觉或错误的倾向改变了风险管理和复杂风险转移策略的计算方式。尽管保险公司一直在努力弥补涉及AI幻觉的保险漏洞,但鉴于genAI的预期增长,先锋保...……更多
“AI+作业”进入中学课堂,成又一个拍照搜题软件?
...应用的探索阶段,“大模型本身是一个概率模型,它有AI幻觉,因此有时也会出错,”他补充,“在大模型本身的出错概率和我们教学中要求的严谨性这两者之间还存在矛盾。”另一方面,AI技术的使用,反而可能会加剧教育的...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...前插入的特定bug,即CBI(critique-bug inclusion)有没有出现幻觉或者挑剔现象,指出了不存在的问题对整体有用性的主观评级,包含上述内容并考虑风格和整体的实用性在训练CriticGPT的过程中,除了RLHF方法,团队将奖励模型与搜索...……更多
ChatGPT确实会看人下菜!OpenAI官方报告揭示大模型的刻板印象
...种族信息,其响应质量都差不多,即不同分组的准确度和幻觉率基本是一致的。他们还发现,名字与性别、种族或文化背景的关联确实有可能导致语言模型给出的响应带有有害刻板印象,但这种情况很少出现,大概只有整体案例...……更多
更多关于科技的资讯:
新技术多 新产品多 海外订单多 龙头企业杭汽轮展现“中国制造”力量与速度
1700多名工人全部到岗。“春节一过,汽轮机生产车间就全面复工,上线全年排产计划,生产订单稳中有升。”杭州汽轮动力集团股份有限公司副总经理邵建伟翻开厚厚一叠生产动态表
2025-02-14 07:55:00
近日,在太原海关所属晋阳海关报关大厅里,海关工作人员仔细核对市民潘女士携带宠物犬的申报信息后,对宠物犬扫描芯片并进行临床检查
2025-02-14 07:57:00
甄嬛传余莺儿扮演者被行拘 自爆无证驾驶逃逸:公开道歉我错了
快科技2月14日消息,近日,电视剧《甄嬛传》中余莺儿(余答应)的扮演者女演员崔漫莉在直播间自曝,其在浙江东阳市横店镇拍戏时曾酒后无证驾车并肇事逃逸
2025-02-14 08:21:00
M2版Mac mini比M4版还贵!苹果定价引发争议
快科技2月14日消息,在苹果美国官网,苹果开售官翻版Mac mini,因M4版本的价格比M2版本更便宜,其定价模式引发争议
2025-02-14 08:21:00
英伟达宣布RTX 5070显卡延期上市:从2月跳票至3月5日
快科技2月14日消息,在2025年CES展上,英伟达CEO黄仁勋正式发布万众期待的RTX 50系列显卡。首批共五款产品
2025-02-14 08:21:00
票房破100亿!韩国电视台种草《哪吒2》:好莱坞级特效 中国版漫威
快科技2月14日消息,日前,电影《哪吒之魔童闹海》票房(含预售)已达100亿元,成为我国影史首部百亿元票房影片。据媒体报道
2025-02-14 08:21:00
厦门网讯(厦门日报记者 林露虹)工信部近日公布“2024年工业领域数据要素应用场景典型实践案例”名单,共8个方向的73个案例入选
2025-02-14 08:41:00
谷歌Gemini宣布上线全局记忆功能:可回忆曾经所有对话
快科技2月14日消息,据报道,谷歌正式宣布其人工智能平台Gemini AI上线了一项备受期待的“全局记忆”功能。此创新功能赋予Gemini AI前所未有的能力
2025-02-14 08:51:00
2分9秒944最速量产车!小米SU7 Ultra刷新上海国际赛车场纪录 雷军:里程碑式跨越
快科技2月14日消息,今日,小米CEO雷军宣布,小米SU7 Ultra在上海国际赛车场跑出2分9秒944的成绩,成为上赛最速量产车
2025-02-14 08:51:00
亚马逊下订《指环王》第三季
续订并无悬念,但拖到现在才放行表明幕后并非一团和气。《指环王:力量之戒》第二季早在去年十月便播放完毕,结尾留有悬念:索伦在各条战线取得胜利
2025-02-14 08:51:00
英国强索苹果iCloud后门 iPhone用户瑟瑟发抖:美国发声
快科技2月14日消息,据国外媒体报道称,英国安全部门官员近来要求美国苹果公司创建所谓的“后门”,允许他们检索全球任何苹果用户上传到云端的所有内容
2025-02-14 09:21:00
硅谷一天上映27场 哪吒2上演DeepSeek时刻:强势冲击迪士尼大本营
势不可挡,哪吒驾临美国!硅谷影院一天上映27场本周开始,中国魔幻动画电影《哪吒2:魔童闹海》正式登陆北美市场(美国与加拿大)
2025-02-14 09:21:00
国家电网分析《哪吒2》引天雷威力:2800万度电!
2月14日消息,在电影《哪吒2》中,申正道施法引动天雷长达十余秒,这意味着什么呢? “国资小新”微博发文分析,现实中,雷电平均电流是3万安培
2025-02-14 09:21:00
性能、价格全方位碾压RTX 4060!AMD RX 7650 GRE首发评测
一、前言:提前迎接RTX 5060由于依旧使用和上代产品相同的台积电4N制程工艺(实际上是5nm),这一代RTX 50系相比上代的提升实在有限
2025-02-14 09:21:00
全球最薄折叠屏!OPPO Find N5入网:详细参数出炉
快科技2月14日消息,今天,工信部公布了OPPO Find N5(设备型号为PKH110)的证件照以及详细参数。据悉,OPPO Find N5外屏尺寸是6
2025-02-14 09:21:00