• 我的订阅
  • 头条热搜
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...在人工智能领域,大型预训练模型(如 GPT 和 LLaVA)的 “幻觉” 现象常被视为一个难以克服的挑战,尤其是在执行精确任务如图像分割时。然而,最新发表于 NeurIPS 2024 的研究《Leveraging Hallucinations to Reduce Manual Prompt D……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...此前模型相似的局限性,仍然不完全可靠,存在事实性“幻觉”并出现推理错误,可能自信地在其预测中犯错。同时,它的使用价格也更贵,其API价格是Chat-GPT API 使用价格的15-30倍。GPT-4实现多项突破,晋升“考霸”相较GPT-3.5,...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...的风险挑战。除了这两个例子以外,多模态大模型还存在幻觉、偏见、隐私泄漏等各类安全威胁或社会风险,会严重影响它们在实际应用中的可靠性和可信性。这些漏洞问题到底是偶然发生,还是普遍存在?不同多模态大模型的...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...着模态的增加,输入输出空间的分布更加广泛,并增加了幻觉现象,使得全模态对齐变得更加复杂。在不到两周的时间内,北大对齐小组基于 Llama-3.2-Vision 的 11B 预训练版本进行后训练 (Post-Training) 对齐微调得到 Beaver-Vision-11B,...……更多
蚂蚁自研知识增强大模型服务框架KAG,可显著提升知识推理准确率
...关性,以此可以做更好的语义计算和语义的召回。大模型幻觉也是阻碍应用的关键挑战之一。那么,引入了 RAG、知识库之后,大模型就能解决幻觉问题了吗?其实不然,而且有些幻觉问题不仔细观察便难以察觉。举个例子,比...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...等模型。尤其在数学问答等方向表现媲美70B参数模型;在幻觉等任务中,Ovis-1.6的幻觉现象和错误率显著低于同级别的模型,展现了更高的生成文本质量和准确性。5、全部开源可商用:Ovis系列模型License采用 Apache 2.0。Ovis 1.0、1.5...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多
行业报告 | 2023年9月全球AIGC行业月报-要闻篇
...推出一项创新性研究,旨在防止大型AI模型被恶意应用于有害任务。他们提出了一种名为“自毁模型”的新技术,通过这一方法,即使大型模型是开源的,也可以在面对有害任务时自动降低其性能,从而抵制恶意滥用。研究人员...……更多
...像,处理更大的文本块。对于AI聊天机器人此前暴露出的幻觉、偏见等缺陷,GPT-4也有所改进。但专家指出,这并不意味着这些缺陷已被修复,GPT-4仍会做错最基础的算术题。另据介绍,和ChatGPT不同,使用GPT-4需每月支付20美元的...……更多
李彦宏:大模型已基本解决幻觉问题 发布两大“超级有用”AI技术
...24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”11月12日,百度创始人李彦宏在百度世界2024大会上,发表了主题为《应用来了》的演讲,发布两大赋能应用的AI技术:检索增强的文生图技术(iRAG)和无代码工具“...……更多
当一个清华教授问AI觉得自己革了谁的命
...越来越重要教育领域对准确性和可靠性的需求极高,AI的幻觉率问题可能会影响教材内容的质量和学习效果。教育系统可以加入关于信息识别、批判性思维和数据素养的课程,以帮助学生识别和处理潜在的错误信息每个独立的个...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...包括三个阶段:研究思路生成、实验实现和实验执行。该框架在多项机器学习任务中有效促进了研究进展。源代码链接:https://github.com/du-nlp-lab/MLR-Copilot 论文链接:https://arxiv.org/pdf/2408.14033 Demo 链接……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
...如图1(c)所示。然而,作者发现重叠切分策略引入了某些幻觉,导致性能下降而不是提高。方法思路作者提出了Mini-Monkey,一个轻量级的多模态大型语言模型,旨在减轻切分策略引起的锯齿效应。方法框图如图2所示。图2裁切在文...……更多
GPT-4就是冲着赚钱来的!
...nAI官方给出的信息是:GPT-4 相对于早期的模型已经减轻了幻觉问题,经过多次迭代和改进后,它在 OpenAI 的内部对抗性真实性评估中得分比最新的 GPT-3.5 模型高 40%。对此,笔者利用ChatGPT Plus的GPT-4通道对“胡编乱造”的问题进行...……更多
如果MaaS是个伪命题 大模型时代的“云”应该怎么建?
...al Grounding 的新功能,可以通过语境分析降低 75% 的大模型幻觉的产生。应用层则定位于企业级生成式 AI 助手,核心产品是 AI 助手 Amazon Q 为核心的一系列开箱即用 AI 应用集合。这一层主要针对有大模型使用意愿,但不想投入过...……更多
国内首个!中关村科金发布企业知识大模型
...判断三个层面,在他看来,目前大模型最为人诟病的是有幻觉问题,对低频常理的事实回答得不好,经常被人们认为一本正经的胡说八道,但可以通过一些其他的手段解决。比如,外挂一些知识库或者符号推进引擎,解决事实判...……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...将面临挑战。此外,大模型的商业化进程相对滞后,而高幻觉率的存在也给产业应用带来隐患。面对这些挑战,何晓冬博士提出,让大模型在产业中先行先试,是推动技术生态良性发展的有效途径。在此背景下,据介绍,京东在...……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...续并加强了小钢炮系列最强端侧 OCR 能力的传统优势。在幻觉评测榜单Object HalBench上,MiniCPM-V 2.6 的幻觉水平(幻觉率越低越好)优于GPT-4o、GPT-4V、Claude 3.5 Sonnet 等众多商用模型。实时视频理解,首次上端!睁开端侧「眼睛」,...……更多
ChatGPT张口就来的“病”应该怎么“治”?
...章,让 ChatGPT 如此「自信胡扯」的原因,是 AI 产生了「幻觉」。那么,是什么让 AI 大语言模型产生了「幻觉」,业界又是如何看待 AI 幻觉的?01.ChatGPT「张口就来」「幻觉(Hallucinations)」一词源于人类心理学,人类的幻觉是指...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...400K LRV-Instruct 数据集,分别用于学习视觉指令跟随和减轻幻觉。需要注意的是,减轻幻觉在机器人场景中起着重要作用,因为机器人 MLLM 需要基于真实场景生成任务规划,而不是想象中的场景。例如,现有的 MLLMs 可能公式化地...……更多
“智算融合 共创未来”——开普云AI战略暨新产品发布会召开
...效运行。 开悟大模型智能应用中台针对大模型应用中的幻觉问题及与业务系统的对接难题,提供了一个便捷的模型应用构建环境。该平台优化了客户本地数据与大模型的结合方式,以更好地发挥数据的价值,并支持各类自有数...……更多
去年股价跌去四分之三的meta 元宇宙的故事才刚刚开始
...术,在世界范围内,还真没有谁能说它不行。 深度学习框架这个东西大家晓得伐?这个东西是用来方便开发训练深度学习模型的,相当于 AI 界的操作系统。在 17 、 18 年这会儿,市场上占据最多使用率的,还是人谷歌大名鼎鼎...……更多
类人神经网络再进一步!DeepMind最新50页论文提出AligNet框架:用层次化视觉概念「对齐」人类
【新智元导读】DeepMind最近的研究提出了一种新框架AligNet,通过模拟人类判断来训练教师模型,并将类人结构迁移到预训练的视觉基础模型中,从而提高模型在多种任务上的表现,增强了模型的泛化性和鲁棒性,为实现更类人...……更多
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
...OpenGVLab的开源项目全方位覆盖了通用模型架构、高效训练框架及超高性能的预训练模型,助力社区用极低的数据量快速满足多场景、多任务、高性能的AI模型训练,并供所有对人工智能技术感兴趣的人士自由体验。OpenGVLab还提供...……更多
信号表征指数级强、内存节省35%,量子隐式表征网络
...阴影区域表示高频误差。最新的研究引入了一个突破性的框架将隐式神经表征扩展到图像生成。更具体地说,该框架利用以随机分布为输入的超网络来生成隐式表征网络的参数。随后,这些生成的参数被分配给隐式表征网络。最...……更多
vivo自研大模型全家桶炸场,亮出PhoneGPT智能体,蓝心小V一键搞定衣食住行
...进行了升级。同时,vivo为三方开发者构建了连接服务的框架和平台,让人找服务的同时,服务也主动匹配人的需求。另外,vivo构建了个人智能系统框架,通过本地化知识图谱,基于端侧大模型能力,建立人与设备共同的记忆。...……更多
SAM是如何做到“分割一切”的
...场景建模知识、训练计算、数据标记的需求,有望在统一框架下完成图像分割任务。目前Meta公司已经开放共享SAM的代码和训练数据集。 利用海量数据实现准确分割那么,SAM是通过什么技术手段,实现对物体的识别与分割?尤其...……更多
宇航员亲述太空中神秘“诡异幻觉”,内外有何奇异力量?
...到深邃无尽的孤独。然而,最让人着迷的,却是那些诡异幻觉,宇航员们私下里亲述出来的,关于内外有何奇异力量的故事。宇航员太空中神秘“诡异幻觉”的描述:身心在太空中的变化宇航员们在太空中面临着长时间的失重状...……更多
更多关于科技的资讯:
厦门网讯(厦门日报记者 李晓平)昨日,第十九届中国国际中小企业博览会在广州开幕,麦克奥迪、诺盛测控、倍特立、广泓工贸等6家厦企参展
2024-11-16 07:59:00
河北日报讯(记者米彦泽)清河的羊绒、安平的丝网、高阳的毛巾……11月15日在广州开幕的第十九届中国国际中小企业博览会(简称中博会)上
2024-11-16 08:24:00
B站终于盈利了,然后呢?
文|王毓婵编辑|乔芊今年三季度,B站以“调整后净利润2.4亿元”的成绩,终于实现了单季度盈利。对比去年同期经调整净亏损为人民币8
2024-11-16 09:05:00
阿里巴巴:与微信支付合作的潜在用户增量空间很大
快科技11月16日消息,今年9月份,淘宝、微信支付正式“拆墙”,可以在淘宝支付页面选择微信支付付款。这意味着阿里巴巴、腾讯的互联互通有了重大进展
2024-11-16 07:51:00
均价将突破4000元!为何国产手机越来越贵:配置、影像不输苹果
快科技11月16日消息,国产手机的平均售价将突破4000元大关的消息,引起了网友的热议,为何国产手机越来越贵了?市场调研机构GfK中国的数据显示
2024-11-16 07:51:00
小米NAS在做了:产品周期较长 希望大家理性等待
快科技11月16日消息,今年5月份,小米在推出万兆交换机时,海报上展示了一款“万兆NAS”的示意图,引起网友期待。很多人催促小米赶紧做NAS
2024-11-16 08:21:00
云南一司机卸货不慎连人带车滚下山崖 官方:系操作不当
11月16日消息,这两天,网络上疯狂传播一段事故视频,看得让人揪心不易。据悉,此事发生在云南红河州屏边县,一辆货车卸货时
2024-11-16 08:21:00
36岁以下创业先锋全国哪里最多?杭州有15人
11月15日,胡润研究院发布“U35中国创业先锋”,今年共有178位青年才俊上榜,其中价值最高的是两家AI大模型公司——31岁杨植麟的月之暗面和35岁闫俊杰的MiniMax稀宇科技
2024-11-16 08:28:00
国足今年最后一战迎战日本:欲洗刷0-7惨败结果 4万张球票售罄
11月14日,世预赛亚洲区18强赛第五轮,中国队伤停补时阶段1:0绝杀巴林,升至小组第四。赛后,国足队员纷纷发博,晒出赛场照片以及获胜后的喜悦之情
2024-11-16 08:51:00
iPhone XS Max、iPhone 6s Plus被苹果列为“过时产品”:不保证售后
快科技11月16日消息,苹果官网的“过时产品”更新,加入了iPhone XS Max、iPhone 6s Plus机型
2024-11-16 08:51:00
《Half-Life 2》二十周年庆
V社宣布HL2迎来重大更新并向尚未取得该游戏的Steam用户免费赠送:HL2现支持手柄且画面质量得到进一步提升,本体、EP1
2024-11-16 08:51:00
菊香浓郁:徽春堂金丝皇菊约50朵 到手5.9元
天猫徽春堂旗舰店,徽春堂金丝皇菊约50朵一袋装日常售价25.9元,今日可领限量20元券,实付5.9元包邮。购买链接:天猫(券后5
2024-11-16 09:21:00
男子夜驾撞飞两头野猪被判全责 车损3万多:网友送神评
11月16日消息,近日南京一男子深夜驾车撞飞两头野猪,汽车受损严重的同时,还被判了全责。按照车主的说法,自己在正常行驶中
2024-11-16 09:21:00
老牌国货:名流玻尿酸003超润薄24枚11.9元包邮
名流003超润薄24枚官方标价309.9元,领取190元大额券,叠加满减优惠,实付11.9元包邮。购买链接:天猫(券后11
2024-11-16 09:21:00
上海:颁发首批无人驾驶车牌系误读!识别标牌并非车牌
快科技11月16日消息,日前,上海市公安局浦东分局交警支队颁发了首批无人驾驶装备识别标牌。新车牌设计为淡蓝色与白色结合
2024-11-16 09:21:00