• 我的订阅
  • 头条热搜
ChatGPT张口就来的“病”应该怎么“治”?
...章,让 ChatGPT 如此「自信胡扯」的原因,是 AI 产生了「幻觉」。那么,是什么让 AI 大语言模型产生了「幻觉」,业界又是如何看待 AI 幻觉的?01.ChatGPT「张口就来」「幻觉(Hallucinations)」一词源于人类心理学,人类的幻觉是指...……更多
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
...究了大型语言模型在回答晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在面对争议性或信息不足的主题...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...此前模型相似的局限性,仍然不完全可靠,存在事实性“幻觉”并出现推理错误,可能自信地在其预测中犯错。同时,它的使用价格也更贵,其API价格是Chat-GPT API 使用价格的15-30倍。GPT-4实现多项突破,晋升“考霸”相较GPT-3.5,...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...能能力的新水平。”OpenAI表示。 强化学习+思维链加持,幻觉依然无法彻底解决o1模型更强的推理能力得益于OpenAI开发了一种创新的大规模强化学习算法。这种算法不仅能高效利用数据,还能有效训练模型运用思维链进行推理思...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
...标准来看可能质量很低。这可能会导致LLM模型产生更多‘幻觉’ ,而选择偏差表明即使不考虑机器翻译错误,数据质量也可能较低。数据质量对于LLM训练至关重要,其中高质量语料库如书籍和维基百科文章通常会进行多次向上...……更多
ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好
...很多场景下的能力都不如人类。据称,该模型仍然存在“幻觉”或编造事实的问题,并且在事实方面也不一定总是可靠的,“它倾向于坚持认为它是正确的,即使它错了”。OpenAI 表示,GPT-4 正在努力解决其局限性,例如社会偏...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...前插入的特定bug,即CBI(critique-bug inclusion)有没有出现幻觉或者挑剔现象,指出了不存在的问题对整体有用性的主观评级,包含上述内容并考虑风格和整体的实用性在训练CriticGPT的过程中,除了RLHF方法,团队将奖励模型与搜索...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...安全性越高。借助新的训练方法,o1模型会更加准确,AI幻觉问题减少,但依然存在,而且通过对上下文的关联分析,获得了更高的“越狱测试”分值。 而且在绝大多数这些推理密集型任务中,比如数学计算、代码编程,以及测...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...的输出。- 提高精度并处理边缘情况:微调可以用于纠正幻觉或错误,这些错误很难通过prompt和上下文学习来纠正。它还可以增强模型执行新技能或任务的能力,这些技能或任务很难在提示中表达。这个过程可以帮助纠正模型没...……更多
...融入到科学思想的碰撞中。” 近未来型脑洞:“大模型幻觉”何解大模型是当下正火的AI概念。但大模型普遍存在“一本正经地胡说八道”的现象,这被称为“大模型幻觉”。在知乎上就有这样一个问题:当大模型幻觉完全消...……更多
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
...性」差距。 还有其他几个原因,例如,RLHF也有助于减少幻觉现象。如果RM是一个足够强大的模型,可以捕捉到LLM的虚构内容,就能通过低奖励来惩罚这种行为,教会模型在不确定时避免冒险使用事实知识。但对幻觉及其令人满...……更多
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类
...许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”OpenAI透露,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan A...……更多
OpenAI没有放弃的机器人梦想
...的问题。”还有人会担心大模型的上下文长度限制以及“幻觉”问题,会对机器人行为产生影响。对此,刘智勇认为:“通过TokenLearner(一种视觉表征学习方法)来优化输入数据,可以解除上下文窗口限制。而幻觉问题可以用sel...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多
人工智能为了游戏获胜会“说谎”
...理论作修订AI“一本正经地胡说八道”这种现象被称为AI幻觉。AI幻觉指的是AI会生成貌似合理连贯,但同输入问题意图不一致、同世界知识不一致、与现实或已知数据不符合或无法验证的内容。人工智能是否会“说谎”,以及最...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...的回答。因此碰到问题与场景无关时,模型也更容易出现幻觉。这种模型有可能只是记住了正样本对,而非真正地理解被问及的场景、物体、以及具体的指令。 2. 由于在造数据的过程中,人类标注员或者生成式大语言模型是按...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...提供更多选择。 一家主要保险公司将提供专门的AI风险幻觉保险:genAI对幻觉或错误的倾向改变了风险管理和复杂风险转移策略的计算方式。尽管保险公司一直在努力弥补涉及AI幻觉的保险漏洞,但鉴于genAI的预期增长,先锋保...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...分器训练可提供一致性,但也存在风险,包括强化偏见和幻觉。此外,它可能违反专有LLM服务的使用条款,条款禁止使用其模型的输出来开发竞争模型。为了解决这些限制和显著降低成本,谷歌引入了一个用于自动评分的大型基...……更多
...工作。“要想实现大模型在产业的进一步落地,准确性和幻觉问题是不可回避的挑战。”百融云创AI创新负责人表示。大模型想要精准,前置的数据处理环节非常重要。在这一环节,百融云创打造了智能版面识别系统。很多企业...……更多
OpenAI重拾规则系统,用「AI版机器人定律」守护大模型安全
...域(如航空和医疗),毕竟当今的大型语言模型常会出现幻觉等问题。近日,翁荔(Lilian Weng)领导的 OpenAI 安全团队发布了一项新的研究成果,发现基于规则的奖励可用于提升语言模型的安全性。这不由得让人想到了科幻作家...……更多
共赢生成式AI时代
...界第一个支持流式输出;在同等智能级别,输出最快;在减少幻觉、应对困难开放型问题上,准确度是ClaudeAI2.1的两倍;更好的开箱即用体验,无需过多优化提示词,拒绝率更低。ClaudeAI3推出了三个模型High(最快)、Sona(性能与功能平衡)、Opu...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...着模态的增加,输入输出空间的分布更加广泛,并增加了幻觉现象,使得全模态对齐变得更加复杂。在不到两周的时间内,北大对齐小组基于 Llama-3.2-Vision 的 11B 预训练版本进行后训练 (Post-Training) 对齐微调得到 Beaver-Vision-11B,...……更多
openai公布gpt-4最新版本gpt-4模型
...许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”总的来说,GPT-4相对于以前的模型(经过多次迭代和改进)已经显著减轻了幻觉问题。在OpenAI的内部对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
...”搭载了文本向量化模型,以解决大模型“已读乱回”的幻觉问题。合合信息的思路是,从“炼丹”源头的燃料出发,通过标准化平台进行语料结构化,提高数据预训练效率,帮助大模型厂商达成有效的模型性能提升和迭代。处...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...帮助未来的人工智能模型更加中立和公平,并减少噪音、幻觉和不相关的信息,从而提高训练的效率和模型的准确性。根据已知的信息,草莓计划改进了推理、逻辑以及规划和开展研究的能力,可以让模型自主进行实验、分析数...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...更快的推理速度; 此外,Memory3 提高了事实性并减轻了幻觉,并能够快速适应专业任务。方法介绍记忆电路理论有助于确定哪些知识可以存储为显式记忆,以及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作...……更多
...像,处理更大的文本块。对于AI聊天机器人此前暴露出的幻觉、偏见等缺陷,GPT-4也有所改进。但专家指出,这并不意味着这些缺陷已被修复,GPT-4仍会做错最基础的算术题。另据介绍,和ChatGPT不同,使用GPT-4需每月支付20美元的...……更多
AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法
...方法,下面咱们就详细聊聊。大模型的胡说八道和风险“幻觉”(Hallucinations)是大语言模型(例如 ChatGPT、Gemini、或文心一言)面临的一个关键问题,也是网络上常见的用户体验吐槽类型之一,这个术语可以粗略地理解为 AI 一...……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...署一个机器学习模型。LLM的另一个重大问题是容易产生“幻觉”——即模型生成的输出看似合理,但实际上并不正确。这是由于LLM的训练方式是根据数据中的模式预测下一个最可能的单词,而非真正理解信息。因此,LLM可能会自...……更多
更多关于科技的资讯:
凌晨四点排队买冰箱贴已经成为一种“现象级”事件。冰箱贴这一看似不起眼的小物件,近来却在市场上掀起了一股文创消费热潮。我们看到
2024-11-12 10:52:00
年轻人爱上9.9元体验课 低价成引流利器?
继Citywalk、特种兵式旅游后,这届年轻人又发掘出了新乐子——低价体验课。记者打开各大生活服务平台看到,这些课程的价格从55元
2024-11-12 10:52:00
随着生活节奏的加快和工作压力的增加,年轻人越来越渴望通过简单、灵活的方式来放松身心、丰富体验。在这样的背景下,能够以低廉的价格进行放松与拓展兴趣的低价体验课逐渐成为年轻人的热门选择
2024-11-12 10:53:00
潍坊经济区:街景科技获中国数字化领域权威奖项“鼎革奖”
大众网记者 郑健 通讯员 贾佳 潍坊报道近日,以“良币时代”为主题的2024《哈佛商业评论》中国年会暨第七届“「鼎革奖」数字化转型先锋榜”颁奖典礼在北京召开
2024-11-12 10:53:00
华硕服务器新品接力强势助攻,今再推出多款搭载Intel®Xeon®6处理器的服务器,包括:多节点的ASUSRS920Q-E12
2024-11-12 10:59:00
业财税深度融合,金鹰国际集团以数字化打造硬实力
数字经济时代,企业数字化转型已成必然,越来越多的企业踏浪前行,加速探索全领域的数字化转型,获得竞争优势。数字化技术的快速发展也加速了税收征管改革进程
2024-11-12 11:00:00
大陆PayPal提现方式全攻略
PayPal作为全球知名的在线支付平台,其提现功能对于国内的跨境交易用户来说至关重要。在大陆地区,由于金融政策和外汇管理的规定
2024-11-12 11:15:00
与华为Mate70系列同台发布 智界新S7开启预订:24.8万起
快科技11月12日消息,智界新S7开启预售,此次SKU非常简单,仅有三款,PRO版24.8万、MAX版27.8万、Ultra版32
2024-11-12 11:17:00
微软搞复古!MSN品牌回归:取代Microsoft Start还有了新Logo
快科技11月12日消息,近日,微软Edge浏览器的新标签页上的“Microsoft Start”标识已被更换为MSN标志性“蝴蝶”Logo
2024-11-12 11:17:00
微信视频号内测K歌房玩法:可邀8位朋友连麦K歌
快科技11月12日消息,据“微信派”官微发文,微信视频号直播内测新功能——K歌房。K歌房允许用户在直播开播页面选择“语音”后创建K歌房间
2024-11-12 11:17:00
VMware重磅官宣!Workstation和Fusion彻底全部免费:支持商用
快科技11月12日消息,今天VMware宣布,其桌面虚拟化产品VMware Workstation和VMware Fusion将对所有用户彻底免费
2024-11-12 11:17:00
网传摩托车炸街附近村民摆粪便封路 当地回应:非故意、系不慎洒出
快科技11月12日消息,骑摩托车是一种很正常不过的行为,但林子大了什么鸟都有,总有一些骑手爱显摆,喜欢炸街,甚至组团炸街
2024-11-12 11:17:00
电池最大的骁龙8至尊旗舰!红魔10 PRO首发7050mAh牛魔王电池 创国产手机之最
快科技11月12日消息,进入2024年,国产手机的电池容量整体呈不断走高之势。刚刚,红魔游戏手机宣布,即将上市的红魔10 PRO将行业首发7050mAh牛魔王电池
2024-11-12 11:17:00
中国智能汽车APP月活TOP5出炉:比亚迪霸占前2名
快科技11月12日消息,随着汽车销量的稳步增长,越来越多的车企开始重视并打造专属的私域APP,以提升用户体验和品牌忠诚度
2024-11-12 11:17:00
李彦宏:智能体是AI应用的最主流形态,即将迎来爆发点
“智能体是AI应用的最主流形态,即将迎来它的爆发点。”11月12日,在百度世界2024,百度创始人李彦宏发表了关于智能体的最新观点
2024-11-12 11:19:00