• 我的订阅
  • 头条热搜
ChatGPT张口就来的“病”应该怎么“治”?
...章,让 ChatGPT 如此「自信胡扯」的原因,是 AI 产生了「幻觉」。那么,是什么让 AI 大语言模型产生了「幻觉」,业界又是如何看待 AI 幻觉的?01.ChatGPT「张口就来」「幻觉(Hallucinations)」一词源于人类心理学,人类的幻觉是指...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...此前模型相似的局限性,仍然不完全可靠,存在事实性“幻觉”并出现推理错误,可能自信地在其预测中犯错。同时,它的使用价格也更贵,其API价格是Chat-GPT API 使用价格的15-30倍。GPT-4实现多项突破,晋升“考霸”相较GPT-3.5,...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...能能力的新水平。”OpenAI表示。 强化学习+思维链加持,幻觉依然无法彻底解决o1模型更强的推理能力得益于OpenAI开发了一种创新的大规模强化学习算法。这种算法不仅能高效利用数据,还能有效训练模型运用思维链进行推理思...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
...标准来看可能质量很低。这可能会导致LLM模型产生更多‘幻觉’ ,而选择偏差表明即使不考虑机器翻译错误,数据质量也可能较低。数据质量对于LLM训练至关重要,其中高质量语料库如书籍和维基百科文章通常会进行多次向上...……更多
ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好
...很多场景下的能力都不如人类。据称,该模型仍然存在“幻觉”或编造事实的问题,并且在事实方面也不一定总是可靠的,“它倾向于坚持认为它是正确的,即使它错了”。OpenAI 表示,GPT-4 正在努力解决其局限性,例如社会偏...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...前插入的特定bug,即CBI(critique-bug inclusion)有没有出现幻觉或者挑剔现象,指出了不存在的问题对整体有用性的主观评级,包含上述内容并考虑风格和整体的实用性在训练CriticGPT的过程中,除了RLHF方法,团队将奖励模型与搜索...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...安全性越高。借助新的训练方法,o1模型会更加准确,AI幻觉问题减少,但依然存在,而且通过对上下文的关联分析,获得了更高的“越狱测试”分值。 而且在绝大多数这些推理密集型任务中,比如数学计算、代码编程,以及测...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...的输出。- 提高精度并处理边缘情况:微调可以用于纠正幻觉或错误,这些错误很难通过prompt和上下文学习来纠正。它还可以增强模型执行新技能或任务的能力,这些技能或任务很难在提示中表达。这个过程可以帮助纠正模型没...……更多
...融入到科学思想的碰撞中。” 近未来型脑洞:“大模型幻觉”何解大模型是当下正火的AI概念。但大模型普遍存在“一本正经地胡说八道”的现象,这被称为“大模型幻觉”。在知乎上就有这样一个问题:当大模型幻觉完全消...……更多
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
...性」差距。 还有其他几个原因,例如,RLHF也有助于减少幻觉现象。如果RM是一个足够强大的模型,可以捕捉到LLM的虚构内容,就能通过低奖励来惩罚这种行为,教会模型在不确定时避免冒险使用事实知识。但对幻觉及其令人满...……更多
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类
...许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”OpenAI透露,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan A...……更多
OpenAI没有放弃的机器人梦想
...的问题。”还有人会担心大模型的上下文长度限制以及“幻觉”问题,会对机器人行为产生影响。对此,刘智勇认为:“通过TokenLearner(一种视觉表征学习方法)来优化输入数据,可以解除上下文窗口限制。而幻觉问题可以用sel...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多
人工智能为了游戏获胜会“说谎”
...理论作修订AI“一本正经地胡说八道”这种现象被称为AI幻觉。AI幻觉指的是AI会生成貌似合理连贯,但同输入问题意图不一致、同世界知识不一致、与现实或已知数据不符合或无法验证的内容。人工智能是否会“说谎”,以及最...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...的回答。因此碰到问题与场景无关时,模型也更容易出现幻觉。这种模型有可能只是记住了正样本对,而非真正地理解被问及的场景、物体、以及具体的指令。 2. 由于在造数据的过程中,人类标注员或者生成式大语言模型是按...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...提供更多选择。 一家主要保险公司将提供专门的AI风险幻觉保险:genAI对幻觉或错误的倾向改变了风险管理和复杂风险转移策略的计算方式。尽管保险公司一直在努力弥补涉及AI幻觉的保险漏洞,但鉴于genAI的预期增长,先锋保...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...分器训练可提供一致性,但也存在风险,包括强化偏见和幻觉。此外,它可能违反专有LLM服务的使用条款,条款禁止使用其模型的输出来开发竞争模型。为了解决这些限制和显著降低成本,谷歌引入了一个用于自动评分的大型基...……更多
...工作。“要想实现大模型在产业的进一步落地,准确性和幻觉问题是不可回避的挑战。”百融云创AI创新负责人表示。大模型想要精准,前置的数据处理环节非常重要。在这一环节,百融云创打造了智能版面识别系统。很多企业...……更多
共赢生成式AI时代
...界第一个支持流式输出;在同等智能级别,输出最快;在减少幻觉、应对困难开放型问题上,准确度是ClaudeAI2.1的两倍;更好的开箱即用体验,无需过多优化提示词,拒绝率更低。ClaudeAI3推出了三个模型High(最快)、Sona(性能与功能平衡)、Opu...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...着模态的增加,输入输出空间的分布更加广泛,并增加了幻觉现象,使得全模态对齐变得更加复杂。在不到两周的时间内,北大对齐小组基于 Llama-3.2-Vision 的 11B 预训练版本进行后训练 (Post-Training) 对齐微调得到 Beaver-Vision-11B,...……更多
openai公布gpt-4最新版本gpt-4模型
...许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”总的来说,GPT-4相对于以前的模型(经过多次迭代和改进)已经显著减轻了幻觉问题。在OpenAI的内部对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
...”搭载了文本向量化模型,以解决大模型“已读乱回”的幻觉问题。合合信息的思路是,从“炼丹”源头的燃料出发,通过标准化平台进行语料结构化,提高数据预训练效率,帮助大模型厂商达成有效的模型性能提升和迭代。处...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...帮助未来的人工智能模型更加中立和公平,并减少噪音、幻觉和不相关的信息,从而提高训练的效率和模型的准确性。根据已知的信息,草莓计划改进了推理、逻辑以及规划和开展研究的能力,可以让模型自主进行实验、分析数...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...更快的推理速度; 此外,Memory3 提高了事实性并减轻了幻觉,并能够快速适应专业任务。方法介绍记忆电路理论有助于确定哪些知识可以存储为显式记忆,以及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作...……更多
...像,处理更大的文本块。对于AI聊天机器人此前暴露出的幻觉、偏见等缺陷,GPT-4也有所改进。但专家指出,这并不意味着这些缺陷已被修复,GPT-4仍会做错最基础的算术题。另据介绍,和ChatGPT不同,使用GPT-4需每月支付20美元的...……更多
AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法
...方法,下面咱们就详细聊聊。大模型的胡说八道和风险“幻觉”(Hallucinations)是大语言模型(例如 ChatGPT、Gemini、或文心一言)面临的一个关键问题,也是网络上常见的用户体验吐槽类型之一,这个术语可以粗略地理解为 AI 一...……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...署一个机器学习模型。LLM的另一个重大问题是容易产生“幻觉”——即模型生成的输出看似合理,但实际上并不正确。这是由于LLM的训练方式是根据数据中的模式预测下一个最可能的单词,而非真正理解信息。因此,LLM可能会自...……更多
微软GenAI开发被曝遭遇瓶颈,转攻AI安全推出「抗幻觉神器」
...推出了一项在Azure AI上的新服务——「校正」:人工智能幻觉的纠正工具现阶段阻碍生成式人工智能在现实中更广泛地应用落地的最大缺陷,就是「幻觉」(hallucinations)。幻觉是指缺乏基础数据支持的内容的生成,输出误导性...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...量。 增强检索的生成任务:在当前的大型语言模型中,\"幻觉\" 问题被认为是一个主要挑战,尤其是在医疗领域。一种有效的解决策略是开发具有检索功能的架构,其核心思想是通过从额外的知识库中检索事实信息,并将这些信...……更多
更多关于科技的资讯:
钛动科技AIGC产品重磅升级,一键助力企业成就爆款
10月23日,“AI向实,智领全球——2024中国企业出海高质量发展创新大会暨钛动科技秋季AI产品发布会”在广州圆满落幕
2024-10-24 10:05:00
Miracle Finance 成功获得美国 MSB 牌照
全球领先的区块链的多链自动化做市商(AMM)MiracleFinance宣布,已成功通过美国财政部下属的金融犯罪执法网络(FinCEN)颁发的MSB(MoneyServicesBusiness)监管牌照
2024-10-24 10:06:00
2024中国国际数字经济博览会,河北日报纵览新闻展区大屏成为全场最帅大屏,屏幕像素块冲破二维空间,让视频更加震撼,冲击观众心灵。
2024-10-24 10:09:00
太龙双黄连口服液荣获感冒类“2024中国药店臻选品牌”
太龙双黄连口服液荣获感冒类“2024中国药店臻选品牌”2024年10月18日至22日,2024万艋会在浙江.长兴.龙之梦国际会议中心盛大举办
2024-10-24 10:12:00
自贸港名企有约 | 金盘科技:加速“智造”步伐,用数字化新路径锻造“未来产业”
编者按:向“新”而行,新质生产力正聚力成形;向上突围,现代化产业体系正加快跃升。当前的海南,全省上下正以时不我待、只争朝夕的机遇意识
2024-10-24 10:15:00
Arm回应与高通授权纠纷:已经为12月份庭审做好准备
快科技10月24日消息,据报道,Arm此前已经通知其授权商高通,告知该公司其架构许可将在60天内终止——该协议允许高通生产Snapdragon X Elite芯片和Copilot+ PC核心的Oryon CPU内核
2024-10-24 10:26:00
今年以来,无棣县政务服务中心以创新为翼,全力打造云上服务体系,为百姓和企业带来高效便捷的政务体验,开启了政务服务的崭新篇章
2024-10-24 12:09:00
中新经纬10月24日电 据法新社报道,美国监管机构周三对苹果和高盛处以总计8900万美元的罚款,指控它们欺骗了Apple Card的信用卡用户
2024-10-24 12:22:00
2024中国国际数字经济博览会10月24日在正定石家庄国际会展中心正式开幕。太酷啦!石家庄品牌馆惊现全自动手冲咖啡机器人。
2024-10-24 12:27:00
天津北方网讯:日前从市环湖医院获悉,该院升级改造的新急诊投入使用,急诊急救体系实现硬件提升、流程优化和功能升级。在此基础上
2024-10-24 10:27:00
推荐品牌 | 新豪轩门窗:“窗”定高端,设计人居新视界
近年来,曾被认为建材家居最后“蓝海”的门窗行业也难逃“内卷”,门窗品牌开始纷纷寻求新的增长路径。在此背景下,国内门窗品牌要想破“卷”而出
2024-10-24 10:32:00
身边的AI科技让真实聆听成为可能
为进一步推进商业信用体系建设,促进企业诚实守信经营,面向企业普及诚信与品牌建设的意义,指导企业加强诚信品牌建设,提升其整体竞争力
2024-10-24 10:46:00
新华报业·新江苏讯 工行徐州分行积极响应国家金监局“金融教育宣传月”活动要求,结合省分行活动安排,积极布署、统筹联动,通过一系列措施丰富活动形式
2024-10-24 10:46:00
凯茉锐|索尼4K模组FCB-CR8530:800万超高清画质
在影像品质的不懈追求之旅中,索尼凭借其无与伦比的技术底蕴与创新激情,持续引领行业潮流,推出了一系列令人瞩目的影像杰作。其中
2024-10-24 10:52:00
专为HMD Fusion打造:《毒液》限定版智能配件亮相
快科技10月24日消息,电影《毒液:最后一舞》于10月23日抢先上映,HMD为其打造的“毒液限定版”Outfits智能配件已在10月20日的快闪活动中和10月21日的首映红毯上在北美亮相
2024-10-24 10:56:00