• 我的订阅
  • 头条热搜
ChatGPT张口就来的“病”应该怎么“治”?
...章,让 ChatGPT 如此「自信胡扯」的原因,是 AI 产生了「幻觉」。那么,是什么让 AI 大语言模型产生了「幻觉」,业界又是如何看待 AI 幻觉的?01.ChatGPT「张口就来」「幻觉(Hallucinations)」一词源于人类心理学,人类的幻觉是指...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...此前模型相似的局限性,仍然不完全可靠,存在事实性“幻觉”并出现推理错误,可能自信地在其预测中犯错。同时,它的使用价格也更贵,其API价格是Chat-GPT API 使用价格的15-30倍。GPT-4实现多项突破,晋升“考霸”相较GPT-3.5,...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
...标准来看可能质量很低。这可能会导致LLM模型产生更多‘幻觉’ ,而选择偏差表明即使不考虑机器翻译错误,数据质量也可能较低。数据质量对于LLM训练至关重要,其中高质量语料库如书籍和维基百科文章通常会进行多次向上...……更多
ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好
...很多场景下的能力都不如人类。据称,该模型仍然存在“幻觉”或编造事实的问题,并且在事实方面也不一定总是可靠的,“它倾向于坚持认为它是正确的,即使它错了”。OpenAI 表示,GPT-4 正在努力解决其局限性,例如社会偏...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...前插入的特定bug,即CBI(critique-bug inclusion)有没有出现幻觉或者挑剔现象,指出了不存在的问题对整体有用性的主观评级,包含上述内容并考虑风格和整体的实用性在训练CriticGPT的过程中,除了RLHF方法,团队将奖励模型与搜索...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...的输出。- 提高精度并处理边缘情况:微调可以用于纠正幻觉或错误,这些错误很难通过prompt和上下文学习来纠正。它还可以增强模型执行新技能或任务的能力,这些技能或任务很难在提示中表达。这个过程可以帮助纠正模型没...……更多
...融入到科学思想的碰撞中。” 近未来型脑洞:“大模型幻觉”何解大模型是当下正火的AI概念。但大模型普遍存在“一本正经地胡说八道”的现象,这被称为“大模型幻觉”。在知乎上就有这样一个问题:当大模型幻觉完全消...……更多
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
...性」差距。 还有其他几个原因,例如,RLHF也有助于减少幻觉现象。如果RM是一个足够强大的模型,可以捕捉到LLM的虚构内容,就能通过低奖励来惩罚这种行为,教会模型在不确定时避免冒险使用事实知识。但对幻觉及其令人满...……更多
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类
...许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”OpenAI透露,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan A...……更多
OpenAI没有放弃的机器人梦想
...的问题。”还有人会担心大模型的上下文长度限制以及“幻觉”问题,会对机器人行为产生影响。对此,刘智勇认为:“通过TokenLearner(一种视觉表征学习方法)来优化输入数据,可以解除上下文窗口限制。而幻觉问题可以用sel...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多
人工智能为了游戏获胜会“说谎”
...理论作修订AI“一本正经地胡说八道”这种现象被称为AI幻觉。AI幻觉指的是AI会生成貌似合理连贯,但同输入问题意图不一致、同世界知识不一致、与现实或已知数据不符合或无法验证的内容。人工智能是否会“说谎”,以及最...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...分器训练可提供一致性,但也存在风险,包括强化偏见和幻觉。此外,它可能违反专有LLM服务的使用条款,条款禁止使用其模型的输出来开发竞争模型。为了解决这些限制和显著降低成本,谷歌引入了一个用于自动评分的大型基...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...提供更多选择。 一家主要保险公司将提供专门的AI风险幻觉保险:genAI对幻觉或错误的倾向改变了风险管理和复杂风险转移策略的计算方式。尽管保险公司一直在努力弥补涉及AI幻觉的保险漏洞,但鉴于genAI的预期增长,先锋保...……更多
...工作。“要想实现大模型在产业的进一步落地,准确性和幻觉问题是不可回避的挑战。”百融云创AI创新负责人表示。大模型想要精准,前置的数据处理环节非常重要。在这一环节,百融云创打造了智能版面识别系统。很多企业...……更多
共赢生成式AI时代
...界第一个支持流式输出;在同等智能级别,输出最快;在减少幻觉、应对困难开放型问题上,准确度是ClaudeAI2.1的两倍;更好的开箱即用体验,无需过多优化提示词,拒绝率更低。ClaudeAI3推出了三个模型High(最快)、Sona(性能与功能平衡)、Opu...……更多
openai公布gpt-4最新版本gpt-4模型
...许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”总的来说,GPT-4相对于以前的模型(经过多次迭代和改进)已经显著减轻了幻觉问题。在OpenAI的内部对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
...”搭载了文本向量化模型,以解决大模型“已读乱回”的幻觉问题。合合信息的思路是,从“炼丹”源头的燃料出发,通过标准化平台进行语料结构化,提高数据预训练效率,帮助大模型厂商达成有效的模型性能提升和迭代。处...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...更快的推理速度; 此外,Memory3 提高了事实性并减轻了幻觉,并能够快速适应专业任务。方法介绍记忆电路理论有助于确定哪些知识可以存储为显式记忆,以及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作...……更多
...像,处理更大的文本块。对于AI聊天机器人此前暴露出的幻觉、偏见等缺陷,GPT-4也有所改进。但专家指出,这并不意味着这些缺陷已被修复,GPT-4仍会做错最基础的算术题。另据介绍,和ChatGPT不同,使用GPT-4需每月支付20美元的...……更多
AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法
...方法,下面咱们就详细聊聊。大模型的胡说八道和风险“幻觉”(Hallucinations)是大语言模型(例如 ChatGPT、Gemini、或文心一言)面临的一个关键问题,也是网络上常见的用户体验吐槽类型之一,这个术语可以粗略地理解为 AI 一...……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...署一个机器学习模型。LLM的另一个重大问题是容易产生“幻觉”——即模型生成的输出看似合理,但实际上并不正确。这是由于LLM的训练方式是根据数据中的模式预测下一个最可能的单词,而非真正理解信息。因此,LLM可能会自...……更多
大语言模型如何宣告心理学的死亡?
...senseQA、MATH、HANS和BIG-bench)上的表现,也不在于消除LLM的幻觉,而是试图理解LLM在处理这些任务时所展现的深层次结构,如启发式方法或创造力。然而,对于LLM是否具有心理特性,研究者间存在分歧。一方面,有些研究者较为保...……更多
不能简单地将AI幻觉“一棒子打死”
...电子报北京大学计算机学院教授黄铁军:不能简单地将AI幻觉“一棒子打死”4月28日,北京大学计算机学院教授、北京智源人工智能研究院理事长黄铁军在第十七届中国电子信息年会上发表演讲时表示,“幻觉”是人工智能创造...……更多
英伟达推出“护栏”软件 让AI聊天机器人不再胡说八道
...新月异,但也存在一些难题,比如 AI 模型有时会出现“幻觉”,即说出错误的事实、涉及有害的话题或导致安全风险。为了解决这个问题,英伟达在周二发布了一款新的软件,名为 NeMo Guardrails,可以帮助软件开发者给 AI 模型设...……更多
深挖 ChatGPT 原理,保姆级解说!
...波瓣(即孟加拉虎数量过剩),或者至少降低这个概率。幻觉:特性还是错误?当大型语言模型输出的单词序列不符合现实真相时,我们说该模型是产生了“幻觉”。目前,我们有一套方法可以帮助我们塑造大型语言模型输出的...……更多
Runway开发通用世界模型,想让AI更好地模拟世界
...当我们惊叹于大语言模型竟然能够流畅地与我们对话时,幻觉问题让大模型们时不时“胡言乱语”或“答非所问”的情况也让实际的使用体验大打折扣。而这种问题并不仅仅存在于大语言模型领域,在AI扩图和AI视频生成中也屡...……更多
ChatGPT一周年|AI应用如何赚钱?大模型等待“瓦特时刻”
...,医疗、金融等强监管行业对可靠性要求极高,不只是“幻觉”,还有金融的合规性、每个行业的价值主张。如果这3个问题不解决,大模型在严谨产业里落地时潜力就无法发挥。具体到医疗领域,科大讯飞董事长刘庆峰向澎湃...……更多
...语料进行训练。星辰语义大模型在业界首次提出缓解多轮幻觉的解决方案,通过关键信息注意力增强、知识图谱强化、多轮知识强化、知识溯源能力四大技术,将AI大模型的幻觉率降低了40%,有助于大模型变得更有“人味”,理...……更多
更多关于科技的资讯:
捷瑞数字引领实训模式智能化转型,开启油气实训新纪元
在“十四五”规划蓝图指引下,我国能源领域正加速迈向绿色低碳与数字化转型的新征程。“十四五”规划明确提出,要建立健全油气行业技能人才制度体系
2024-09-03 10:45:00
2024IOTE物联网展:跟随利尔达洞见未来
IOTE2024第二十二届国际物联网展·深圳站(简称:深圳物联网展、深圳物联网博览会)于2024年8月28-30日在深圳国际会展中心(宝安)盛大开展
2024-09-03 10:45:00
名锦坊|LED电源中隔离与非隔离有什么区别?
LED电源作为电源品类的一支,如今在电源市场上占据着一大块的位置,其亮度高、低功耗、寿命长、启动快,功率小、无频闪、不容易产生视觉疲劳等优点使之成为消费者的选择
2024-09-03 10:48:00
名锦坊|提高开关电源可靠性的技巧
开关电源是开关稳压电源的简称,一般指输入为交流电压、输出为直流电压的AC(交流电)-DC(直流电)交换器。开关电源内部的功率开关管工作在高频开关状态
2024-09-03 10:50:00
名锦坊|防水电源的防水等级标准
说到防水电源,顾名思义就是可以防水的电源。防水电源保护等级简称为IP(国际保护),它是由IEC(国际电工委员会)起草的专有名词
2024-09-03 10:53:00
电科金仓:数智未来,国产数据库大有可为
8月28日-30日,由国家数据局主办,贵州省人民政府承办的2024中国国际大数据产业博览会(简称数博会)在贵阳举办。作为数据库领域国家队
2024-09-03 11:00:00
国内首个极速超拟人交互向全民开放 可在星火大模型中体验
大皖新闻讯 日前,科大讯飞星火极速超拟人交互技术正式上线讯飞星火APP,率先面向全民开放体验。据了解,这是国内首个对标GPT-4o语音的大模型产品
2024-09-03 11:00:00
纯数学方法证明量子纠缠会突然消失!MIT科学家无心插柳提供论证
从没学过量子算法,首次相关工作就证明量子物理难题!MIT计算机科学家,利用数学方法发现,当温度到达一定值后,热量导致量子纠缠完全消失
2024-09-03 11:49:00
再融近5亿!清华系AI创业新势力,成最吸金“算力运营商”
一笔近5个亿新融资,投向AI大模型领域。量子位独家获悉,清华系AI创业公司无问芯穹完成了近5亿元A轮融资。加码的股东阵容很全
2024-09-03 11:49:00
UWB芯片深入城市每一条“神经末梢”!纽瑞芯“创芯版图”再升级,剑指数字中国时空基底
被数字城市风口带飞!UWB芯片的新蓝海被这家创企找到了。这是你畅想的数字城市未来生活吗?智能调度道路交通设施,丝滑应对城市交通错峰问题
2024-09-03 11:50:00
苹果首发台积电2nm工艺 明年实现量产
最新行业动态显示,台积电正准备在秋季之际,也就是九月,启动其标志性的CyberShuttle服务的最新一环。所谓的CyberShuttle
2024-09-03 14:02:00
如何拍出解锁清晰潮酷大片?华为nova Flip手机影像大咖秀直播满分教学
9月1日,“温暖的世界”华为影像XMAGE全球巡展在上海浦东美术馆落地。同时,华为特地打造了一场nova Flip手机影像大咖秀的直播活动
2024-09-03 14:02:00
华为 Mate XT非凡大师官宣!或为全新三折叠屏手机
9月3日,华为官方发布预告视频,并配文“非凡臻品,再启华章。华为 Mate XT非凡大师即将登场!”预告视频中,一闪而过“3”这一数字
2024-09-03 14:02:00
苹果和腾讯又闹僵了 如果iPhone16不支持微信你还会买吗?
还有一个多星期的时间,苹果就要召开2024年度的秋季新品发布会,带来全新的iPhone 16系列。然而此时却有一些媒体透露
2024-09-03 14:04:00
瑞士开发出首个高性能、微型脑机接口芯片 MiBMI,准确率高达 91%
9 月 3 日消息,作为一项各国都在探索的前沿技术,脑机接口(BMI)对于帮助严重运动障碍患者恢复沟通和身体控制能力有望带来更具开创性的解决方案
2024-09-03 14:05:00