• 我的订阅
  • 头条热搜
ChatGPT张口就来的“病”应该怎么“治”?
...章,让 ChatGPT 如此「自信胡扯」的原因,是 AI 产生了「幻觉」。那么,是什么让 AI 大语言模型产生了「幻觉」,业界又是如何看待 AI 幻觉的?01.ChatGPT「张口就来」「幻觉(Hallucinations)」一词源于人类心理学,人类的幻觉是指...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...此前模型相似的局限性,仍然不完全可靠,存在事实性“幻觉”并出现推理错误,可能自信地在其预测中犯错。同时,它的使用价格也更贵,其API价格是Chat-GPT API 使用价格的15-30倍。GPT-4实现多项突破,晋升“考霸”相较GPT-3.5,...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...能能力的新水平。”OpenAI表示。 强化学习+思维链加持,幻觉依然无法彻底解决o1模型更强的推理能力得益于OpenAI开发了一种创新的大规模强化学习算法。这种算法不仅能高效利用数据,还能有效训练模型运用思维链进行推理思...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
...标准来看可能质量很低。这可能会导致LLM模型产生更多‘幻觉’ ,而选择偏差表明即使不考虑机器翻译错误,数据质量也可能较低。数据质量对于LLM训练至关重要,其中高质量语料库如书籍和维基百科文章通常会进行多次向上...……更多
ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好
...很多场景下的能力都不如人类。据称,该模型仍然存在“幻觉”或编造事实的问题,并且在事实方面也不一定总是可靠的,“它倾向于坚持认为它是正确的,即使它错了”。OpenAI 表示,GPT-4 正在努力解决其局限性,例如社会偏...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...前插入的特定bug,即CBI(critique-bug inclusion)有没有出现幻觉或者挑剔现象,指出了不存在的问题对整体有用性的主观评级,包含上述内容并考虑风格和整体的实用性在训练CriticGPT的过程中,除了RLHF方法,团队将奖励模型与搜索...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...的输出。- 提高精度并处理边缘情况:微调可以用于纠正幻觉或错误,这些错误很难通过prompt和上下文学习来纠正。它还可以增强模型执行新技能或任务的能力,这些技能或任务很难在提示中表达。这个过程可以帮助纠正模型没...……更多
...融入到科学思想的碰撞中。” 近未来型脑洞:“大模型幻觉”何解大模型是当下正火的AI概念。但大模型普遍存在“一本正经地胡说八道”的现象,这被称为“大模型幻觉”。在知乎上就有这样一个问题:当大模型幻觉完全消...……更多
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
...性」差距。 还有其他几个原因,例如,RLHF也有助于减少幻觉现象。如果RM是一个足够强大的模型,可以捕捉到LLM的虚构内容,就能通过低奖励来惩罚这种行为,教会模型在不确定时避免冒险使用事实知识。但对幻觉及其令人满...……更多
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类
...许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”OpenAI透露,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan A...……更多
OpenAI没有放弃的机器人梦想
...的问题。”还有人会担心大模型的上下文长度限制以及“幻觉”问题,会对机器人行为产生影响。对此,刘智勇认为:“通过TokenLearner(一种视觉表征学习方法)来优化输入数据,可以解除上下文窗口限制。而幻觉问题可以用sel...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多
人工智能为了游戏获胜会“说谎”
...理论作修订AI“一本正经地胡说八道”这种现象被称为AI幻觉。AI幻觉指的是AI会生成貌似合理连贯,但同输入问题意图不一致、同世界知识不一致、与现实或已知数据不符合或无法验证的内容。人工智能是否会“说谎”,以及最...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...提供更多选择。 一家主要保险公司将提供专门的AI风险幻觉保险:genAI对幻觉或错误的倾向改变了风险管理和复杂风险转移策略的计算方式。尽管保险公司一直在努力弥补涉及AI幻觉的保险漏洞,但鉴于genAI的预期增长,先锋保...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...分器训练可提供一致性,但也存在风险,包括强化偏见和幻觉。此外,它可能违反专有LLM服务的使用条款,条款禁止使用其模型的输出来开发竞争模型。为了解决这些限制和显著降低成本,谷歌引入了一个用于自动评分的大型基...……更多
...工作。“要想实现大模型在产业的进一步落地,准确性和幻觉问题是不可回避的挑战。”百融云创AI创新负责人表示。大模型想要精准,前置的数据处理环节非常重要。在这一环节,百融云创打造了智能版面识别系统。很多企业...……更多
共赢生成式AI时代
...界第一个支持流式输出;在同等智能级别,输出最快;在减少幻觉、应对困难开放型问题上,准确度是ClaudeAI2.1的两倍;更好的开箱即用体验,无需过多优化提示词,拒绝率更低。ClaudeAI3推出了三个模型High(最快)、Sona(性能与功能平衡)、Opu...……更多
openai公布gpt-4最新版本gpt-4模型
...许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”总的来说,GPT-4相对于以前的模型(经过多次迭代和改进)已经显著减轻了幻觉问题。在OpenAI的内部对抗性真实性评估中,GPT-4的得分比最新的GPT-3.5...……更多
破解AI“胡说八道”,这家公司要给大模型投喂好原料|产品观察
...”搭载了文本向量化模型,以解决大模型“已读乱回”的幻觉问题。合合信息的思路是,从“炼丹”源头的燃料出发,通过标准化平台进行语料结构化,提高数据预训练效率,帮助大模型厂商达成有效的模型性能提升和迭代。处...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...帮助未来的人工智能模型更加中立和公平,并减少噪音、幻觉和不相关的信息,从而提高训练的效率和模型的准确性。根据已知的信息,草莓计划改进了推理、逻辑以及规划和开展研究的能力,可以让模型自主进行实验、分析数...……更多
鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆
...更快的推理速度; 此外,Memory3 提高了事实性并减轻了幻觉,并能够快速适应专业任务。方法介绍记忆电路理论有助于确定哪些知识可以存储为显式记忆,以及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作...……更多
...像,处理更大的文本块。对于AI聊天机器人此前暴露出的幻觉、偏见等缺陷,GPT-4也有所改进。但专家指出,这并不意味着这些缺陷已被修复,GPT-4仍会做错最基础的算术题。另据介绍,和ChatGPT不同,使用GPT-4需每月支付20美元的...……更多
AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法
...方法,下面咱们就详细聊聊。大模型的胡说八道和风险“幻觉”(Hallucinations)是大语言模型(例如 ChatGPT、Gemini、或文心一言)面临的一个关键问题,也是网络上常见的用户体验吐槽类型之一,这个术语可以粗略地理解为 AI 一...……更多
微软、英伟达纷纷押注小模型,大模型不香了?
...署一个机器学习模型。LLM的另一个重大问题是容易产生“幻觉”——即模型生成的输出看似合理,但实际上并不正确。这是由于LLM的训练方式是根据数据中的模式预测下一个最可能的单词,而非真正理解信息。因此,LLM可能会自...……更多
大语言模型如何宣告心理学的死亡?
...senseQA、MATH、HANS和BIG-bench)上的表现,也不在于消除LLM的幻觉,而是试图理解LLM在处理这些任务时所展现的深层次结构,如启发式方法或创造力。然而,对于LLM是否具有心理特性,研究者间存在分歧。一方面,有些研究者较为保...……更多
不能简单地将AI幻觉“一棒子打死”
...电子报北京大学计算机学院教授黄铁军:不能简单地将AI幻觉“一棒子打死”4月28日,北京大学计算机学院教授、北京智源人工智能研究院理事长黄铁军在第十七届中国电子信息年会上发表演讲时表示,“幻觉”是人工智能创造...……更多
英伟达推出“护栏”软件 让AI聊天机器人不再胡说八道
...新月异,但也存在一些难题,比如 AI 模型有时会出现“幻觉”,即说出错误的事实、涉及有害的话题或导致安全风险。为了解决这个问题,英伟达在周二发布了一款新的软件,名为 NeMo Guardrails,可以帮助软件开发者给 AI 模型设...……更多
深挖 ChatGPT 原理,保姆级解说!
...波瓣(即孟加拉虎数量过剩),或者至少降低这个概率。幻觉:特性还是错误?当大型语言模型输出的单词序列不符合现实真相时,我们说该模型是产生了“幻觉”。目前,我们有一套方法可以帮助我们塑造大型语言模型输出的...……更多
Runway开发通用世界模型,想让AI更好地模拟世界
...当我们惊叹于大语言模型竟然能够流畅地与我们对话时,幻觉问题让大模型们时不时“胡言乱语”或“答非所问”的情况也让实际的使用体验大打折扣。而这种问题并不仅仅存在于大语言模型领域,在AI扩图和AI视频生成中也屡...……更多
更多关于科技的资讯:
拍拍照就能赚钱 “寄拍模特”真这么香?有女子被骗10万
快科技9月15日消息,“在线急招兼职试衣模特,免费寄拍衣服,每单还能返利数十到上百元不等!”这样的话术,可能是“寄拍模特”骗局
2024-09-15 07:49:00
亚洲最年轻的纳斯达克敲钟人 何猷君入手比亚迪腾势Z9GT
快科技9月15日消息,武汉星竞威武公司董事长、澳门电竞总会会长何猷君宣布,已经支付腾势Z9GT的订金,正在等提。比亚迪腾势销售事业部总经理赵长江转发道
2024-09-15 07:49:00
鸿蒙智行:一二线城市10分钟就有1个充电站 高速上平均20分钟就有1个
快科技9月15日消息,华为终端昨日发表了问答文章:享界S9答网友热门问题(第一期)。对于很多车主关心的“当前充电网络的覆盖情况怎么样
2024-09-15 08:19:00
男子提供有偿代骂每单收费240元 已骂400余人
快科技9月15日消息,据央视新闻报道,公安部今天发布的10起典型案例中,有一起“有偿代骂”网络暴力案,犯罪嫌疑人为牟取非法利益
2024-09-15 08:19:00
霄龙4124P处理器玩上超频:使用B650主板冲上6.6GHz
在5月份AMD正式推出了全新的EPYC(霄龙)4004系列服务器处理器,基于与消费级锐龙7000系列相同的架构,是AMD首款采用消费级处理器接口的EPYC处理器
2024-09-15 08:19:00
75年·75人 | “碳”寻新路 车圈出圈
王景山王景山向本报记者介绍碳纤维车圈。 人物名片王景山1966年出生,南平人,早年在农村老家做木材生意。1994年来厦创业
2024-09-15 08:46:00
8年来最强中秋台风!“贝碧嘉”今夜直扑江浙沪
快科技9月14日消息,据中央气象台预测,中秋假期(9月15日至17日)期间,台风“贝碧嘉”将登陆我国华东沿海,并给江浙沪等地带来强风雨天气
2024-09-15 08:49:00
女子骑电动自行车看手机 发生无接触事故 摔倒后继续玩手机
快科技9月15日消息,当代社会对手机的依赖日益加深,机不离手已成为普遍现象。然而,因分心看手机而导致的事故也屡见不鲜。日前
2024-09-15 08:49:00
长城灵魂摩托谈价格:每个零部件都是业内极品 收藏价值远高于售价
快科技9月15日消息,日前,长城灵魂CEO赵胜广在2024中国摩博会现场解答了,长城灵魂摩托车摩友们最关心的问题。赵胜广表示
2024-09-15 08:49:00
ZAKER科技9月14日消息,9月13日晚上8点iPhone16系列正式开启预购,据网友反馈抢购情况热烈,苹果商店一度出现15分钟依然未能进入的盛况
2024-09-15 09:04:00
意大利查获大量中国产山寨复古游戏机:价值超3.7亿元
快科技9月15日消息,据报道,意大利金融警察周五表示,他们捣毁了一个从中国走私假冒复古视频游戏机的团伙,这些游戏机包含了80年代和90年代一些最受欢迎的游戏
2024-09-15 09:19:00
阿斯加特全球首发CUDIMM DDR5-9600内存:马上破10GHz!
快科技9月15日消息,阿斯加特宣布,全新规格的CUDIMM DDR5 9600MHz内存已经登场,创造行业新高,相比于之前的9200MHz频率版本再进一步
2024-09-15 09:19:00
菊花会呼吸、鸽子开导弹 搞笑诺奖它又来了
欢迎大家来参加第 34 届首届搞笑诺贝尔奖的颁奖典礼,我小辣椒可想死它了!!别问为啥又是首届,这是大自然的规律比起下个月
2024-09-15 09:19:00
特斯拉:第1亿个4680电池下线!
快科技9月15日消息,特斯拉宣布其标志性的第1亿颗4680电池正式下线。这一里程碑事件标志着特斯拉在电池生产领域取得了显著进展
2024-09-15 09:49:00
A18 Pro跑分再次刷新:多核成绩超越M1
在9月11日iPhone 16 Pro Max的跑分现身GeekBench网站,单核成绩是3018,多核成绩是7751
2024-09-15 09:49:00