• 我的订阅
  • 头条热搜
ChatGPT张口就来的“病”应该怎么“治”?
...章,让 ChatGPT 如此「自信胡扯」的原因,是 AI 产生了「幻觉」。那么,是什么让 AI 大语言模型产生了「幻觉」,业界又是如何看待 AI 幻觉的?01.ChatGPT「张口就来」「幻觉(Hallucinations)」一词源于人类心理学,人类的幻觉是指...……更多
人工智能的“胡言乱语”,有没有解法?
...I的强大功能,并由此感叹其是否可能取代人类劳动时,AI幻觉问题也越来越不容忽视,成为AI进一步发展的阻碍。 Yann LeCun——世界深度学习三巨头之一,“卷积神经网之络父”——在此前的一次演讲中,甚至断言“GPT模型活不...……更多
深挖大模型幻觉!哈佛大学最新报告:LLM等价于众包,只是在输出「网络共识」
...究了大型语言模型在回答晦涩难懂和有争议问题时产生「幻觉」的原因,发现模型输出的准确性高度依赖于训练数据的质量和数量。研究结果指出,大模型在处理有广泛共识的问题时表现较好,但在面对争议性或信息不足的主题...……更多
清华大学教授李宗鹏:大模型消除不了幻觉,大语言模型注定没有希望
...财经的采访)作者|王迪百度李彦宏称大模型基本消除了幻觉,AI从一本正经胡说八道变得可被信赖。清华大学李宗鹏在接受凤凰网财经采访时则指出,大模型永远不会彻底摆脱幻觉和出错的问题,这是数学上已经证明的。“AI代...……更多
...其他政府机构之间的合作伙伴关系。·许多用例中出现“幻觉”的风险太高,无法采用大型语言模型,例如“任何运动的东西”,或者处理致命武器时。当地时间8月10日,美国国防部宣布成立生成式人工智能(AI)工作组,名为...……更多
大模型还能怎么创新?复旦教授邱锡鹏:需在新的架构、多模态等方面多做研究
...型整体架构比较雷同,要想做出创新,还需在新的架构、幻觉问题、多模态等方面多做研究。2.我本身就比较喜欢自由的研究氛围。复旦是一个让我觉得舒服宽松的地方,能够去做自己喜欢的事情。3.大模型是一个非常长的周期...……更多
GPT-4不仅性能更强也更贵了:单次输出7.5万单词需6美元,是此前的30倍
...此前模型相似的局限性,仍然不完全可靠,存在事实性“幻觉”并出现推理错误,可能自信地在其预测中犯错。同时,它的使用价格也更贵,其API价格是Chat-GPT API 使用价格的15-30倍。GPT-4实现多项突破,晋升“考霸”相较GPT-3.5,...……更多
...生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型,通过细调适配到感兴...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...能能力的新水平。”OpenAI表示。 强化学习+思维链加持,幻觉依然无法彻底解决o1模型更强的推理能力得益于OpenAI开发了一种创新的大规模强化学习算法。这种算法不仅能高效利用数据,还能有效训练模型运用思维链进行推理思...……更多
研究:网络充斥低质机翻内容,大语言模型训练需警惕数据陷阱
...标准来看可能质量很低。这可能会导致LLM模型产生更多‘幻觉’ ,而选择偏差表明即使不考虑机器翻译错误,数据质量也可能较低。数据质量对于LLM训练至关重要,其中高质量语料库如书籍和维基百科文章通常会进行多次向上...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...为科研助手方面非常有前景,但也面临着重大挑战,包括幻觉、过于依赖过时的预训练数据,并且缺乏透明的信息出处,条条对科研领域都是重大弊病。就拿幻觉来说,实验中让GPT-4引用最新文献时,它在CS、生物医学等领域伪...……更多
ChatGPT更聪明了!OpenAI推出GPT-4大型语言模型:在诸多测试中表现比人类都好
...很多场景下的能力都不如人类。据称,该模型仍然存在“幻觉”或编造事实的问题,并且在事实方面也不一定总是可靠的,“它倾向于坚持认为它是正确的,即使它错了”。OpenAI 表示,GPT-4 正在努力解决其局限性,例如社会偏...……更多
...惊叹ChatGPT强大能力的同时,人们也表达了深深的忧虑。幻觉问题首先是幻觉问题。所谓幻觉,用通俗的话说就是“一本正经说瞎话”。使用过ChatGPT等生成式人工智能的人可能都有过这样的经历:它们常常会斩钉截铁地给出一些...……更多
GPT-4批评GPT-4实现「自我提升」!OpenAI前超级对齐团队又一力作被公开
...前插入的特定bug,即CBI(critique-bug inclusion)有没有出现幻觉或者挑剔现象,指出了不存在的问题对整体有用性的主观评级,包含上述内容并考虑风格和整体的实用性在训练CriticGPT的过程中,除了RLHF方法,团队将奖励模型与搜索...……更多
...火,向量数据库帮助大模型更新数据、构建知识库、消除幻觉的能力愈发被普及。这个之前一点也不拥挤的领域,短短几月内承载的关注度超出以往任何时刻。作为全球第一家开源向量数据库产品的公司,成立于2017年的Zilliz,...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...安全性越高。借助新的训练方法,o1模型会更加准确,AI幻觉问题减少,但依然存在,而且通过对上下文的关联分析,获得了更高的“越狱测试”分值。 而且在绝大多数这些推理密集型任务中,比如数学计算、代码编程,以及测...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...的输出。- 提高精度并处理边缘情况:微调可以用于纠正幻觉或错误,这些错误很难通过prompt和上下文学习来纠正。它还可以增强模型执行新技能或任务的能力,这些技能或任务很难在提示中表达。这个过程可以帮助纠正模型没...……更多
...融入到科学思想的碰撞中。” 近未来型脑洞:“大模型幻觉”何解大模型是当下正火的AI概念。但大模型普遍存在“一本正经地胡说八道”的现象,这被称为“大模型幻觉”。在知乎上就有这样一个问题:当大模型幻觉完全消...……更多
ChatGPT训练正在走向终端!人人都有大模型不再遥远?
...归属、恶意滥用(比如诈骗)以及一本正经胡说八道的「幻觉」等等。但在所有挑战中,最关键的可能还是如何让生成式 AI 更安全的同时,扩大使用场景,降低普通用户的使用门槛,使得更多的人可以利用 AI 得到更高的生产效...……更多
ChatGPT「秘方」竟在拖LLM后腿?Karpathy、LeCun联手开怼RLHF!
...性」差距。 还有其他几个原因,例如,RLHF也有助于减少幻觉现象。如果RM是一个足够强大的模型,可以捕捉到LLM的虚构内容,就能通过低奖励来惩罚这种行为,教会模型在不确定时避免冒险使用事实知识。但对幻觉及其令人满...……更多
更强更可靠!OpenAI公布GPT-4:可在考试中超过90%的人类
...许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”OpenAI透露,摩根士丹利正在使用GPT-4来组织数据,而电子支付公司Stripe正在测试GPT-4是否有助于打击欺诈。其他客户还包括语言学习公司Duolingo、Khan A...……更多
OpenAI没有放弃的机器人梦想
...的问题。”还有人会担心大模型的上下文长度限制以及“幻觉”问题,会对机器人行为产生影响。对此,刘智勇认为:“通过TokenLearner(一种视觉表征学习方法)来优化输入数据,可以解除上下文窗口限制。而幻觉问题可以用sel...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...了空间感知的负样本挖掘,进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时,往往表现出产生“幻觉”。对此,团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多
人工智能为了游戏获胜会“说谎”
...理论作修订AI“一本正经地胡说八道”这种现象被称为AI幻觉。AI幻觉指的是AI会生成貌似合理连贯,但同输入问题意图不一致、同世界知识不一致、与现实或已知数据不符合或无法验证的内容。人工智能是否会“说谎”,以及最...……更多
百万鲁棒数据训练,3D场景大语言模型新SOTA!IIT等发布Robin3D
...的回答。因此碰到问题与场景无关时,模型也更容易出现幻觉。这种模型有可能只是记住了正样本对,而非真正地理解被问及的场景、物体、以及具体的指令。 2. 由于在造数据的过程中,人类标注员或者生成式大语言模型是按...……更多
五千万元只够看一次烟花!大模型的泡沫大吗?
...独角兽企业达成战略合作。在周健看来,因为大模型的“幻觉问题”和权限问题,终端用户或者甲方企业客户很难和大模型直接合作,需要像澜码科技这样的中间厂商,这也是创业公司的机会。在基础大模型与用户端需要“中间...……更多
「虎博科技」发布自研多模态大模型TigerBot,开源模型、代码及数据 | 36氪首发
...大模型浪潮来临后,困扰业界的一个难题在于大模型的“幻觉”——即大模型输出的结果,和人类说的话一样自然,但在事实层面会“胡说八道”。陈烨以实际案例举例,针对这一问题,虎博应用了一些经典的监督学习方法,如...……更多
回顾GPT大模型2023这一年,5大顶级公司预测2024年AI产品
...提供更多选择。 一家主要保险公司将提供专门的AI风险幻觉保险:genAI对幻觉或错误的倾向改变了风险管理和复杂风险转移策略的计算方式。尽管保险公司一直在努力弥补涉及AI幻觉的保险漏洞,但鉴于genAI的预期增长,先锋保...……更多
...工作。“要想实现大模型在产业的进一步落地,准确性和幻觉问题是不可回避的挑战。”百融云创AI创新负责人表示。大模型想要精准,前置的数据处理环节非常重要。在这一环节,百融云创打造了智能版面识别系统。很多企业...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...分器训练可提供一致性,但也存在风险,包括强化偏见和幻觉。此外,它可能违反专有LLM服务的使用条款,条款禁止使用其模型的输出来开发竞争模型。为了解决这些限制和显著降低成本,谷歌引入了一个用于自动评分的大型基...……更多
更多关于科技的资讯:
美术院校校考,画风如何?
潮新闻讯 今天,中国美院本科招生(复试)开考。来自全国各地的考生涌向国美象山校区,转塘也一下子热闹起来。“今年会考什么
2025-02-19 20:18:00
OPPO Find X8 Ultra爆料汇总:双潜望机皇 影像巅峰
据可靠消息,下个月OPPO Find X8 Ultra有望登场,目前网上已经流出了诸多关于它的爆料。今天我们就来汇总这些曝光消息
2025-02-19 20:27:00
249元 影驰推出金属大师暗卫海景房机箱:270°无立柱海景房设计
快科技2月19日消息,影驰推出了金属大师暗卫机箱,采用270°无立柱海景房设计,首发到手249元。据悉,金属大师暗卫机箱采用了双面钢化玻璃
2025-02-19 20:27:00
虚幻5打造!腾讯《三角洲行动》官宣黑鹰坠落模式免费:2月21日全球上线
快科技2月19日消息,今晚,腾讯战术射击大作《三角洲行动》举行黑鹰坠落线下影院前瞻直播,公布黑鹰坠落战役模式部分关卡设计以及首次关卡实机试玩
2025-02-19 20:27:00
中新经纬2月19日电 市场监管总局网站19日消息,市场监管总局等五部门近日印发《优化消费环境三年行动方案(2025—2027年)》(简称“《方案》”)的通知
2025-02-19 20:29:00
二手平台买CPU收到一包沙子 卖家拒退款:这是CPU原材料
快科技2月19日消息,在网络购物日益普及的今天,消费者们需要格外谨慎,因为稍有不慎,就可能遇到一些令人哭笑不得、甚至离谱至极的事儿
2025-02-19 20:57:00
江南时报讯 为拓宽零售金融业务新渠道,延伸金融服务触角,推进医疗场景数字化运营,溧水农商银行积极响应民生需求,着力解决“一老一小”医保支付便捷度问题
2025-02-19 20:57:00
本文转自:人民网人民网北京2月19日电 (记者杜燕飞)当前,人工智能(AI)作为引领新一轮科技革命和产业变革的技术,具有很强的“头雁”效应
2025-02-19 21:00:00
如何量身打造新市民与灵活就业人群保险产品?泰康在线模式参考
有这样一个群体,他们勤勤恳恳、任劳任怨,引人关注,又默默无闻;他们早出晚归、披星戴月,远离故土,建设“第二故乡”。他们
2025-02-19 21:12:00
免费不限量!腾讯:混元T1模型面向所有用户开放
快科技2月19日消息,据腾讯介绍,前几天深度思考模型混元T1开启灰度后,用户反响强烈。经过产品紧急部署,现在,所有用户都可以无限量使用混元T1了
2025-02-19 21:27:00
网传小米全系车型规划:共8个版本 SU7猎装版很帅!
自从小米推出首款新车SU7以来,该车便获得了巨大的关注度和订单量,可以说为小米造车奠定了非常好的开局。近日,网传图片则曝光了小米汽车可能的全系车型
2025-02-19 21:27:00
极速450km/h!CR450复兴号大瘦身:碳纤维、镁合金等新材料
快科技2月19日消息,历经7年的技术攻关,前不久我国CR450动车组样车发布,试验速度时速450公里,运营速度时速400公里
2025-02-19 21:57:00
上汽奥迪A5L申报图亮相:车门把手头次见
快科技2月19日消息,工信部今日发布了第392批《道路机动车辆生产企业及产品公告》新产品公示。公告中,我们发现了上汽奥迪A5L的申报图
2025-02-19 21:57:00
自贸港的年轻人|“数字游民”燕宇轩:在自贸港热土上探索动漫产业新可能
点击查看更多视频南海网记者 张野龙华昌学村动漫产业园三楼一处200多平方米的办公区内,几名清洁人员正在打扫地板,“下周办公设备进场
2025-02-19 22:14:00
百度:在AI赋能的搜索变革中 我们占据领先地位
快科技2月18日消息,今晚百度发布了2024年第四季度及全年财报。2024年总营收为1331亿元,同比下滑1%。归属于百度的净利润为238亿元
2025-02-18 23:56:00