精度,幻觉,模型,结果,模型,幻觉头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大幅减缓幻觉百融云创大模型精度测评结果出炉

近日，百融云创大模型参加一场“考试”，并取得了行业领先的成绩，多项指标优于ChatGPT3.5。随着各类大模型的相继问世，如何去评估大模型的性能变得越来越重要。百融云创参加的这场“考试”名叫检索增强生成基准测评，...……更多

2024-03-28 16:16:00精度,幻觉,模型,结果,模型,幻觉

美国执念抹黑他国恰似人工智能“幻觉”

“幻觉”，在人工智能领域是一个专业术语，被用于描述机器可能输出“无中生有”的内容。这样的“幻觉”也出现在一些美国政客身上，他们无中生有地污称中国用人工智能技术收集美国人数据。治疗这种“幻觉”，美国一...……更多

2023-12-30 19:00:00人工智能,美国,幻觉,人工,智能,美国

容易“幻觉”的大模型与最严肃制造竟双向奔赴了？造船、高端装备

...制造，以及化工等流程制造近期也迎来大模型。易产生“幻觉”的大模型，与最不能容忍“一本正经胡说八道”的工业，何以双向奔赴？何以胜任工业是AI大模型应用真正的主战场。传统AI对制造中的缺陷检测、维修预测等场景...……更多

2024-08-12 09:41:00造船,双向,幻觉,高端,模型,制造

生成式AI“卷”应用层，但仍受困于高成本、幻觉和低留存率

...峰发现，生成式AI应用的落地依旧面临高昂成本、大模型幻觉和用户留存率低的三大难题。7月6日，周志峰在2024世界人工智能大会一场创投论坛上分析说，去年同期每百万token的基座大模型API调用成本，还处于120美元左右，而今...……更多

2024-07-08 09:50:00应用层,幻觉,生成,成本,应用,周志峰

依托数据、平台、知识增强等优势夸克大模型降低问答幻觉率

...性。在医疗健康领域，夸克大模型已经可以将问答内容的幻觉率降低至5%。夸克推进搜索革新，自研大模型打造技术新底座在互联网高速发展的30余年中，搜索曾经高效地满足了用户主动获取信息的需求。基于大模型的AIGC技术将...……更多

2023-11-23 11:11:00夸克,幻觉,模型,问答,优势,知识

GPT-4批评GPT-4实现「自我提升」！OpenAI前超级

...前插入的特定bug，即CBI（critique-bug inclusion）有没有出现幻觉或者挑剔现象，指出了不存在的问题对整体有用性的主观评级，包含上述内容并考虑风格和整体的实用性在训练CriticGPT的过程中，除了RLHF方法，团队将奖励模型与搜索...……更多

2024-07-01 09:23:00力作,批评,团队,模型,人类,训练

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

...更快的推理速度；此外，Memory3 提高了事实性并减轻了幻觉，并能够快速适应专业任务。方法介绍记忆电路理论有助于确定哪些知识可以存储为显式记忆，以及哪种模型架构适合读取和写入显式记忆。研究者将输入输出关系作...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

中国“大厂”热议大模型发展

...。中兴通讯总裁徐子阳认为，行业大模型的一大问题就是幻觉。他指出，AI如果作为助手没问题，但如果把AI当成一名雇员，它就不能犯错。他指出，对于工业等场景，AI应用的门槛比较高，企业也在探索新路径解决幻觉问题。上...……更多

2024-07-19 23:29:00大厂,中国,模型,发展,模型,中国联通

AI 胡说八道怎么办？牛津大学开发了一种“测谎”方法

...方法，下面咱们就详细聊聊。大模型的胡说八道和风险“幻觉”（Hallucinations）是大语言模型（例如 ChatGPT、Gemini、或文心一言）面临的一个关键问题，也是网络上常见的用户体验吐槽类型之一，这个术语可以粗略地理解为 AI 一...……更多

2024-07-01 11:40:00牛津大学,八道,牛津,怎么办,方法,开发

科普“云问答”：“向科学要答案”

...融入到科学思想的碰撞中。” 近未来型脑洞：“大模型幻觉”何解大模型是当下正火的AI概念。但大模型普遍存在“一本正经地胡说八道”的现象，这被称为“大模型幻觉”。在知乎上就有这样一个问题：当大模型幻觉完全消...……更多

2023-10-27 01:46:00科普,问答,答案,科学,模型,科幻

微软研究人员正在测试其他ai模型

...种旨在让模型捏造信息的测试。为了治好这种被称为“AI幻觉”的症状，他们设定了一个会让大多数人头疼的文本检索任务，然后跟踪并改进模型响应，这也是微软在测定、检测和缓解AI幻觉方面的一个例子。微软AI负责项目的首...……更多

2024-06-22 09:31:00微软,研究人员,模型,正在,人员,测试

人工智能为了游戏获胜会“说谎”

...理论作修订AI“一本正经地胡说八道”这种现象被称为AI幻觉。AI幻觉指的是AI会生成貌似合理连贯，但同输入问题意图不一致、同世界知识不一致、与现实或已知数据不符合或无法验证的内容。人工智能是否会“说谎”，以及最...……更多

2024-05-14 04:02:00人工智能,人工,智能,人工智能,模型,人工

搜索增强剑指大模型落地

...。尽管大模型是划时代的技术突破，但现阶段并不完美，幻觉、时效性差、缺乏专业领域知识等问题，是其落地千行百业必须要面对的挑战。百川智能CEO王小川说，搜索增强是大模型落地应用的关键，能够有效解决幻觉、时效性...……更多

2023-12-20 05:06:00落地,模型,搜索,模型,知识,搜索

Apple Intelligence提示词原来是这样，还告诉

...人将选择这些问题的答案，这将有助于减少撰写回复时的幻觉。请输出最佳问题及每个问题的可能答案 / 选项。不要问回复片段中已经回答的问题。问题应简短，不超过 8 个字。答案也应简短，约 2 个字。请以 JSON 格式输出，包...……更多

2024-08-08 09:39:00幻觉,模型,提示,邮件,提示,问题

AI搜索的知乎方案，以专业答主和优质语料减少AI幻觉

...可以观察到用户行为发生了显著变化，其中困扰行业的AI幻觉成为了用户痛点。对此知乎直答发挥了知乎高质量中文语料的优势，依靠大量专业答主的可信内容给出了社区解决方案。（知乎直答产品负责人马奎）2024年以来，AI搜...……更多

2024-08-07 12:12:00语料,幻觉,方案,搜索,专业,马奎

9.11比9.9大？多个大模型翻车！业内人士：就是偏科，文科

...示。这类大模型说胡话的现象，在业界被称为大模型出现幻觉。此前，哈尔滨工业大学和华为的研究团队发表的综述论文认为，模型产生幻觉的三大来源：数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式...……更多

2024-07-17 20:56:00理科,文科,业内人士,模型,业内,多个

不能简单地将AI幻觉“一棒子打死”

...电子报北京大学计算机学院教授黄铁军：不能简单地将AI幻觉“一棒子打死”4月28日，北京大学计算机学院教授、北京智源人工智能研究院理事长黄铁军在第十七届中国电子信息年会上发表演讲时表示，“幻觉”是人工智能创造...……更多

2024-05-07 09:47:00棒子,幻觉,人工智能,智能,人工,人类

朱啸虎：AI的赚钱风向，彻底变了！

...不容易。为什么AIGC很难落地？最主要就两个问题：一是幻觉问题；二是结果不可控。一旦AI有幻觉就会出错，而且你不知道什么时候会出错，每次结果还都不一样，所以结果不可控。随着大家对幻觉的研究越来越多，发现造成幻...……更多

2024-06-26 11:53:00啸虎,风向,模型,场景,数据,公司

国内首个！中关村科金发布企业知识大模型

...判断三个层面，在他看来，目前大模型最为人诟病的是有幻觉问题，对低频常理的事实回答得不好，经常被人们认为一本正经的胡说八道，但可以通过一些其他的手段解决。比如，外挂一些知识库或者符号推进引擎，解决事实判...……更多

2023-11-23 19:08:00中关,中关村,模型,知识,企业,中关

2023金融大模型报告|智能交易：求解知易行难

...。这包括但不限于建立合适的模型评估机制、提高模型的精度和可解释性、加强数据的安全性和合规性等。北京商报记者宋亦桐 ……更多

2023-12-11 13:11:00知易,模型,智能,金融,报告,交易

大模型像“文科生”？业内人士在沪“论战”

...技术负责人张涛则认为，大模型在做辅助工作，并且有“幻觉”(看似合理但实际错误的现象)等缺点。但他认为，人无完人，知识非常渊博的人也会有盲区，要求大模型做一个完美助手，是不太现实的。RWKV元始智能COO罗璇认为，...……更多

2024-04-15 22:01:00文科生,文科,业内人士,模型,业内,人士

OpenAI「补票」AI 搜索，SearchGPT 没有野心

...人质疑。尽管生成式搜索被认为是未来的搜索模式，但其幻觉问题仍然限制其发展。当地时间 7 月 25 日，OpenAI 宣布推出由 AI 驱动的搜索引擎 SearchGPT，并开启邀请测试，标志着 OpenAI 正式进军搜索引擎市场，直接对打谷歌、Bing...……更多

2024-07-27 09:26:00野心,搜索,搜索,用户,结果,生成

埃隆・马斯克推出grok聊天机器人

...异之一。然而，就像所有AI聊天机器人一样，Grok也存在“幻觉”问题，即生成包含虚假或误导信息的回应。这种现象在所有大型语言模型（LLM）中都普遍存在，包括ChatGPT。近日，一个Grok尴尬的“幻觉”在社交媒体上引起热议。...……更多

2023-12-12 12:32:00马斯,埃隆,马斯克,机器人,机器,幻觉

让大模型“外挂硬盘”，百川智能发布新API系列，企业定制成本

...前，对于192k token以内的请求，百川智能可以实现100%回答精度。“我们的长窗口能够做到全绿，相当于能完全不遗漏地把192k里的信息全部召回。”王小川表示。并且，结合搜索系统，Baichuan-2能够获取的原本文本规模提升了两个...……更多

2023-12-21 15:32:00百川,外挂,模型,成本,硬盘,智能

AWS搭载“最强大模型”！40亿美元投向OpenAI竞对

...与Claude 2相比，Claude 3最明显的迭代体现在多模态能力、幻觉的降低、长文本能力等方面。例如借助视觉能力，Claude 3可以理解图表、图形、报告等文件，并从中提取数据。▲Claude 3的多模态能力在准确率方面，Claude 3大幅改善了...……更多

2024-04-03 16:49:00模型,模型,能力,演示,模态,生成

OpenAI入局AI搜索 SearchGPT演示中“翻车”

...Bard出糗的一幕，犯下了事实性错误。从技术角度看，“AI幻觉”（即AI编造语句通顺但事实逻辑错误的答案）仍是业界的一大难题。SearchGPT的发布彰显出OpenAI向搜索引擎扩张的野心，不过伟大的愿景往往伴随着巨大的资金需求。...……更多

2024-07-31 09:59:00演示,搜索,成本,搜索,错误,用户

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...续并加强了小钢炮系列最强端侧 OCR 能力的传统优势。在幻觉评测榜单Object HalBench上，MiniCPM-V 2.6 的幻觉水平（幻觉率越低越好）优于GPT-4o、GPT-4V、Claude 3.5 Sonnet 等众多商用模型。实时视频理解，首次上端！睁开端侧「眼睛」，...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频