精度,幻觉,模型,结果,模型,幻觉头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大模型像“文科生”？业内人士在沪“论战”

...技术负责人张涛则认为，大模型在做辅助工作，并且有“幻觉”(看似合理但实际错误的现象)等缺点。但他认为，人无完人，知识非常渊博的人也会有盲区，要求大模型做一个完美助手，是不太现实的。RWKV元始智能COO罗璇认为，...……更多

2024-04-15 22:01:00文科生,文科,业内人士,模型,业内,人士

埃隆・马斯克推出grok聊天机器人

...异之一。然而，就像所有AI聊天机器人一样，Grok也存在“幻觉”问题，即生成包含虚假或误导信息的回应。这种现象在所有大型语言模型（LLM）中都普遍存在，包括ChatGPT。近日，一个Grok尴尬的“幻觉”在社交媒体上引起热议。...……更多

2023-12-12 12:32:00马斯,埃隆,马斯克,机器人,机器,幻觉

专家：openai语音转写工具存在重大缺陷

...家指出，这些生成的文本（IT之家注：业内通常称为“AI幻觉”）可能涉及种族言论、暴力措辞，甚至杜撰的医疗建议。专家们认为，这一问题尤其令人担忧，因为Whisper已被广泛应用于全球多个行业，包括用于翻译和转录访谈内...……更多

2024-10-29 05:46:00缺陷,语音,工具,专家,研究,幻觉

OpenAI入局AI搜索 SearchGPT演示中“翻车”

...Bard出糗的一幕，犯下了事实性错误。从技术角度看，“AI幻觉”（即AI编造语句通顺但事实逻辑错误的答案）仍是业界的一大难题。SearchGPT的发布彰显出OpenAI向搜索引擎扩张的野心，不过伟大的愿景往往伴随着巨大的资金需求。...……更多

2024-07-31 09:59:00演示,搜索,成本,搜索,错误,用户

让大模型“外挂硬盘”，百川智能发布新API系列，企业定制成本

...前，对于192k token以内的请求，百川智能可以实现100%回答精度。“我们的长窗口能够做到全绿，相当于能完全不遗漏地把192k里的信息全部召回。”王小川表示。并且，结合搜索系统，Baichuan-2能够获取的原本文本规模提升了两个...……更多

2023-12-21 15:32:00百川,外挂,模型,成本,硬盘,智能

AWS搭载“最强大模型”！40亿美元投向OpenAI竞对

...与Claude 2相比，Claude 3最明显的迭代体现在多模态能力、幻觉的降低、长文本能力等方面。例如借助视觉能力，Claude 3可以理解图表、图形、报告等文件，并从中提取数据。▲Claude 3的多模态能力在准确率方面，Claude 3大幅改善了...……更多

2024-04-03 16:49:00模型,模型,能力,演示,模态,生成

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...续并加强了小钢炮系列最强端侧 OCR 能力的传统优势。在幻觉评测榜单Object HalBench上，MiniCPM-V 2.6 的幻觉水平（幻觉率越低越好）优于GPT-4o、GPT-4V、Claude 3.5 Sonnet 等众多商用模型。实时视频理解，首次上端！睁开端侧「眼睛」，...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

...【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题，传统偏好学习方法依赖可能不适配的外源数据，存在成本和质量问题。Calibrated Self-Rewarding（CSR）框架通过自我增强学习，利用模型自身输...……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

破解AI“胡说八道”，这家公司要给大模型投喂好原料｜产品观察

...”搭载了文本向量化模型，以解决大模型“已读乱回”的幻觉问题。合合信息的思路是，从“炼丹”源头的燃料出发，通过标准化平台进行语料结构化，提高数据预训练效率，帮助大模型厂商达成有效的模型性能提升和迭代。处...……更多

2024-07-30 00:59:00八道,模型,原料,观察,产品,公司

中国电信开源星辰语义大模型，开放1t清洗数据集

...语料进行训练。星辰语义大模型在业界首次提出缓解多轮幻觉的解决方案，通过关键信息注意力增强、知识图谱强化、多轮知识强化、知识溯源能力四大技术，将AI大模型的幻觉率降低了40%，有助于大模型变得更有“人味”，理...……更多

2024-01-14 09:52:00中国电信,语义,中国,星辰,清洗,模型

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...能能力的新水平。”OpenAI表示。强化学习+思维链加持，幻觉依然无法彻底解决o1模型更强的推理能力得益于OpenAI开发了一种创新的大规模强化学习算法。这种算法不仅能高效利用数据，还能有效训练模型运用思维链进行推理思...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

大模型为建立通用人工智能理论提供可能性

...生成能力、强大的迁移（推广）能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话，在开领域生成多样性类似人类的连贯文本。强大的迁移能力可以在代理任务上训练一个模型，通过细调适配到感兴...……更多

2024-03-21 09:57:00人工智能,人工,可能性,模型,理论,智能

库克：苹果智能取得重大突破但无法回避AI幻觉

...展，但一些人工智能存在问题，苹果也无法回避，比如AI幻觉问题。AI幻觉是指AI在某些时候的盲目自信情况，其会相当自信的给出用户某个问题的答案，但其所提供的回答完全子虚乌有。库克承认这种情况也可能发生在苹果智能...……更多

2024-06-16 12:24:00库克,幻觉,苹果,突破,智能,苹果

「学术版ChatGPT」登场！Ai2打造科研效率神器Open

...为科研助手方面非常有前景，但也面临着重大挑战，包括幻觉、过于依赖过时的预训练数据，并且缺乏透明的信息出处，条条对科研领域都是重大弊病。就拿幻觉来说，实验中让GPT-4引用最新文献时，它在CS、生物医学等领域伪...……更多

2024-11-27 13:33:00神器,文献,效率,科研,学术,模型

大模型应用疯狂加速，洗牌却在静悄悄进行了

...大模型基于训练推理一体化设计，实现大模型稀疏化、低精度量化的技术突破，能高效适配昇腾AI，加速大模型的行业落地应用和迭代；与此同时，以昇腾AI为核心，软硬件协同优化，构建算力集中、协同优化、供给稳定、数据...……更多

2023-10-07 15:24:00模型,疯狂,应用,模型,腾讯,能力

Runway开发通用世界模型，想让AI更好地模拟世界

...当我们惊叹于大语言模型竟然能够流畅地与我们对话时，幻觉问题让大模型们时不时“胡言乱语”或“答非所问”的情况也让实际的使用体验大打折扣。而这种问题并不仅仅存在于大语言模型领域，在AI扩图和AI视频生成中也屡...……更多

2023-12-22 19:48:00世界,模型,开发,模型,世界,生成

2024中国生成式AI大会演讲：大模型的应用创新与落地探索

...工作。“要想实现大模型在产业的进一步落地，准确性和幻觉问题是不可回避的挑战。”百融云创AI创新负责人表示。大模型想要精准，前置的数据处理环节非常重要。在这一环节，百融云创打造了智能版面识别系统。很多企业...……更多

2024-04-26 13:16:00中国,落地,生成,模型,大会,应用

一系列离谱答案出现后谷歌对“AI概览”功能进行了紧急修复

...回答人们提出的问题，这就导致它们经常胡编乱造，即AI幻觉。里德对此表示，AI概览通常不会 “产生幻觉”，也不会像其他大语言模型产品那样胡编胡造，因为它们与谷歌的传统搜索引擎更紧密地结合在一起，只显示最权威或...……更多

2024-06-01 04:28:00概览,答案,功能,概览,里德,搜索

李彦宏再谈开源：开源模型是智商税，永远应该选择闭源模型

...。问：在金融、医疗等这些比较严谨的领域，生成式AI的幻觉问题，怎么破解？李彦宏：今天，应该说你会很少发现幻觉问题了，尤其是用最大规模、最强大模型的时候，已经很少出现幻觉问题了。为什么呢？一开始，纯粹用原...……更多

2024-07-31 16:00:00模型,李彦,智商,选择,模型,李彦

检索总结能力超博士后，首个大模型科研智能体PaperQA2开

...确度，但 Grobid 解析和更大的块并没有显著提高 LitQA2 的精度、准确度或召回率（下图 6）。总结科学主题为了评估 PaperQA2 的摘要功能，研究者设计了一个名为 WikiCrow 的系统。该系统通过结合多个 PaperQA2 调用来生成有关人类蛋...……更多

2024-09-13 13:33:00博士后,模型,科研,博士,检索,能力

微软、英伟达纷纷押注小模型，大模型不香了？

...署一个机器学习模型。LLM的另一个重大问题是容易产生“幻觉”——即模型生成的输出看似合理，但实际上并不正确。这是由于LLM的训练方式是根据数据中的模式预测下一个最可能的单词，而非真正理解信息。因此，LLM可能会自...……更多

2024-08-26 14:17:00模型,英伟,微软,模型,训练,性能

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...的风险挑战。除了这两个例子以外，多模态大模型还存在幻觉、偏见、隐私泄漏等各类安全威胁或社会风险，会严重影响它们在实际应用中的可靠性和可信性。这些漏洞问题到底是偶然发生，还是普遍存在？不同多模态大模型的...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

奥尔特曼X上发“草莓” 网友疯狂猜测：这难道是GPT新模型

...究”。此外，草莓的研究方向则是与人工智能无法规避的幻觉问题相关。目前的人工模型在面对常识性问题时常常无法识别正确的逻辑，从而导向幻觉，并生产出虚假的内容。“草莓”等于GPT5？从奥尔特曼最新发帖下面的评论...……更多

2024-08-08 18:41:00奥尔,奥尔特曼,特曼,草莓,猜测,模型

解决医疗数据“孤岛现象”将推动数字化技术应用

...创新机会。”杨瑞荣说。两大挑战包括，第一大模型存在幻觉问题。看似流畅自然的表述，实则不符合事实或者是错误的。“日常生活的交流中，人们对大模型幻觉的容忍度相对较高。但在崇尚严谨的医疗领域，这是致命的弱点...……更多

2023-11-08 07:38:00孤岛,技术应用,现象,医疗,数字,应用

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...式组织输出，例如，JSON、YAML或Markdown格式的输出。- 提高精度并处理边缘情况：微调可以用于纠正幻觉或错误，这些错误很难通过prompt和上下文学习来纠正。它还可以增强模型执行新技能或任务的能力，这些技能或任务很难在提...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

错误率从10%降至0.01%，领英全面分享LLM应用落地经验

...调用（例如 LinkedIn 人物搜索、Bing API 等）。生成：面向精度的步骤，筛选检索到的噪声数据，对其进行过滤并生成最终响应。图 1：处理用户查询的简化 pipeline。KSA 代表「知识共享智能体」，是数十种可以处理用户查询的智能...……更多

2024-08-07 09:33:00错误率,落地,错误,经验,应用,智能

如何识破人工智能的瞎编乱造

...19日发表的一项研究报道了一种能检测大语言模型（LLM）幻觉（hallucination）的方法，该方法能够测量生成回答的含义的不确定性，或者用于提升LLM输出的可靠性。像ChatGPT和Gemini这样的LLM是能够阅读和生成自然人类语言的人工智...……更多

2024-06-21 06:55:00人工智能,人工,智能,方法,幻觉,生成

讯飞星火V3.5春季上新，科大讯飞首发星火图文识别大模型

...解决这一问题。星火图文识别大模型具备对复杂板面的高精度解析，融合篇章语义的文字识别功能，以及覆盖多领域的专业符号识别等特点。借助该技术，讯飞星火可以实现对多媒体信息的深入理解，显著提高用户获取知识和学...……更多

2024-04-29 21:00:00讯飞,星火,模型,图文,模型,星火

谷歌人工智能聊天机器人正在使用bard

...型的一些存在已久的问题，比如他们有编造东西或“产生幻觉”的倾向。但我最担心的是，正如我今年早些时候所写的那样，它们可能带来安全和隐私灾难。科技公司正在将这项存在严重缺陷的技术交到数百万人的手里，并允许...……更多

2023-10-05 10:03:00人工智能,机器人,人工,机器,正在,智能

智慧芽AI助手“芽仔”：你的智能研发专家，开启创新新范式

...强大模型理解能力，减少幻觉，对齐人类意图，将大模型精度提升至80%。持续的数据监控和质量控制是保证训练结果可靠性的关键。在专利大模型领域，目前市场上还没有比较全面、专业、完整的评估体系。智慧芽率先建立了Pat...……更多

2024-03-21 16:15:00新新,范式,助手,智慧,智能,专家

page 2/1667 首页上一页 123 4 5 6 7 下一页末页

更多关于科技的资讯：

以数字化转型驱动管理能级跃升，积极培育新质生产力

在数字经济浪潮奔涌、国企改革持续深化的时代背景下，绵阳安鼎元作为四川安州发展集团旗下专业的国有资产管理平台，勇立潮头，以深刻的变革意识和前瞻的战略视野

2025-11-27 10:07:00

厦门春节赴加拿大旅游市场热度攀升已有不少人预订

厦门网讯（厦门日报记者沈彦彦王元晖）“政策一出台，咨询电话就没停过！”厦门厦旅国际旅行社有限公司湖滨东营业部负责人谢晓燕放下手中的咨询电话

2025-11-27 08:12:00

“脑”力全开！江西抢滩脑机接口新蓝海

当好莱坞经典电影《盗梦空间》描绘的人类通过脑机接口潜入他人意识的场景，从科幻照进现实，一场关乎未来产业格局的竞赛已悄然启幕

2025-11-27 07:13:00

太原知识产权调委会力促专利侵权案和解

专利技术遭盗用，创新成果被侵犯，专利权人该如何维权？11月24日，市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法

2025-11-26 08:11:00

感恩节“心”守护：灵动生活集团全链条心理服务破局，让3000

当感恩节的暖意在街头巷尾流转，“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天

2025-11-26 08:35:00

省级产业云平台落户中北大学

省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告，建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目

2025-11-26 08:41:00

“晋塔”智能装备赋能太原建筑行业

为推动智能建造落地应用，搭建行业交流平台，近日，“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机

2025-11-26 08:42:00

经济热力站｜绿色转型为基金融创新为翼科技赋能为核——助推

11月19日，“京彩不设限・经济热力站”月度主题走访活动再度启程，记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心

2025-11-26 10:06:00

赞皇县：AI赋能“一网通办” 业务办理效率提升70%

河北新闻网讯（次柳静）近日，石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法，创新打造AI“智能填报”平台

2025-11-26 10:07:00

河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训

河北新闻网讯近日，河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校，开展了主题为“产品经理人才共创培养体系”主题培训

2025-11-26 10:09:00

南京生物医药：研发“拔节孕穗”，产业新星闪耀

第91届全国药交会在宁落幕南京生物医药：研发“拔节孕穗”，产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天，南京国际博览中心人流如织

2025-11-26 10:26:00

2025年两院院士增选结果揭晓南京地区7人入选在宁院士总

南报网讯（记者何洁张安琪）11月21日，2025年两院院士增选结果正式揭晓，选举产生中国科学院院士73人、中国工程院院士71人

2025-11-26 10:27:00

隐风文化：锚定四大理念，以精品力穿越短剧周期

由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度，上线后迅速跃居红果站内热播榜高位，这也是今年团队继《咬清梨》《怎敌她动人》之后

2025-11-26 11:06:00

视源股份荣获2024年度广东省科技进步一等奖

2025年11月20日，广东省人民政府正式发布《2024年度广东省科学技术奖通报》（粤府〔2025〕50号）。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目

2025-11-26 11:06:00

视源股份成为英特尔首批尊享级合作伙伴合作再升级

近日，英特尔合作伙伴联盟完成战略升级，联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累

2025-11-26 11:06:00

头条订阅服务