精度,幻觉,模型,结果,模型,幻觉头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

OpenAI叫板搜索霸主谷歌：摆脱“AI幻觉”困扰，我的SearchGPT已抢先一步

...”，不过目前还没有看到相关案例演示。谷歌曾因“AI幻觉”大翻车OpenAI为此采用成本更高昂的办法OpenAI首席执行官奥尔特曼7月25日在社交媒体上发文称：“我们一直认为搜索引擎还有很大的发展空间，因此我们推出了SearchGPT...……更多

2024-07-27 16:44:00霸主,幻觉,搜索,搜索,答案,用户

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...等模型。尤其在数学问答等方向表现媲美70B参数模型；在幻觉等任务中，Ovis-1.6的幻觉现象和错误率显著低于同级别的模型，展现了更高的生成文本质量和准确性。5、全部开源可商用：Ovis系列模型License采用 Apache 2.0。Ovis 1.0、1.5...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

大模型观察｜从训练到落地金融业，大模型“升级之路”面临哪些挑

...常提到的技术挑战固然重要，但更为核心的问题在于机器幻觉和合规风险。机器幻觉是指大模型在学习海量数据后，可能会根据对前文内容的理解“编造”出一些“无中生有”的内容。在容错率较低的金融领域，这种幻觉会直...……更多

2024-01-29 21:36:00模型,之路,金融业,落地,观察,训练

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

...Llama 3.1 405B：推理方面，官方表示重点关注减少模型“幻觉”，Mistral Large 2能够识别自己在找不到解决方案或缺乏足够信息提供确信答案时的情况。由此模型在数学基准测试中的表现相比之前有了不小提升。在GSM8K（8-shot）和MAT...……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理

2024年最重要的趋势，可能影响你的工作

...个重大的技术挑战。（图/unsplash）第二个重大的困境是AI幻觉。因为AI是一种概率模型，所以它不可避免地会出现幻觉。这种幻觉既是好事，也是坏事。好事就是它代表了AI具有想象力和融合性，有组合式创新和增量式创新的能力...……更多

2024-01-01 09:55:00趋势,影响,工作,模型,新周刊,沈阳

清华大学孙茂松：人工智能会取代部分低端智力劳动者，但不可能发

...外金融领域数字特别重要，一般模型碰到数字问题会产生幻觉，而自研模型会针对金融领域的特殊问题进行特殊设计，这也决定了垂类大模型需要有一支比较高水平的研发队伍才能做好。孙茂松预测，随着大模型技术的成熟，将...……更多

2024-05-24 18:10:00清华大学,清华,人工智能,劳动者,低端,定律

百万鲁棒数据训练，3D场景大语言模型新SOTA！IIT等发布

...的回答。因此碰到问题与场景无关时，模型也更容易出现幻觉。这种模型有可能只是记住了正样本对，而非真正地理解被问及的场景、物体、以及具体的指令。 2. 由于在造数据的过程中，人类标注员或者生成式大语言模型是按...……更多

2024-10-16 13:35:00模型,场景,训练,语言,数据,物体

大语言模型对著名数学问题有“新见解”

...》杂志上。基于人工智能的工具（例如LLM）有时受制于“幻觉”，导致作出看似合理但实际是错误的陈述。加入一个评估步骤，系统地衡量潜在解决方案的准确性，使得利用LLM应对复杂问题成为可能。这些问题一般需要可验证且...……更多

2023-12-15 01:27:00见解,模型,语言,数学,问题,数学

新研究：新技术助力人工智能减少“胡诌”

...AI回答的可靠性。大语言模型的“胡诌”在业界被称为“幻觉”，牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中，熵描述的是系统的混乱或者说不稳定程度。这项研究中，熵衡量了大语言...……更多

2024-06-25 16:04:00新技,人工智能,人工,新技术,智能,研究

不同量级参数模型性能同样优秀夸克大模型再登行业评测榜首

...性。在医疗健康领域，夸克大模型已经可以将问答内容的幻觉率降低至5%，处在行业领先水平。夸克推进搜索革新，自研大模型打造技术新底座在互联网高速发展的30余年中，搜索曾经高效地满足了用户主动获取信息的需求。但...……更多

2023-11-24 13:53:00夸克,模型,量级,榜首,评测,性能

儿童电话手表出现错误问答 360创始人周鸿祎公开致歉

...智能，而且人工智能全世界公认的一个难题就是它会产生幻觉，也就是它有的时候会胡说八道，这个是大模型的本身固有的特性。如何能够最大限度的减少幻觉，我们一直在做努力，比如说我们试图通过跟搜索的内容对比，来减...……更多

2024-08-22 21:44:00周鸿,创始人,手表,问答,错误,儿童

国内首个端到端语音大模型将上线，人工智能也要有“情商”

...且通过回应训练和客观信息非幻觉对抗训练，可以实现高精度、高情绪反馈的客户响应。西湖心辰展出的另一款小天心理疏导大模型，则相当于一位“心理咨询师”，利用超100TB的多模态心理行为数据深度训练，同时与心理学专...……更多

2024-09-05 10:07:00音大,人工智能,情商,人工,模型,智能

回顾GPT大模型2023这一年，5大顶级公司预测2024年A

...提供更多选择。一家主要保险公司将提供专门的AI风险幻觉保险：genAI对幻觉或错误的倾向改变了风险管理和复杂风险转移策略的计算方式。尽管保险公司一直在努力弥补涉及AI幻觉的保险漏洞，但鉴于genAI的预期增长，先锋保...……更多

2023-12-01 15:02:00模型,顶级,产品,公司,模型,人工智能

2023内容科技应用典型案例：传播大脑科技（浙江）股份有限公

...信息。知识增强技术：为缓解大模型在结果生成过程中的幻觉问题，引入知识增强技术与外部知识库进行交互，以补充和约束模型的输出，从而提高信息的准确性和完整性。长文本建模技术：通过长文本建模和切片方式突破大模...……更多

2024-04-08 17:07:00传播,科技,典型案例,浙江,大脑,模型

汉王科技发布天地大模型：适用于古文、法律、教育等多个领域

...汉语大模型杜绝了通用大模型最容易产生的代词错乱甚至幻觉的场景，完成了开放式问答的任务。法律大模型的演示环节，通过劳动问答、婚姻问答、法考问答三个领域的开放性问答演示，结果表明，法律大模型不仅具备专业知...……更多

2023-10-12 15:02:00汉王,汉王科技,古文,模型,多个,领域

摆脱Transformer依赖？这家AI初创公司推出国内首个

...性，让决策过程难以解释；长序列处理困难和无法控制的幻觉问题也限制了大模型在某些关键领域和特殊场景的广泛应用。随着云计算和边缘计算的普及，行业对于高效能、低能耗AI大模型的需求正不断增长。图片来自岩芯数智...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

史上最严中文真实性评估：OpenAI o1第1豆包第2，其它

...会产生错误输出或缺乏证据支持的答案，这就是所谓的“幻觉”问题，极大地阻碍了通用人工智能技术（如大语言模型）的广泛应用。此外，评估现有大语言模型的真实性能力也颇具难度。例如，大语言模型通常会生成冗长的回...……更多

2024-11-22 09:51:00豆包,中文,真实性,评估,模型,中文

2023金融大模型报告|重塑金融科技

...用对业务进行实际支持。在消费金融领域，通用大模型精度不够、金融专业知识缺失，以及难以满足消费场景中大量定制化需求等问题，成为当前亟待解决的难题。对此，招联消费金融与中山大学联合研发推出开源金融大模“...……更多

2023-12-11 13:11:00金融,模型,报告,科技,模型,金融

研究：网络充斥低质机翻内容，大语言模型训练需警惕数据陷阱

...标准来看可能质量很低。这可能会导致LLM模型产生更多‘幻觉’ ，而选择偏差表明即使不考虑机器翻译错误，数据质量也可能较低。数据质量对于LLM训练至关重要，其中高质量语料库如书籍和维基百科文章通常会进行多次向上...……更多

2024-02-04 17:00:00陷阱,模型,训练,语言,内容,数据

浩鲸科技鲸智BI大模型发布，从算法炫技到价值落地

...用户查询的指标和相关维度。为了增强问数服务层的数据精度与效能，浩鲸科技的BI大模型团队聚焦于构建一套全面的BI知识数据管理体系。该体系深刻涵盖了业务术语、同义词汇、原子术语、关键指标、多维数据以及库表模型...……更多

2024-09-23 09:53:00算法,落地,模型,价值,科技,数据

文档处理效能飙升！浩鲸科技“文档大模型”核心技术揭秘！

...准高效：集成前沿 NLP 算法与模型，实现文档处理速度与精度的双重飞跃。抽取精度高达 98%，问答响应准确率超越 80%，让信息获取更加智能、便捷。格式兼容，全面广泛：拥抱多样化文档生态，支持超过 30 种文件格式，特别...……更多

2024-09-26 13:36:00文档,效能,模型,核心,处理,技术

2023金融大模型报告|智能风控：荆棘中有玫瑰

...场风险管理的准确性和全面性”。由于保险业对信息的高精度的要求和严苛的数据合规要求，元保保险经纪（北京）有限公司负责人也同样指出，大模型可以协同进行更总结性的监控，判断异常的交易频率规模，判断是否存在内...……更多

2023-12-11 13:11:00荆棘,模型,玫瑰,智能,金融,报告

媲美OpenAI事实性基准，这个中文评测集让o1-previ

...引领 AI 在生活消费领域的技术创新。如何解决模型生成幻觉一直是人工智能（AI）领域的一个悬而未解的问题。为了测量语言模型的事实正确性，近期 OpenAI 发布并开源了一个名为 SimpleQA 的评测集。而我们也同样一直在关注模型...……更多

2024-11-21 09:43:00事实性,基准,中文,评测,事实,模型

法院，帮AI大模型“反诈”

...侵权案件追根溯源，揭开恶意取证真相，打破人工智能“幻觉”，确保司法公正不被技术操纵——法院，帮AI大模型“反诈”见多了“李逵”诉“李鬼”，没想到还会碰到“李鬼”诉“李逵”……2024年3月，上海市青浦区人民法...……更多

2024-10-11 09:43:00模型,法院,祥云,赵晖,青浦,案件

首个职教行业大模型发布，粉笔AI老师助力高效学习

...感慨，为实现这一目标，团队克服了诸多瓶颈，其中，「幻觉」是棘手难题之一。作为大模型在落地过程中普遍缺陷，AI 幻觉目前难以被根除。这导致大模型会给出一些看似合理但错漏百出的答案，而这对教育尤为「致命」。为...……更多

2024-07-13 09:56:00粉笔,模型,老师,学习,行业,粉笔

中金公司信息技术部执行负责人王缅：金融行业做好客户服务的标准

...，大模型的输出标准相对比较模糊，当前阶段存在模型'幻觉'，但是金融服务对于输出结果要求相对准确、严肃，两者之间存在一定矛盾。针对此难点有两点建议：第一，建议大模型与小模型搭配，运用行业专业领域数据结合基...……更多

2023-12-08 20:29:00可通,中金公司,技术部,中金,标准化,模型

大模型+家电的终极想象：人与机器共生的未来

...切入口。AI时代，是触手可及的未来，还是望山跑死马的幻觉？未来的问题，要回到现实寻找答案。比预想中更快的，是大模型的整体竞争，已经走向应用与落地的新赛段。我们需要找到一个链接现实与数字世界的载体，作为未...……更多

2023-11-16 11:32:00终极,模型,机器,智能,模型,技术

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...了空间感知的负样本挖掘，进一步提高了模型的健壮性。幻觉问题团队也观察到了多模态大模型在回答是 / 否类问题时，往往表现出产生“幻觉”。对此，团队通过图像条件类别定位以及语义条件类别定位两种方式进行负样本挖...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

谷歌“ai摘要”功能生成奇怪结果

...伊此前在接受采访时承认，这些“AI摘要”功能产生的“幻觉”是大型语言模型（LLM）的“固有缺陷”，而大型语言模型正是“AI摘要”功能的核心技术。皮查伊今年5月曾表示，此问题“尚无解决方案”（isstillanunsolvedproblem）。 ……更多

2024-06-21 09:36:00生成,摘要,功能,结果,披萨,里加

京东探索研究院院长、京东科技人工智能业务负责人何晓冬：让大模

...迭代更新；在推理技术方面，京东采用了端到端低比特高精度量化技术，有效降低了模型体积，同时提升了推理性能，显存节约高达70%；在语音领域，言犀大模型通过迭代优化，实现了跨语种的语音合成，仅需3-6秒的语音样本即...……更多

2024-07-31 11:48:00京东,人工智能,院长,研究院,人工,模型

page 3/1667 首页上一页 1 234 5 6 7 8 下一页末页

更多关于科技的资讯：

画里有话｜充电宝容量岂能“充水”

今年8月，消费者王先生在淘宝某品牌官方旗舰店购买了一款电芯容量为10000毫安的充电宝，背面小字标示的额定容量仅有6000毫安

2025-10-23 08:37:00

AI导购好用吗专家为您解读趋势、支招避坑

厦门网讯（厦门日报记者杨霞瑜）“AI凑单比价”“AI万能搜”“AI帮我挑”……今年“双11”大促已经开始，AI在电商平台中被广泛使用

2025-10-23 08:42:00

$荣耀与比亚迪达成深度战略合作共绘智慧出行\$

荣耀与比亚迪达成深度战略合作共绘智慧出行"全场景互联"新蓝

10月21日，荣耀与比亚迪在深圳签署战略合作协议。双方将依托荣耀车联解决方案与比亚迪 DiLink的全新一代智慧生态，以"人"为核心

2025-10-23 08:46:00

Fanttik官宣成为NBA休斯顿火箭队官方合作伙伴，以创新

10月16日，创新工具品牌Fanttik官宣成为NBA休斯顿火箭队官方合作伙伴。此次合作基于双方理念的高度契合，Fanttik以“高性能

2025-10-23 09:16:00

宁波银行南京分行携手高德地图共筑南京餐饮数字化增长新生态

10月22日，高德到店助力餐饮行业经营发展（南京专场）活动在南京圆满落幕。该活动由宁波银行南京分行与高德地图联合主办，吸引众多餐饮企业家代表参与

2025-10-23 09:44:00

民生银行石家庄分行持续优化支付结算服务

近年来，民生银行石家庄分行坚持“以客户为中心”的服务理念，将支付业务作为全行战略性基础业务之一，紧跟市场发展趋势和客户需求

2025-10-23 10:02:00

“中国芯”，南京浦口造

沐曦发布首款全国产通用GPU芯片“中国芯”，浦口造□南京日报/紫金山新闻记者肖凡通讯员吴晓倩IP设计、晶圆制造、封装测试全流程国内生产

2025-10-23 07:46:00

青年科创擂台赛中北大学获佳绩

10月22日从中北大学获悉，第十九届“挑战杯”全国大学生课外学术科技作品竞赛2025年度中国青年科技创新“揭榜挂帅”擂台赛日前在全国各地拉开帷幕

2025-10-23 07:49:00

聚焦雄安新区｜首颗“雄安造”卫星完成生产下线

雄安新区空天信息产业从布局迈向实质性产出阶段首颗“雄安造”卫星完成生产下线河北日报讯（记者解丽达、曹铮见习记者李畅）10月22日

2025-10-23 07:55:00

记者走基层｜安平添“智造” 丝网发“新芽”

10月22日，安平国际会展中心。当天开幕的第25届中国·安平国际丝网博览会，用满场的“智造”活力，改写着人们对丝网的老印象

2025-10-23 07:59:00

试水市场化，VR博览会迸发新活力

会展作为经济发展的“晴雨表”和“风向标”，不仅是经济发展的助推器，更是展示经济活力的重要窗口。如今，世界VR产业大会成为南昌乃至江西的一张名片

2025-10-23 06:29:00

AI赋能医院病案内涵质量提升

鲁网10月22日讯（记者魏萱）为深入推进健康中国建设，进一步深化医药卫生体制改革，全面提升医疗质量安全水平，建设有特色的医疗质量管理体系

2025-10-22 14:27:00

胡海建眼中的“末端决胜论”，跨越速运陆运体系如何做到“快、准

在跨越速运的“陆空协同”运力体系中，陆运网络是连接航空枢纽与客户的关键环节。董事长胡海建深知，末端服务的“最后一公里”直接影响客户体验

2025-10-22 14:37:00

$布蕾克咖啡携\$

布蕾克咖啡携"云南有机瑰夏"正式登陆Ole'超市，加速布局高

近日，布蕾克咖啡携新品「云南有机瑰夏礼盒」等多款咖啡产品登陆高端超市品牌Ole'精品超市，通过优质渠道将高品质咖啡呈现给广大咖啡爱好者

2025-10-22 14:37:00

AI驱动数据赋能丨浪潮云领跑中国城市可信数据空间市场

近日，艾瑞咨询正式发布《2025年中国城市可信数据空间行业研究报告》，从城市可信数据空间的发展驱动因素和核心价值出发，对其总体架构

2025-10-22 17:06:00

头条订阅服务