知识,准确率,推理,蚂蚁,框架,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...非凡实力。在软件基准测试SWE-bench Verified中，o3以71.7%的准确率傲视群雄，较其前辈o1模型性能提升超20%。在编程竞技领域，o3于Codeforces竞赛中的评分高达2727分，直逼OpenAI内部顶尖程序员的水平。更令人瞩目的是，在AIME数学竞赛...……更多

2025-02-07 10:14:00透明度,推理,模型,思维,过程,升级

春节流量给支付宝留下了什么？

...是能做的。”陈亮认为，当下AI技术的挑战主要在于提高准确率。以往依赖复杂且可行性不高的模板来调用功能，不仅难以保持高准确率，而且维护困难，导致项目难以持续，大模型技术的引入给LUI提供了更多的可能。基于大模...……更多

2024-02-16 12:00:00流量,支付,五福,支付,模型,蚂蚁

5年投资超1000亿，北京公布一系列AI重磅成果，北大清华百

...可能会掣肘大模型落地应用；需求尽快找到大模型落地与知识产权保护、数据隐私保护之间的平衡点；大模型幻觉问题仍未得到“根治”；大模型从“可用”到“好用”，需要供需双方协同发力，联合研发；部分领域应用积极响...……更多

2024-04-28 11:00:00大佬,清华,微软,重磅,北京,蚂蚁

蚂蚁数科SOFAStack发布全栈AI服务，助力企业用好大模

...站式模型工作台，并实现可视化研发、管理多种具备行业知识库的Agent（智能体）应用，助力企业跑完企业AI应用业务落地的最后一公里。“大模型的高速发展使得AI不得不面临算力管理复杂、训练推理成本高、任务调度难等多方...……更多

2024-06-28 18:10:00蚂蚁,模型,服务,企业,模型,训练

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...中，AI会不断试错并打磨答案，从而显著提高生成结果的准确率和质量。有趣的是，点开AI思考的过程，还会出现AI表示“我在思考这个事情这么做行不行”、“啊时间不够了得尽快给出答案”等。OpenAI确认，这里展示的并不是原...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

... 作为备选。最终的报告结果将基于得分转换为 0 到 100 的准确率指标。未来也可以在我们动态更新的榜单里查看多模态模型在每个月动态更新的最新评测数据，以及在榜单上的最新评测的结果。 ……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

用AI自动设计智能体，数学提分25.9%，远超手工设计

...分数提高了 13.6/100（与基线比），在 MGSM 的数学任务中将准确率提高了 14.4%。此外，在跨域迁移后，它们在 GSM8K 和 GSM-Hard 数学任务上的准确率分别比基线提高了 25.9% 和 13.2%。与手工设计的解决方案相比，本文算法表现出色，这...……更多

2024-08-24 09:36:00设计,手工,数学,智能,智能,元智

支付宝进军大模型医疗应用，技术一号位：我们有4个切入点

...准等方面都建立了很深度的链接。目前我们在北上杭这块准确率，基本上能做到百分之八九十，还在继续优化中。第二个是全科医生。医疗领域面临一个主要问题是，AI目前还无法替代专业医生进行诊断。因此我们更多地将AI定...……更多

2024-09-29 09:55:00军大,切入点,模型,支付,医疗,应用

广东深圳：深化DeepSeek应用赋能助力营商环境优化升级

...AI智能分派助手”，分派响应时间压缩至秒级，工单分派准确率达90%以上。同步开发自动分派插件，非工作时间自动流转至对应部门，提升基层服务效能。日常工作中，可同时处理数十条市民诉求，1秒内响应并自动匹配至对应处...……更多

2025-03-13 17:20:00营商,广东,深圳,升级,环境,应用

大模型观察｜从训练到落地金融业，大模型“升级之路”面临哪些挑

...效率提升了25%。在智能办公领域，大模型目前的意图识别准确率已达到97%。奇富科技则透露，通过AIGC的强大赋能，在电销系统中，语义分析和线索挖掘帮助提升电销线索识别准确率高达98%，同时将转化率提高超过5%。在智能营销...……更多

2024-01-29 21:36:00模型,之路,金融业,落地,观察,训练

综述｜5月全球人工智能领域新看点

...考”“思考多少”。在多个数学数据集上，AutoThink实现了准确率与效率平衡，既提升性能又节省算力，展示出较强的适应性和实用性。营造更合理的AI创新环境国际劳工组织5月20日发布一份有关生成式AI与就业的报告表示，全球...……更多

2025-06-02 13:09:00人工智能,看点,人工,领域,智能,全球

中兴通讯携手上海移动开展业界首个基于大模型的短信反诈治理探索

...、语义等根源维度上进行治理，有效提升诈骗短信的识别准确率、拦截率和召回率。自该系统上线后，境外涉诈案件数量明显降低，为减少人们财产损失、维护社会和谐做出贡献。基于大模型的短信反诈治理主要包括AI实时推理...……更多

2023-10-12 17:21:00中兴通讯,上海,模型,业界,通讯,短信

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...于 Python、C++、J等多种语言。在HumanEval基准测试中，它的准确率为53% ，接近于GPT-4的67% 。Mistral CEO确认新模型性能接近GPT-42月1日，Mistral联合创始人兼CEO Arthur Mensch在X上表示，引发众多猜测的“miqu-1-70b”是……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

真·AI程序员,阿里云「通义灵码」全面进化,全流程开发仅用几

...知、检索增强式生成（RAG）和自适应生成能力，研发问答准确率超过 90%。据统计，通义灵码为已有用户贡献的代码比例已经接近 30%。与此同时，随着通义大模型在语义理解、代码生成、开发工作流等方面全面进化，通义灵码的...……更多

2024-09-21 09:38:00通义,阿里,程序员,进化,流程,程序

蚂蚁集团井贤栋：恪守科技伦理，推动AI向善而行

...严谨产业，业界普遍认为面临着三个“能力短板”：领域知识相对缺乏、复杂决策难以胜任，以及对话交互不等于有效协同。而垂直领域、高质量的数据往往以多种模态存在，体系庞杂，比较分散，对隐私保护和资产价值保护的...……更多

2024-07-04 16:38:00而行,伦理,蚂蚁,集团,科技,智能

GPT-4劲敌，谷歌进入高能+高产模式

...中，Gemini 1.5 Pro能够在长达100万token的文本块中，以99%的准确率找出隐藏有特定信息的文本片段。图源：Gemini 1.5 Pro官方测试数据这个上下文长度使Gemini 1.5 Pro可以自如地处理22小时的录音、超过十倍的完整的1440页的书（587,287字..……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理

21.5万张X光，78万个问题！德州大学NIH等联合发布医学

...建立规则，使得相同信息覆盖面上比基于传统规则的方法准确率提高62%。同时，作者还与2位临床专家合作对100个样本的标签进行了全面的评估，进一步帮助微调LLM。基于该数据集，作者提出了一种新的基于图（Graph）的可解释...……更多

2024-08-10 09:47:00德州,问答,视觉,医学,联合,数据

潮声丨全国首上线的这个AI神器，如何让浙江新生儿赢在起点

...跳声，与数据库中的海量数据进行比对，“它让基层筛查准确率提升60%、复杂先心病诊断准确率提升至95.3%。”舒强说。CHANGE是怎么诞生的？CHANGE大模型并非一蹴而就，它的背后，是浙江近30年新生儿救护经验的积累，以及救护...……更多

2025-03-11 08:46:00潮声,神器,浙江,新生儿,新生,起点

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...的推理过程。如上图中的红色实线所示，模型所能达到的准确率与所给定的推理长度呈正相关。且相比于传统的多次采样 + 投票（Majority Voting），模型思维链长度增加展现出了更高的效率。最惊艳的是，发布即上线：所有用户均...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理

还在人工炼丹？自动提示工程指南来了，还带从头实现

...e given problem about geometric shapes.」可以看到，性能并不好，准确率只有 36%，应该有很大的改进空间。不过，在使用 APE 之前，让我们先尝试下一种提示技术：思路链（CoT）推理；这种技术虽然对原始提示词修改不多，但事实证明却...……更多

2024-09-10 13:39:00从头,人工,提示,指南,工程,提示

李飞飞空间智能之后，上交、智源、北大提出空间大模型Spati

...深度信息获取、远近关系比较的任务上，可以达到 99%+ 的准确率。2. 针对空间理解任务，作者公布了 SpatialBench 榜单。通过精心设计和标注 QA，测试模型深度理解能力。SpatialBot 在榜单上展示了和 GPT-4o 接近的能力。模型如何理解...……更多

2024-08-08 09:39:00空间,北大,模型,智能,深度,模型

从“政务助手”到“故障预言家”，人工智能可以赋能哪些场景？

...，自动化分析公文内容，比对归档规则，输出归档结果，准确率达到90%以上，分类归档工作效率提升近80%。未来，该智能体将持续迭代更新，通过实际使用搜集语料，进一步提升模型分析准确度。在衢州，浙江移动衢州分公司成...……更多

2025-03-17 18:14:00预言家,人工智能,预言,政务,人工,助手

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...理能力，并证实了我们的训练策略的有效性。除了更高的准确率外，我们的模型实现的推理速度比 LLaMA-AdapterV2 和 ManipLLM 快 7 倍，这可以归因于 Mamba 语言模型的内容感知推理能力和效率。图 4. RoboVQA 上与机器人相关的推理对比...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

GPT-4o的识图能力有多牛？四大维度深度体验

...识别数据图上的信息，并按要求以图表的形式重新呈现，准确率高达100%。图片来源：GPT-4o四、手写指令和逻辑推理最后，记者上了点难度，用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美，不仅...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

自我纠错如何使OpenAI o1推理能力大大加强?北大MIT

...的正确率高于原正确率（图4）正确率提升与自我评估的准确率高度相关（图4(c):），甚至呈线性关系（图5（a））。采用不同的评价方式效果依次提升：仅使用对/错评价 < 自然语言评价 < 包含 CoT 的对/错评价。这是因为 C...……更多

2024-11-19 09:48:00推理,北大,团队,解释,能力,理论

协同发展，生态聚合丨1024程序员节暨「源聚一堂」开源技术沙

...于开发者的节日里，开发者们在美食节、精彩节目、开源知识有奖问答、互动魔术与游戏，现场K歌等精彩互动中尽情狂欢。让开发者卸下代码和工作，参与线下的狂欢盛宴，领略开发者的多彩风格！广大开发者们以极客精神，...……更多

2023-10-25 13:02:00北京站,一堂,北京,程序员,沙龙,生态

银行业拥抱DeepSeek：可用于哪些场景？如何保障数据安全

...据的挖掘与分析，重塑金融服务模式，实现金融语义理解准确率与业务效率双突破。据该公众号介绍，江苏银行于2023年研究并开发出大语言模型服务平台“智慧小苏”，此次通过引入DeepSeek大语言模型，“智慧小苏”在复杂多模...……更多

2025-02-11 09:32:00银行业,场景,保障,银行,安全,数据

刘庆峰透露“星火X1”7月份再升级

...在案件要素抽取、诉请答辩分析、法律法规推荐等场景的准确率，都超过了DeepSeek R1模型。”据了解，今年4月，科大讯飞助力的安徽省检察院AI辅助办案系统已上线运行。刘庆峰透露，在高考和世博会等场合表现不俗的星火X1，...……更多

2025-06-10 14:46:00星火,月份,升级,讯飞,模型,星火

中国财税GPT迎来最准确的大模型：小竹财税AI问世

...对高效解决财税问题的需求日益迫切。作为中国财税领域准确率领先的垂直大模型，小竹财税AI将不断提升其逻辑推理和上下文理解能力，以更好地满足用户的需求，努力实现“让天下没有难懂的财税”的目标。期待小竹财税在A...……更多

2024-03-14 13:30:00中国,模型,模型,领域,需求,正确率

AI搜索助手心流正式上线

...户的复杂问题。“心流在长文本评测实验中达到超过99%的准确率，具有非常优秀的长文本阅读能力。”据心流的技术人员介绍，在语义理解方面，心流的直接理解能力优于当前市场上的主流模型，间接理解能力（包含复杂推理）...……更多

2024-07-10 15:23:00手心,搜索,知识,能力,搜索,模型

page 4/1667 首页上一页 1 2 345 6 7 8 9 下一页末页

更多关于科技的资讯：

开滦山矿公司：数据多跑路带来设备管理“云效率”

河北新闻网讯（王闯）一体化电机一台、组合开关一台……11月24日，开滦集团唐山矿业公司（简称“开滦山矿公司”）综采一区主管机电工作的副区长李振辉轻点鼠标

2025-12-01 18:13:00

泰安联通：夯实云网融合底座数字赋能千行百业

鲁网12月1日讯泰安联通聚焦精品网络建设核心，持续深化云网融合能力、优化网络运维体系、升级服务保障机制，为区域数字经济发展筑牢通信底座

2025-12-01 13:35:00

冬日有暖意服务联万家——泰安联通客户日打造贴心服务体验

鲁网12月1日讯初冬时节，寒意渐起，但服务的温度却未曾缺席。近日，泰安联通在全市各营业厅成功举办“联通客户日暖冬回馈季”主题活动

2025-12-01 13:37:00

王倩：以“法律+”思维，护航企业破局新生

巾帼不让须眉：年轻有为的破产破局者，王倩用专业赢得信任当企业陷入债务泥潭，当债权人与债务人的利益激烈碰撞，当投资人寻求危局中的机遇——破产业务从来不是简单的“清算注销”

2025-12-01 09:25:00

重塑健康增长范式，米连科技或将引领互联网发展新路径

在互联网行业经历深刻变革的今天，追求健康、可持续的增长模式已成为企业生存发展的关键。米连科技通过其独特的战略路径，向业界展示了一条超越“烧钱换规模”传统逻辑的新型发展道路

2025-12-01 09:55:00

《和平精英》地铁逃生「冰雪危途」全新赛季火热开启，这把雪赚到

列车一响，雪赚开场！《和平精英》地铁逃生全新赛季「冰雪危途」，11月29日，邀你雪赚启航！用创新玩法，拓宽地铁逃生摸金搜打撤的边界

2025-12-01 09:55:00

邮储银行唐山市分行构建专业化服务体系助力科创企业

邮储银行唐山市分行以“政策落地+精准赋能”为主线，积极构建专业化科技金融服务体系，全力支持新质生产力发展。该行创新推出“网点深耕+全链服务”模式

2025-12-01 10:02:00

人保财险唐山燕新路营销服务部开展“面对面、零距离”客户服务行

近日，人保财险唐山燕新路营销服务部组建专项服务小组，走进公司周边场所，开展“面对面、零距离”客户服务行动。活动现场，工作人员以客户需求为导向

2025-12-01 10:06:00

大数据助力医保精准支付与风险管控

信息技术的迅速发展，尤其是大数据的广泛应用，正在推动医保体系发生深刻变革。传统的医保支付方式已经难以适应现代医疗服务的复杂性与多样化需求

2025-12-01 07:04:00

“一上午加了8位境外采购商”

本报讯(全媒体记者陈春伟、实习生罗家骏)“嘀”的一声，江西华昌竹业集团有限公司外贸经理严慧的微信好友列表里，又多了一位国际采购商

2025-12-01 07:05:00

四中全会精神在基层｜锚定新赛道，国产辊压机出海闯市场

11月16日，一艘装载邢台纳科诺尔精轧科技股份有限公司生产的辊压分切一体机的货轮，从天津港环球滚装码头启航驶往海外。至此

2025-11-30 07:36:00

坚定信心勇挑大梁·产业新亮点丨“能址星图”如何全省率先把数

10月18日，在2025中国国际数字经济博览会上，秦皇岛市大数据有限公司展示“能址星图”数据产品。石勇摄“我们的‘能址星图’产品上架两三个月时间

2025-11-30 07:37:00

重磅！鸣望教育签约英国子午线英语，解锁中英教育合作新范式！

2025年11月20日，鸣望教育行业赋能第27届研讨峰会，达成一项重磅签约。鸣望教育与拥有46 年专业积淀的英国子午线英语学校（Meridian English）正式达成战略合作

2025-11-30 12:05:00

新生态、新平台、新增长｜鲸鸿动能数智赋能品牌确定性增长

2025年，中国消费市场的竞争正从流量红利的浅层博弈，迈向以生态力为引擎、深度运营为核心的新阶段。在这一关键转折点，鲸鸿动能于11月28日成功举办“鸿蒙商业增长论坛·品牌营销沙龙”

2025-11-30 12:05:00

全运会宣传中惊现AI MV：谁在用算法谱写湾区之声？

第十五届全国运动会于11月21日圆满落下帷幕。记者从组委会了解到，一首全程由AI生成的原创宣传MV《向着光的方向》已被正式收录进本届赛事的官方宣传素材库

2025-11-30 12:06:00

头条订阅服务