知识,准确率,推理,蚂蚁,框架,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...非凡实力。在软件基准测试SWE-bench Verified中，o3以71.7%的准确率傲视群雄，较其前辈o1模型性能提升超20%。在编程竞技领域，o3于Codeforces竞赛中的评分高达2727分，直逼OpenAI内部顶尖程序员的水平。更令人瞩目的是，在AIME数学竞赛...……更多

2025-02-07 10:14:00透明度,推理,模型,思维,过程,升级

春节流量给支付宝留下了什么？

...是能做的。”陈亮认为，当下AI技术的挑战主要在于提高准确率。以往依赖复杂且可行性不高的模板来调用功能，不仅难以保持高准确率，而且维护困难，导致项目难以持续，大模型技术的引入给LUI提供了更多的可能。基于大模...……更多

2024-02-16 12:00:00流量,支付,五福,支付,模型,蚂蚁

5年投资超1000亿，北京公布一系列AI重磅成果，北大清华百

...可能会掣肘大模型落地应用；需求尽快找到大模型落地与知识产权保护、数据隐私保护之间的平衡点；大模型幻觉问题仍未得到“根治”；大模型从“可用”到“好用”，需要供需双方协同发力，联合研发；部分领域应用积极响...……更多

2024-04-28 11:00:00大佬,清华,微软,重磅,北京,蚂蚁

蚂蚁数科SOFAStack发布全栈AI服务，助力企业用好大模

...站式模型工作台，并实现可视化研发、管理多种具备行业知识库的Agent（智能体）应用，助力企业跑完企业AI应用业务落地的最后一公里。“大模型的高速发展使得AI不得不面临算力管理复杂、训练推理成本高、任务调度难等多方...……更多

2024-06-28 18:10:00蚂蚁,模型,服务,企业,模型,训练

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...中，AI会不断试错并打磨答案，从而显著提高生成结果的准确率和质量。有趣的是，点开AI思考的过程，还会出现AI表示“我在思考这个事情这么做行不行”、“啊时间不够了得尽快给出答案”等。OpenAI确认，这里展示的并不是原...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

... 作为备选。最终的报告结果将基于得分转换为 0 到 100 的准确率指标。未来也可以在我们动态更新的榜单里查看多模态模型在每个月动态更新的最新评测数据，以及在榜单上的最新评测的结果。 ……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

用AI自动设计智能体，数学提分25.9%，远超手工设计

...分数提高了 13.6/100（与基线比），在 MGSM 的数学任务中将准确率提高了 14.4%。此外，在跨域迁移后，它们在 GSM8K 和 GSM-Hard 数学任务上的准确率分别比基线提高了 25.9% 和 13.2%。与手工设计的解决方案相比，本文算法表现出色，这...……更多

2024-08-24 09:36:00设计,手工,数学,智能,智能,元智

支付宝进军大模型医疗应用，技术一号位：我们有4个切入点

...准等方面都建立了很深度的链接。目前我们在北上杭这块准确率，基本上能做到百分之八九十，还在继续优化中。第二个是全科医生。医疗领域面临一个主要问题是，AI目前还无法替代专业医生进行诊断。因此我们更多地将AI定...……更多

2024-09-29 09:55:00军大,切入点,模型,支付,医疗,应用

广东深圳：深化DeepSeek应用赋能助力营商环境优化升级

...AI智能分派助手”，分派响应时间压缩至秒级，工单分派准确率达90%以上。同步开发自动分派插件，非工作时间自动流转至对应部门，提升基层服务效能。日常工作中，可同时处理数十条市民诉求，1秒内响应并自动匹配至对应处...……更多

2025-03-13 17:20:00营商,广东,深圳,升级,环境,应用

大模型观察｜从训练到落地金融业，大模型“升级之路”面临哪些挑

...效率提升了25%。在智能办公领域，大模型目前的意图识别准确率已达到97%。奇富科技则透露，通过AIGC的强大赋能，在电销系统中，语义分析和线索挖掘帮助提升电销线索识别准确率高达98%，同时将转化率提高超过5%。在智能营销...……更多

2024-01-29 21:36:00模型,之路,金融业,落地,观察,训练

综述｜5月全球人工智能领域新看点

...考”“思考多少”。在多个数学数据集上，AutoThink实现了准确率与效率平衡，既提升性能又节省算力，展示出较强的适应性和实用性。营造更合理的AI创新环境国际劳工组织5月20日发布一份有关生成式AI与就业的报告表示，全球...……更多

2025-06-02 13:09:00人工智能,看点,人工,领域,智能,全球

中兴通讯携手上海移动开展业界首个基于大模型的短信反诈治理探索

...、语义等根源维度上进行治理，有效提升诈骗短信的识别准确率、拦截率和召回率。自该系统上线后，境外涉诈案件数量明显降低，为减少人们财产损失、维护社会和谐做出贡献。基于大模型的短信反诈治理主要包括AI实时推理...……更多

2023-10-12 17:21:00中兴通讯,上海,模型,业界,通讯,短信

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...于 Python、C++、J等多种语言。在HumanEval基准测试中，它的准确率为53% ，接近于GPT-4的67% 。Mistral CEO确认新模型性能接近GPT-42月1日，Mistral联合创始人兼CEO Arthur Mensch在X上表示，引发众多猜测的“miqu-1-70b”是……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

真·AI程序员,阿里云「通义灵码」全面进化,全流程开发仅用几

...知、检索增强式生成（RAG）和自适应生成能力，研发问答准确率超过 90%。据统计，通义灵码为已有用户贡献的代码比例已经接近 30%。与此同时，随着通义大模型在语义理解、代码生成、开发工作流等方面全面进化，通义灵码的...……更多

2024-09-21 09:38:00通义,阿里,程序员,进化,流程,程序

GPT-4劲敌，谷歌进入高能+高产模式

...中，Gemini 1.5 Pro能够在长达100万token的文本块中，以99%的准确率找出隐藏有特定信息的文本片段。图源：Gemini 1.5 Pro官方测试数据这个上下文长度使Gemini 1.5 Pro可以自如地处理22小时的录音、超过十倍的完整的1440页的书（587,287字..……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理