知识,准确率,推理,蚂蚁,框架,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

360智脑7b参数模型采用3.4万亿tokens训练

...本能力的一种方法）中，360Zhinao-7B-Chat-360K达到98%以上的准确率。360仿照SuperCLUE-200K测评基准构造了中文大海捞针测试，同样做到了98%以上的准确率。除模型权重外，该模型的微调训练代码，推理代码等全套工具集也被一并开源，...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

不仅仅是「GPTs」，支付宝在做一种很新的智能体

...」之处远不止于此，更大的优势在于蚂蚁背后多年技术、知识、经验积累，水到渠成地走向专业智能体路线。以医疗领域为例，支付宝和上海市第一医院联合打造了Al 就医助理「公济小壹」。为应对医疗领域的业知识的短板，...……更多

2024-10-08 18:08:00不仅仅,支付,智能,智能,百宝,支付

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...的可靠性。以下是两个案例：- Phi-2对金融数据情绪分析准确率，从34%提高到85%。- 仅用100个示例，ChatGPT对Reddit评论情绪分析的准确率从48%提高到73%。通常来说，对于较小的初始精度（<50%），微调是一个巨大的障碍，需要用几...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

致敬浪潮“她”力量丨成功秘诀？不过是把“我能行”，用代码写了

...，最终给出合理的答案。“最开始的测试中，我们的模型准确率只能达到89%左右，而且还存在知识文档检索召回效果差，通过模型检索召回知识文档但选择正确答案的效果差，无论如何调试，还是无法达到预期的效果。”“面对...……更多

2025-03-14 17:54:00能行,浪潮,秘诀,力量,代码,成功

荣耀Magic V5发布，一文看懂YOYO到底有多强大

...息和自动执行任务方面表现出色，例如，MagicGUI模型操作准确率高达91.5%，MagicVL-Nano端侧模型可在保护用户隐私安全基础上实现低功耗图像理解；此外，荣耀构建的三款云端大语言模型，可实现个性化推理、精准理解用户意图；...……更多

2025-07-04 13:11:00一文,荣耀,荣耀,智能,用户,模型

石油巨头牵手DeepSeek

...行业的数学公式、化学结构式、专业图表等专业内容时，准确率较高，能够有效支撑行业数据集建设和行业模型训练。下一步，将进一步完善集团人工智能技术体系，提升石油化工行业大模型的训练质量，实现深度推理与行业...……更多

2025-02-14 22:37:00巨头,牵手,石油,沙特,模型,智能

大模型是否有推理能力？DeepMind数月前的论文让AI社区

...消失。结果还表明，随着数据集大小的增加，模型的最终准确率会提高（在模型大小之间保持一致）。同样，作者观察到架构大小增加的总体趋势是无论数据集大小如何，整体性能都会提高。通过下表 2 可以得出以下几点：动作...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

...。根据结果，二者差异显著，其中，前者正确解决问题的准确率是 13.4%，而 o1 的准确率则能够达到 83.3%。这种推理能力的重要意义在于，有望在更广泛的领域应用，例如，药物发现、材料科学、编程、高等数学和物理等。o1 实...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

京东：推动大模型加快落地应用助力培育发展新质生产力

... 2024年07月30日第 16 版）生成图片采纳率达65%、营销文案准确率超95%，生成式人工智能（AIGC）营销工具“京点点”已经服务20多万户商家，助力商家提升运营效率；快递员只需语音录入，就能给用户发去送货短信，还能通过提问...……更多

2024-07-30 06:38:00京东,生产力,落地,模型,应用,生产

联发科天玑9400+拿下最强AI手机芯片：端侧推理准确率反超

...玑9400的1.25倍，支持最高8B规模的DeepSeek-R1端测部署，推理准确率反超云端大模型。天玑9400+行业首发增强型推理解码技术（SpD+），推理解码能力提升20%，同时集成天玑AI智能体化引擎，可将传统A应用程序升级为更先进的智能体化...……更多

2025-04-11 10:48:00联发,天玑,准确率,云端,推理,芯片

英伟达发布Llama-3.1-Nemotron-51B AI

...保持了几乎相同的精度情况下，推理速度提高了 2.2 倍。准确率能效MT BenchMMLUText generation(128/1024)Summarization/ RAG (2048/128)Llama-3.1- Nemotron-51B- Instruct8……更多

2024-09-26 09:49:00英伟,模型,模型,英伟,精度,内存

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

...EF 可在 7 种经典数学算术运算的测试中实现了近乎 100% 的准确率，且能够支撑 100 位操作数的计算，而同等难度下， GPT-4o 在一些算术问题测试中无法正确给出计算结果。论文标题：Executing Arithmetic: Fine-Tuning Large Language ……更多

2024-10-21 09:54:00灵机,模型,训练,过程,语言,运算符

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...增强），对比Lean-CoT和Lean-STaR的表现。仅用专家迭代时，准确率就达到了43.0%，低于Lean-STaR (45.5%)。这表明Lean-STaR的性能提升不仅仅来自于专家迭代的使用，思维增强也有不可忽略的效果。问题类型与难度MiniF2F-test中的问题有多个...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

智慧家庭重磅文件，征求意见稿来了！事关千亿市场、8大应用场景

...拟现实交互以及多模态交互的交互终端、交互流程、响应准确率与响应时间要求等标准；互联互通针对跨品牌、跨平台智慧家庭设备的识别、访问、控制，包括总体要求、云云互联、端云互联、端端互联、注册入网、设备模型等...……更多

2024-11-23 09:40:00重磅,场景,智慧,意见,文件,家庭

OceanBase发布首款AI数据库seekdb，探索数据库

...seekdb（简称seekdb）。开发者仅需三行代码，即可快速构建知识库、智能体等AI应用，轻松应对百亿级多模数据检索，真正实现“开箱即用”的AI数据基座。该产品支持向量、全文、标量及空间地理数据的统一混合搜索，深度融合AI...……更多

2025-11-18 13:21:00数据库,数据,范式,数据,数据库,搜索

DeepSeek的能力，到底从哪里来？

...重要线索，如果模型拥有更长的“思考时间”，它的解题准确率就会显著提高。为什么“长”如此关键？胡倞成解释，Transformer 计算深度有限，只能做有限步的计算，复杂问题如果不能拆分，就超出了模型的处理能力。只有当模...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...T4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLLaMa-3B、RWKV-4-14B-pile、LLaMA-7B-32K平均只有10%的准确率。目前该论文已被ACL 2024接……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

2023年度“星河产业应用创新奖”揭晓，国网智研院、宝马等1

...司数百人的 IT 核心团队及庞大的供应商团队，解决问题准确率大幅提升的同时，降低约 30%的推理费用和时间。上海南洋万邦软件技术有限公司基于⻜桨和文心大模型打造一站式节能减碳方案，立足产业需求，从碳感知、碳计算...……更多

2024-01-04 16:41:00宝马,创新奖,星河,获奖,年度,产业

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...其专门用于评估模型在化学、物理和生物学等领域的专业知识水平，并邀请了拥有相关领域博士学位的专家参与测试。测试结果显示，o1不仅成功完成了测试，更是超越了博士表现，成为首个在GPQA diamond 基准上击败人类专家的AI...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

苹果AI登场，与OpenAI合作，Siri将采用GPT-4o

...款 2 亿日元，并计划在 2024 财年将拨款提升至 3 亿日元。准确率可达 70%，科学家利用 AI 解读狗的叫声：研究发现，用于训练人类语音的 AI 模型可以作为训练动物交流模型的起点。这一模型的主要障碍是缺乏公开可用的数据。研...……更多

2024-06-11 09:00:00情报局,独角兽,情报,芯片,进展,苹果

海信重磅发布“云信·通途交通大模型”：以AI之力，解锁智

...报数据，系统通过“大小模型协同+RAG检索”技术，实现准确率超98%的舆情精准定位，并能够超前预警潜在舆情风险；在自动化指挥调度环节，系统基于众多城市交通保障经验与专家经验，融合实时路况与三级预测体系，能够实...……更多

2025-04-24 16:17:00海信,交通,通途,智能交通,重磅,模型

重磅！TeleAI 完成首个全国产化万卡万参大模型训练

...rompt 设计、多模型的投票机制等手段，进一步提高了模型准确率和鲁棒性，最终以领先第二名将近 3 分的绝对优势排名第一。开源共享，引领创新TeleChat2-115B 的开源标志着大模型国产化迈进了又一个新征程。作为最早布局并首先...……更多

2024-09-30 09:50:00万卡,重磅,模型,国产,训练,模型

港中文团队提出大模型元推理范式，革新大模型的评价体系

...：在教育领域，如果 GPT4 在小学级别的数学题目上的评测准确率只有四成，那么我们难免会对 GPT4 的实用性产生怀疑。在咨询领域，大模型的应用场景高度依赖于对不同方案的推演、整体步骤的拆分、解析等能力。而当今大模型...……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

清华开源混合精度推理系统MixQ：大模型近无损量化并提升推理

...合精度量化的LlaMA模型在MMLU 20个领域上的数据集进行推理准确率测试表明，采用8bit混合精度量化后的准确率下降不到0.1%：△图6 混合精度量化分类准确率不过，此前已有的混合精度量化的系统的性能普遍不高，主要瓶颈在针对...……更多

2024-10-22 09:57:00推理,清华,吞吐,精度,混合,模型

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...调模型。经过测试，人类在该基准上可以达到至少82.1%的准确率，但Claude 3.5 Sonnet和GPT-4o等顶流模型的成绩却远远落后于人类，分别只有64.7%和59.9%。目前全部数据已经上传至HuggingFace仓库。仓库地址：https://huggingface.co/da……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力