知识,准确率,推理,蚂蚁,框架,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

腾讯企点智能客服、营销分析全新升级，助力企业实现智慧客户管理

...统的启动时间从原本的7天以上缩短至分钟级或小时级，准确率也提升了30%，提供更智能的用户互动体验；而全新的企点分析AI助手依托腾讯云行业大模型实现"对话式分析"，让业务人员通过“对话”快速获取海量数据中的数据结...……更多

2023-06-21 14:00:00营销,分析,腾讯,客户管理,智慧,全新

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...多学科多模态理解和推理（MMMU）基准测试中取得了69.1%的准确率。不过，基准测试结果是否真的能反映模型对多样化主题的深入理解，仍然有争议，或者说模型是否只是利用了统计模式，而非依靠理解和推理的情况下就能得出正...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

OpenAI发布最新技术研究，AI“黑盒”不再是难题！

...小模型来验证、监督，GPT-4大模型的输出，从而提升输出准确率以及可控性。PVG技术概念早在2021年8月的一篇论文中就被提出来，OpenAI也正是受此灵感启发。这是一种基于博弈论的训练方法，通过模拟证明者和验证者之间的互动...……更多

2024-07-18 09:47:00最新技术,难题,研究,技术,模型,小数

我国农业科技领域AI应用获重要突破 “神农大模型1.0”发布

...等技术，实现了农业知识有问必答的同时，提高了回答的准确率，缓解了大模型普遍存在的“幻觉”诟病问题。模型由海量高质量农业知识数据训练而成，数据涵盖农学、园艺学、栽培学、生物信息学、动物科学、动物医学、设...……更多

2023-12-31 09:21:00神农,农业科技,模型,突破,领域,我国

迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测

...学场景。所有数据和代码、模型均已开源。MMedBench 上的准确率，图 d 展⽰了在 MMedC 上进⼀步预训练使模型性能相⽐于基线显著提升。大规模多语医疗语料（MMedC）构建在构建数据集方面，研究团队收集了一份多语言医疗语料库...……更多

2024-09-30 09:51:00多语,大规,模型,语料,基准,大规模

360智脑7b参数模型采用3.4万亿tokens训练

...本能力的一种方法）中，360Zhinao-7B-Chat-360K达到98%以上的准确率。360仿照SuperCLUE-200K测评基准构造了中文大海捞针测试，同样做到了98%以上的准确率。除模型权重外，该模型的微调训练代码，推理代码等全套工具集也被一并开源，...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...的可靠性。以下是两个案例：- Phi-2对金融数据情绪分析准确率，从34%提高到85%。- 仅用100个示例，ChatGPT对Reddit评论情绪分析的准确率从48%提高到73%。通常来说，对于较小的初始精度（<50%），微调是一个巨大的障碍，需要用几...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

不仅仅是「GPTs」，支付宝在做一种很新的智能体

...」之处远不止于此，更大的优势在于蚂蚁背后多年技术、知识、经验积累，水到渠成地走向专业智能体路线。以医疗领域为例，支付宝和上海市第一医院联合打造了Al 就医助理「公济小壹」。为应对医疗领域的业知识的短板，...……更多

2024-10-08 18:08:00不仅仅,支付,智能,智能,百宝,支付

致敬浪潮“她”力量丨成功秘诀？不过是把“我能行”，用代码写了

...，最终给出合理的答案。“最开始的测试中，我们的模型准确率只能达到89%左右，而且还存在知识文档检索召回效果差，通过模型检索召回知识文档但选择正确答案的效果差，无论如何调试，还是无法达到预期的效果。”“面对...……更多

2025-03-14 17:54:00能行,浪潮,秘诀,力量,代码,成功

荣耀Magic V5发布，一文看懂YOYO到底有多强大

...息和自动执行任务方面表现出色，例如，MagicGUI模型操作准确率高达91.5%，MagicVL-Nano端侧模型可在保护用户隐私安全基础上实现低功耗图像理解；此外，荣耀构建的三款云端大语言模型，可实现个性化推理、精准理解用户意图；...……更多

2025-07-04 13:11:00一文,荣耀,荣耀,智能,用户,模型

蚂蚁金融大模型来了！智能金融助理支小宝2.0亮相，有啥特色

...是金融服务对错误的容忍度很低，金融大模型要确保领域知识和专业逻辑的严谨性，才能真正落地带来产业价值。知识力、专业力、语言力以及安全力，保障四大能力是前提条件，也是金融大模型要解的产业真命题。对此，王晓...……更多

2023-09-08 23:01:00小宝,金融,蚂蚁,助理,模型,特色

石油巨头牵手DeepSeek

...行业的数学公式、化学结构式、专业图表等专业内容时，准确率较高，能够有效支撑行业数据集建设和行业模型训练。下一步，将进一步完善集团人工智能技术体系，提升石油化工行业大模型的训练质量，实现深度推理与行业...……更多

2025-02-14 22:37:00巨头,牵手,石油,沙特,模型,智能

大模型是否有推理能力？DeepMind数月前的论文让AI社区

...消失。结果还表明，随着数据集大小的增加，模型的最终准确率会提高（在模型大小之间保持一致）。同样，作者观察到架构大小增加的总体趋势是无论数据集大小如何，整体性能都会提高。通过下表 2 可以得出以下几点：动作...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

...。根据结果，二者差异显著，其中，前者正确解决问题的准确率是 13.4%，而 o1 的准确率则能够达到 83.3%。这种推理能力的重要意义在于，有望在更广泛的领域应用，例如，药物发现、材料科学、编程、高等数学和物理等。o1 实...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

京东：推动大模型加快落地应用助力培育发展新质生产力

... 2024年07月30日第 16 版）生成图片采纳率达65%、营销文案准确率超95%，生成式人工智能（AIGC）营销工具“京点点”已经服务20多万户商家，助力商家提升运营效率；快递员只需语音录入，就能给用户发去送货短信，还能通过提问...……更多

2024-07-30 06:38:00京东,生产力,落地,模型,应用,生产

联发科天玑9400+拿下最强AI手机芯片：端侧推理准确率反超

...玑9400的1.25倍，支持最高8B规模的DeepSeek-R1端测部署，推理准确率反超云端大模型。天玑9400+行业首发增强型推理解码技术（SpD+），推理解码能力提升20%，同时集成天玑AI智能体化引擎，可将传统A应用程序升级为更先进的智能体化...……更多

2025-04-11 10:48:00联发,天玑,准确率,云端,推理,芯片

英伟达发布Llama-3.1-Nemotron-51B AI

...保持了几乎相同的精度情况下，推理速度提高了 2.2 倍。准确率能效MT BenchMMLUText generation(128/1024)Summarization/ RAG (2048/128)Llama-3.1- Nemotron-51B- Instruct8……更多

2024-09-26 09:49:00英伟,模型,模型,英伟,精度,内存

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

...EF 可在 7 种经典数学算术运算的测试中实现了近乎 100% 的准确率，且能够支撑 100 位操作数的计算，而同等难度下， GPT-4o 在一些算术问题测试中无法正确给出计算结果。论文标题：Executing Arithmetic: Fine-Tuning Large Language ……更多

2024-10-21 09:54:00灵机,模型,训练,过程,语言,运算符

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...增强），对比Lean-CoT和Lean-STaR的表现。仅用专家迭代时，准确率就达到了43.0%，低于Lean-STaR (45.5%)。这表明Lean-STaR的性能提升不仅仅来自于专家迭代的使用，思维增强也有不可忽略的效果。问题类型与难度MiniF2F-test中的问题有多个...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

智慧家庭重磅文件，征求意见稿来了！事关千亿市场、8大应用场景

...拟现实交互以及多模态交互的交互终端、交互流程、响应准确率与响应时间要求等标准；互联互通针对跨品牌、跨平台智慧家庭设备的识别、访问、控制，包括总体要求、云云互联、端云互联、端端互联、注册入网、设备模型等...……更多

2024-11-23 09:40:00重磅,场景,智慧,意见,文件,家庭

DeepSeek的能力，到底从哪里来？

...重要线索，如果模型拥有更长的“思考时间”，它的解题准确率就会显著提高。为什么“长”如此关键？胡倞成解释，Transformer 计算深度有限，只能做有限步的计算，复杂问题如果不能拆分，就超出了模型的处理能力。只有当模...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...T4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLLaMa-3B、RWKV-4-14B-pile、LLaMA-7B-32K平均只有10%的准确率。目前该论文已被ACL 2024接……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估