推理,模型,能力,论文,社区,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

科大讯飞联手华为首次攻克全国产算力下推理模型训练难关

...15日，科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一，并率先应用于教育、医疗等刚需场景。同时，讯飞星火4.0 Turbo底座能力再次迎来全新升级，图文、数学和长文...……更多

2025-01-15 15:07:00讯飞,华为,难关,模型,训练,全国

关于LLM-as-a-judge范式，终于有综述讲明白了

...的帮助性，无害性，可靠性，生成 / 检索文档的相关性，推理过程中每一步的可行性，以及生成文本的综合质量。Methodology：如何评判表 1：LLM-as-a-judge 训练方法（1）微调：最近许多工作开始探索如何使用微调技术来训练一个...……更多

2024-12-04 09:49:00范式,模型,基准,偏见,数据,评估

超越GPT-4o！开源科研神器登场，4500万论文检索增强生

...成数据训练并微调了Llama 3.1 8B。4.迭代自我反馈生成：在推理过程中，团队使用迭代自我反馈来通过自然语言反馈精炼模型输出。每次迭代都额外检索更多论文，使模型能够提高回答质量并缩小引用差距。为了评估 OpenScholar，团...……更多

2024-11-27 09:58:00论文检索,神器,生成,科研,检索,论文

o1核心作者分享：激励AI自我学习，比试图教会AI每一项任务

...绍下Hyung Won Chung，从公布的o1背后人员名单来看，他属于推理研究的基础贡献者。资料显示，他是MIT博士（方向为可再生能源和能源系统），去年2月加入OpenAI担任研究科学家。加入OpenAI之前，他在Google Brain负责大语言模型的预训...……更多

2024-09-21 09:36:00教会,核心,任务,作者,学习,模型

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

...其基础，看模型提出的声明是否有源文档作为依据- 数学推理：区分LLM生成数学解题方案的正确或错误- 编码：涵盖Python、JavaScript、Java、C++、Go和Rus等流行编程语言，训练FLAMe从备选答案中选出正确程序或修复程序- 安全性：为了...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

京东云：智能体大规模“上岗”，企业深度应用正当时

...模型一体机软硬协同，支持千人规模企业并发需求，实现推理速度提升50%，满血版、标准版、轻量版为不同规模企业提供灵活选择，助力企业快速构建企业级AI服务能力，极大降低专业技术门槛。今天，京东云正式发布三大垂直...……更多

2025-05-20 14:47:00京东,大规,大规模,深度,智能,应用

摆脱Transformer依赖？这家AI初创公司推出国内首个

...能效果——记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。至于为何另辟蹊径，寻求非Transformer的大模型路径，岩芯数智CEO刘凡平指出，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

直追GPT-3.5，“欧洲版OpenAI”推出新模型，成立6

...分全面超越GPT-3.5，更在多个跑分上超过了Llama2 70B，并且推理速度还是后者的6倍。△图源：Mistral AI 在生成同等质量的模型时，Mixtral8x7B的推理过程消耗的成本也明显低于Mistral AI，高能效优势显著。△图源：Mistral AI此外，Mixtral8.……更多

2023-12-22 19:48:00欧洲,估值,模型,模型,公司,欧洲

单卡搞定Llama 3.1 405B，让大模型轻松瘦身！超强

...实现以超低成本进行量化。它支持多种压缩算法、模型和推理后端，具有强大的扩展性和全方位的评估能力。目前，研究团队已将使用方法放在GitHub主页上，戳文末链接即可获取。Llama3.1 更大也更难压缩低比特量化是解决资源受...……更多

2024-08-05 09:34:00工具包,模型,工具,模型,算法,工具

京东率先推出行业首批高商业可用数字人，618向商家免费开放

...考”双通道能力，能满足各行业对“即时响应”和“深度推理”的双重需求。具体来说，750B超大规模模型在训练过程中，使用了动态分层蒸馏、跨领域数据治理等京东创新技术，降低大模型的训练和部署成本，同时兼顾大模型...……更多

2025-05-22 18:51:00京东,商家,开放,数字,商业,行业

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

人工智能助推能源产业高“智”发展

...，其性能与世界顶尖模型GPT-4o不相上下；R1作为面向复杂推理任务的大模型，全球首次复现OpenAI o1模型且性能对比不分伯仲。两款模型是开源模型性能达到世界顶尖闭源模型的首例。简单来说，DeepSeek像是一个聪明又懂你的生活...……更多

2025-02-24 08:32:00人工智能,助推,人工,能源,智能,产业

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...的「我在飞」，进一步询问的话，此外，video-SALMONN还能推理出男人的名字是「杰克」。我们都知道，正是这两句对白成就了这个经典场景，而video-SALMONN恰恰抓住了这个场景的精髓所在！再来一段《疯狂动物城》的动画片段：看...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

与OpenAI o1技术理念相似，TDPO-R算法有效缓解奖

...。通过迭代式的自举过程，o1 基于现有大语言模型的强大推理能力，生成合理的推理过程，并将这些推理融入到其强化学习训练过程中。强化学习技术能够显著提升模型解决复杂问题的能力，尤其是在 o1 所采用的细粒度奖励机...……更多

2024-10-26 09:48:00算法,奖励,理念,问题,技术,模型

苹果公司公布“mm1”多模态大模型

...0亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。IT之家注意到，苹果研究团队相关论文主要是利用MM1模型做实验，通过控制各种变量，找出影响模型效果的关键因素。研究表明，图像分辨率和图像标记数量对...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

国产大模型加速落地，争夺“中国版ChatGPT”心智定位

...技等也分别推出全新的大模型产品。李开复表示，大模型推理成本的下降会推动中国AI大模型进入”落地为王”的阶段，今年会迎来“大模型应用爆发元年”。他同时预测，明年下半年，随着大模型推理成本的大幅度下降，人们...……更多

2024-05-07 18:33:00心智,中国,落地,模型,定位,国产

全球首次！时序大模型突破十亿参数，华人团队发布Time-Mo

...精度，还显著降低了计算负担，完美解决了时序大模型在推理阶段的计算瓶颈。2. 灵活的预测范围：Time-MoE支持任意长度的输入和输出范围，能够处理从短期到长期的各种时序预测任务，实现了真正的全域时序预测。3. 全球最大...……更多

2024-10-23 09:55:00时序,模型,团队,训练,参数,突破

世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效

...模型，赋予 AI 大模型对于 4D 空间的理解、生成、常识和推理的能力，实现 4D 空间中的交互和行动，走向通用空间智能。通用空间智能对于影视游戏、元宇宙等虚拟空间的内容创作，以及自动驾驶、具身智能等物理空间的数据生...……更多

2024-10-30 09:54:00模型,世界,驾驶,场景,突破,效果

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4。而在数学推理方面，Qwen-72B在GSM8K、MATH测评中也领先其他开源模型；代码理解方面，Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升，代码能力也有质的飞跃。△72B模型做数学题 ……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

$多个中国团队斩获EMNLP\'24最佳论文！UCLA华人学者中三篇杰出论文$

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中

...部署模型与人类交互，收集反馈信号用于训练。采用联合推理和数据共享策略，如将理解数据点转换为生成数据点。实验结果显示，耦合方法使模型性能大幅提升，理解准确率提高 19.48%，生成准确率提高 26.07%，且数据效率更高...……更多

2024-11-18 09:59:00论文,中国,学者,多个,团队,华人

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理，团队还在实验中发现，它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后，我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

只要一张图就能还原绘画过程，这篇论文比Paints-UNDO

... 的参数，并使用完整的绘画序列微调时间注意力 LoRA。在推理阶段，当从文本生成绘画序列时，ProcessPainter 不使用艺术品复制网络。在绘画过程重建和补全任务中，ProcessPainter 使用艺术品复制网络接收特定帧的参考输入。为了确...……更多

2024-07-31 09:39:00绘画,过程,论文,绘画,过程,生成

表格增强生成TAG登场：解锁AI自然语言与数据库的完美结合

...题通常需要复杂的领域知识、世界知识、精确计算和语义推理的组合。为了解决这一问题，该研究提出了 TAG 系统，其实现主要包含三个步骤：查询合成、查询执行和答案生成。TAG 模型很简单，但功能强大，由以下三个方程定义...……更多

2024-09-10 13:38:00自然语言,表格,生成,自然,语言,数据库

NeurIPS 2024 | FaceChain团队新作，开

...脸表征模型 TransFace 后，FaceChain 去年也是推出了 10s 直接推理的人物写真极速生成工作，FaceChain-FACT。继 TransFace 之后，FaceChain 团队最近被机器学习顶级国际会议 NeurIPS 2024 接收了一篇人脸表征学习新作， "TopoFR……更多

2024-10-18 09:46:00人脸,拓扑,新作,模型,团队,人脸