推理,模型,成本,模型,团队,推理头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

提质降价，国产大模型加速奔跑

...据方面实现多模态统一，持续突破人工智能感知、理解和推理世界的能力边界。这些，拓展着大模型与各行各业融合的深度和广度。“如今，芯片制造商、数据供应商、模型研发企业、应用开发商等方面协同合作正日益增强，共...……更多

2025-02-05 03:48:00模型,国产,模型,国产,能力,成本

对话云天励飞董事长陈宁：2030年人类将实现AGI，推理芯片

...拥有一个AI Agent。“如果说2024年是大模型落地应用之年，推理就会越来越重要。此前在训练芯片市场上，英伟达一骑绝尘，占有绝对的市场占有率，那么今天，推理芯片市场没有垄断性的巨头。这不仅是万亿级、万亿颗芯片的蓝...……更多

2024-03-30 18:00:00陈宁,云天,推理,董事长,芯片,董事

李开复AI公司首发大模型，阿里云领投 | 36氪独家

...SIQA、HellaSwag、WinoGrande等多个数据集，来评估Yi的“常识推理能力”“阅读理解能力”“数学与代码能力”等多维度能力。Yi能力。结果显示，Yi-6B在常识推理能力和阅读理解能力上达到了国内外开源模型的平均水平，但在数学与...……更多

2023-11-06 12:13:00李开复,万物,模型,能力,训练,阿里

人类和AI在推理任务中的表现相似，Google DeepMi

...人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

大模型新趋势之MoE：现状、挑战及研究方向

...，MoE在训练过程通过门控模型实现“因材施教”，进而在推理过程实现专家模型之间的“博采众长”。图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化，在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

摆脱Transformer依赖？这家AI初创公司推出国内首个

...能效果——记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。至于为何另辟蹊径，寻求非Transformer的大模型路径，岩芯数智CEO刘凡平指出，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

硅谷大模型“价格战”上演，一味“卷”价格会有未来吗？

...左右API“价格战”？在降价之外，有媒体指出，加快模型推理速度（即每秒生成Token的数量）也是硅谷大模型市场的主要竞争点。但“卷”价格、“卷”速度真的会赢得未来吗？硅谷在“拼”什么？5月中旬，字节跳动豆包以0.0008...……更多

2024-05-27 15:27:00硅谷,价格,价格战,一味,模型,模型

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑

...The」。完整的回复，花了整整20个小时熟悉模型的训练和推理的朋友都知道，这些事情一点都不奇怪。集群搭建（GPU配置、网络设计、轨道优化等）、集群管理（实时监控、故障排除等）……个个都是「拦路虎」。对于缺乏相关...……更多

2024-08-02 09:47:00大厂,模型,参数,疯狂,服务器,服务

张云泉：集中力量，促进国产AI大模型发展

...法成为新时代的关键资源。大模型的开发、训练、微调及推理各个环节均离不开算力，且算力成本占据整体开销的大头。可以说，算力成为支撑大模型发展的关键因素，也是科技竞争的战略高地。在大规模的前端产品落地后，算...……更多

2024-09-03 14:17:00云泉,模型,国产,力量,发展,模型

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...交视觉-语言-动作建模框架RevThink：使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术分享群」。SwiftEdit：50 倍速文本引导图像...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

交通类 AI 项目预演阶段，本地化部署的一些新思路

...模型；资源调度类：还有团队在考虑利用DeepSeek的深度推理能力，对历史流量、天气、事件等多源数据进行融合分析，开发出大模型能够动态地优化信号灯控制策略，提升路口通行效率和交通资源利用率。这其中，报告生成类...……更多

2025-04-24 18:00:00思路,阶段,交通,项目,模型,交通

阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o

快科技1月16日消息，今日，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型。据了解，在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸超越了GPT-4o。同时...……更多

2025-01-16 14:56:00通义,阿里,推理,模型,尺寸,奖励

阿里多模态检索智能体，自带o1式思考过程！复杂问题逐步拆解

多模态检索增强生成（mRAG）也有o1思考推理那味儿了！阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch，它能模拟人类解决问题的思维方式，将复杂问题逐步拆解进行智能检索规划。随便上传一张图，...……更多

2024-12-05 09:45:00模态,拆解,阿里,检索,过程,智能

突破遥感基础模型关键技术！我国科研人员研发出遥感智能训推一体

...然而，遥感单幅影像幅宽大、基础模型参数规模大，导致推理速度与应用场景较为受限。近日，中国科学院空天信息创新研究院（空天院）科研团队基于自主研制的遥感智能解译基础模型，联合国内相关研发机构，共同研发出“...……更多

2023-10-27 11:57:00遥感,一体机,模型,科研,一体,突破

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...的任务对应套件，包含总结、感知（回忆、跟踪）、视觉推理（空间、时间、预测、因果、反事实）和导航（房间到房间、对象检索）任务，共18个子任务。其中，总结任务要求模型对视频中的关键事件、主要交互等进行概括性...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

腾讯推出新一代快思考模型混元 Turbo S，将在腾讯元宝逐

...用的多个公开Benchmark上，腾讯混元Turbo S在知识、数学、推理等多个领域展现出对标DeepSeek-V3、GPT-4o、Claude3.5等业界领先模型的效果表现。表格中，其他模型的评测指标来自官方评测结果，官方评测结果中不包含部分来自混元内...……更多

2025-02-27 19:52:00腾讯,灰度,元宝,新一代,模型,腾讯

鄂维南院士领衔新作：大模型不止有RAG、参数存储，还有第3种

...凡的性能而获得了前所未有的关注。然而， LLM 的训练和推理成本高昂，人们一直在尝试通过各种优化方法来降低成本。本文来自上海算法创新研究院、北京大学等机构的研究者受人类大脑记忆层次结构的启发，他们通过为 LLM ...……更多

2024-07-11 09:33:00维南,领衔,院士,新作,模型,存储

破解实时性与成本难题！白山云发布“大模型API”产品

...、算力成本的指数上升，更低延时、更优成本的边缘算力推理成为必需。边缘推理通过分布式算力下沉与智能调度，能够为高实时、高隐私、高性价比场景提供关键支撑，驱动AI从集中式智能迈向“云-边-端”全域协同智能。聚...……更多

2025-07-10 20:59:00白山,实时性,实时,难题,模型,成本

DeepSeek开源惠四方（科技名家笔谈）

...与OpenAI发布ChatGPT3.5相提并论。DeepSeek以高效率、低成本的推理模型和开源的商业模式走出一条发展人工智能的新路。坚持历史视角准确看待价值准确认识DeepSeek的价值和贡献，必须坚持历史视角，将其放在人工智能创新发展的...……更多

2025-02-24 05:52:00四方,名家,科技,人工智能,人工,智能

东大发布深度推理法律垂域大模型

实现从“知道”到“懂得”的性能飞跃东大发布深度推理法律垂域大模型南报网讯（记者何洁通讯员毕胜）近日，东南大学法学院数字法学团队依托东南大学大数据计算中心，正式发布国内高校首个深度推理法律垂域大模型—...……更多

2025-03-19 08:25:00东大,推理,深度,模型,法律,法律

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...-preview和o1-mini模型已经可以使用。OpenAI宣布，“新模型在推理能力上代表了人工智能能力的新水平，因此，计数器将重置为1”。根据OpenAI的自测，o1在竞赛编程问题（Codeforces）中排名第89个百分点，在美国数学奥林匹克竞赛（AIM...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...类型的信息：- 仅输入和输出文本，也就是少样本学习- 推理追踪：添加中间推理步骤，可参阅思维链（COT）提示- 计划和反思追踪：添加信息，教LLM计划和反思其解决问题的策略，可参阅ReACT 选择正确的适配方法要决定上述哪...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

百度智能云两大基础设施再升级！打造AI时代最开放的智能基础设

...统级能力打造企业专属AI基础设施。百舸+昆仑芯超节点：推理性能提升13倍、成本降低95%算力是AI时代的“新电力”。百度智能云通过自研昆仑芯P800芯片及百舸大规模推理加速能力，实现算力性能与成本的双重突破。本次大会...……更多

2025-04-25 16:27:00基础设施,设施,智能,基础,升级,开放

作业帮全系产品接入DeepSeek，与自研大模型实现深度整合

...智能硬件、智能图书、教育数字化等业务场景中正式接入推理大模型DeepSeek-R1，与自研作业帮大模型实现深度整合。后续，作业帮将进一步提升学习和推理模型的能力，适配不同的教育场景，为用户带来更优质的个性化学习体验...……更多

2025-02-13 19:48:00接入,深度,模型,作业,整合,产品

“技术故障”背刺巴菲特，金融大模型到底靠不靠谱？

...市场瞬息万变，需要实时数据处理和决策支持，大模型的推理涉及到大量的矩阵乘法计算，对硬件的矩阵乘法计算能力提出较高要求，计算复杂性可能导致响应时间延迟，不利于实时应用。加之大模型训练和推理过程需要大量的...……更多

2024-06-28 23:00:00巴菲,巴菲特,模型,故障,金融,技术

大模型“免费”送，厂商们图什么？

...，零一万物CEO李开复接受采访时表示：“未来整个行业的推理成本每年降低10倍是可以期待的，而且这个趋势是必然的。”未来，大模型的成本将呈阶梯状下探，但目前大模型的价格却断崖式下探，甚至部分企业免费送，降价幅...……更多

2024-06-05 10:57:00模型,厂商,模型,企业,成本,商业

算力概念股，集体爆发

...开AI产品的想象空间。英伟达在业绩交流会中指出，长时推理AI每任务所需的算力可能比单次推理高出100倍。上述券商表示，从DeepSeek到Manus，AI+工具在不断进化，AI+应用也会随之呈现增长态势，对于算力的需求有望持续增加。 ...……更多

2025-03-12 17:48:00概念股,集体,概念,模型,概念股,智能

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE

...万维宣布开源2千亿稀疏大模型Skywork-MoE，性能强劲，同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来，是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE大模型，也是首个支持用单台409...……更多

2024-06-03 20:59:00万维,昆仑,模型,模型,万维,昆仑