边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大模型“翻车”小学题？

...相关性，使得AI在文字创作上达到人类平均水平，而数学推理更需要的是因果性，数学是高度抽象和逻辑驱动的，与语言模型处理的语言数据在本质上有所不同。这意味着大模型要学好数学，除了学习世界知识外，还应该有思维...……更多

2024-07-18 16:39:00模型,小学,模型,小数,记者,南都

RAG真能提升LLM推理能力？人大最新研究：数据有噪声，RA

...智元导读】RAG通过纳入外部文档可以辅助LLM进行更复杂的推理，降低问题求解所需的推理深度，但由于文档噪声的存在，其提升效果可能会受限。中国人民大学的研究表明，尽管RAG可以提升LLM的推理能力，但这种提升作用并不是...……更多

2024-10-23 13:34:00噪声,推理,性能,能力,数据,研究

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...类模型低 75%。端侧友好：量化后端侧内存仅占 6 GB；端侧推理速度高达 18 tokens/s，相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理；且支持多种语言。统一高清框架，高效能力一拖三：小钢炮的传统优势 OCR 能力延...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

打通大模型产业应用的最后一公里!联想首次全面深入解读全栈智能

...能计算等；在AI服务器领域，联想从训练到训推一体再到推理的AI全场景都有完善的AI服务器产品矩阵。在设备之上，联想研发了在构筑智算中心时的关键模块——异构智算平台。同时，联想与国内外领先的AI算力生态企业广泛合...……更多

2024-01-14 22:52:00布局,模型,战略,智能,产业,应用

文生图参数量升至240亿！Playground v3发布：深

...像描述性能。实验结果表明，PGv3在文本提示遵循、复杂推理和文本渲染准确率方面表现出色；用户偏好研究表明，PGv3模型在常见的设计应用中，如表情包（stickers）、海报和logo设计，具有超越人类的图形设计能力，还能够精确...……更多

2024-10-08 09:48:00文生,图形设计,深度,图形,人类,参数

中国电信进一步开源12B星辰大模型

...，内容、性能和应用等方面整体效果提升30%，其中，多轮推理、安全问题等领域提升超40%。在C-eval、MMLU、AGIEVAL等国际权威榜单上，排名处于国内同级别参数开源模型的前列，进一步促进大模型开源生态繁荣，助力AI产业加速高...……更多

2024-04-28 11:38:00进一,中国电信,中国,星辰,模型,电信

华尔街不买账英伟达GTC发布，黄仁勋讲不出新故事？｜氪金·大

...英伟达提上日程，是市场预期之内的事情。首先在训练向推理过渡的背景下，客户开始考虑降本增效，英伟达不得不做得更精细，其中就包括通过芯片上下游环节的革新，提升整体性能及效率。黄仁勋在大会现场表示，这一系统...……更多

2025-03-19 16:45:00华尔街,华尔,英伟,不买账,事件,故事

GPT-4o的识图能力有多牛？四大维度深度体验

...，准确率高达100%。图片来源：GPT-4o四、手写指令和逻辑推理最后，记者上了点难度，用手写的逻辑推理题来测试了GPT-4o的识图和逻辑推理能力。GPT-4o的回答堪称完美，不仅准确识别了手写体文字并遵照指示，且答题逻辑完全合...……更多

2024-05-19 14:21:00维度,深度,能力,体验,模型,训练

与ChatGPT“赛跑”！国产大模型170多天“赛”出“加速

...万元奖励”如今“联合特战队”半年内实现大模型训练和推理效率翻番这次科大讯飞全球1024开发者节，科大讯飞发布了与华为共同打造的“飞星一号”国产算力底座平台，平台也被市场视为足以对标英伟达A100的算力平台。“人...……更多

2023-10-31 16:50:00多天,加速度,赛跑,模型,国产,讯飞

OpenAI升级o3-mini模型思维链：提升AI推理过程透

...更新o3-mini-high的思维链，更透明、更详细地展示模型的“推理”步骤以及得出答案的方式。OpenAI在去年12月发布了推理模型o3，该系列包含两个模型，即o3和o3-mini，前者是高性能推理模型，后者是更小的精简版模型，在保持智能...……更多

2025-02-07 10:14:00透明度,推理,模型,思维,过程,升级

昆仑万维开源中国首个面向AI短剧创作的视频生成模型SkyRe

...围绕人物表演、开源视频生成模型中性能最强的。在自研推理优化框架「SkyReels-Infer」的加持下，大幅提升推理效率，实现544p分辨率，推理基于单台4090只需80s，还支持分布式多卡并行，支持Context Parallel，CFG Parallel，和 VAE Parallel...……更多

2025-02-18 11:13:00短剧,万维,昆仑,中国,格局,生成

月之暗面 Kimi 联合清华大学等开源大模型推理架构 Moo

...学 MADSys 实验室 2024 年 6 月联合发布了 Kimi 底层的 Mooncake 推理系统设计方案。该系统基于以 KVCache 为中心的 PD 分离和以存换算架构，提升了推理吞吐量。近日，为了进一步加速该技术框架的应用与推广，月之暗面 Kimi 和清华大...……更多

2024-11-29 09:22:00清华大学,清华,推理,架构,模型,联合

消息称OpenAI计划两周内发布新AI模型“草莓” 专注于推

...于之前的预期。根据之前的报道，“草莓”是一款专注于推理的AI产品，预计于今秋发布。但这两位测试过该模型的人士称，OpenAI计划在未来两周内发布“草莓”。当然，最终的日期也可能生变。需要指出的是，虽然“草莓”是C...……更多

2024-09-11 09:50:00推理,草莓,模型,消息,草莓,模型

科大讯飞申请口语评测专利，口语评测结果更准确

...对应的答题文本，结合答题文本和答题数据，通过配置的推理评分模型得到考生的推理评分；获取配置的定标模型，定标模型为基于定标考生的答题文本、定标考生的推理评分及专家评分预训练得到，定标考生为从参与本次口语...……更多

2025-05-10 10:28:00口语,评测结果,讯飞,评测,专利,结果

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...的任务对应套件，包含总结、感知（回忆、跟踪）、视觉推理（空间、时间、预测、因果、反事实）和导航（房间到房间、对象检索）任务，共18个子任务。其中，总结任务要求模型对视频中的关键事件、主要交互等进行概括性...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

o3 压台登场：OpenAI 卷动推理 AI 模型风云，迈向

...enAI 的 o3 系列大模型压台登场，官方称在某些场景下，其推理能力非常接近通用人工智能（AGI）。名称最新的 AI 模型为何跳过 o2，叫做 o3 呢？OpenAI 公司首席执行官山姆・阿尔特曼（Sam Altman）在今天早上的直播活动，表示是为...……更多

2024-12-21 09:17:00巅峰,推理,模型,风云,模型,测试

英伟达推出史上最强AI芯片H200：推理性能提升90%，无缘

...的H100的带宽和容量分别为3.35TB和80GB。这将提升大模型在推理方面的表现，并有助于提升高性能计算应用的计算能力。英伟达预计，H200将在明年二季度开始发货，谷歌、微软、甲骨文等科技巨头将会率先实现首批部署。但毫无疑...……更多

2023-11-14 14:05:00英伟,中国,推理,芯片,性能,市场

显卡可能没那么重要了中国公司给硅谷好好上了一课

...的更新主要是 3 个方面的优化，分别是通信和显存优化、推理专家的负载均衡以及FP8 混合精度训练。各个部分怎么实现的咱也就不多说了，总体来说，大的整体结构没啥变化，更多的像是咱们搞基建的那一套传统艺能，把工程...……更多

2025-01-03 06:44:00硅谷,中国,显卡,公司,模型,大厂

图结构转文本序列，大模型直接读懂！图推理性能大涨

...和属性，如节点计数、最大度数计算和图式形状分类等图推理任务都能完成。具体如何实现？机器学习工程师Rohan Paul发帖推荐论文并做了个总结。用多种技术开发了图线性化方法：图中心性（PageRank和度）、图退化（k-core分解）...……更多

2024-12-03 13:33:00序列,推理,模型,文本,性能,结构

系统级玩家微软、苹果先后出牌，端侧大模型路径清晰了？

...MGSM（跨语言数学能力）提升 2.3%，而DROP（文本段落分析推理）则下降了 3%。但与此同时，杀手级应用仍未出现。根据第三方网站SimilarWeb的监测数据，早在去年6月，ChatGPT流量即已见顶，当月其网站与移动客户端的全球流量（PV）...……更多

2024-06-21 09:16:00微软,路径,模型,先后,苹果,玩家

商汤又“夺金”！SuperCLUE-V多模态大模型基准发布1

...73.56的高分，并在数理逻辑维度取得第一，体现其强大的推理能力。 SenseChat-Vision5.5基础能力突出，数理逻辑维度超越GPT-4o本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型，聚焦多维度能力评估，包括基...……更多

2024-10-14 13:34:00商汤,模态,基准,模型,模型,能力

清华团队开源大模型推理引擎“赤兔Chitu”：硬件成本削减5

...授团队与清华系科创企业清程极智联合宣布，开源大模型推理引擎“赤兔Chitu”。这一突破性技术为国产AI芯片的广泛应用和生态建设带来了新的机遇。“赤兔Chitu”首次实现在非英伟达Hopper架构GPU及各类国产芯片上原生运行FP8精...……更多

2025-03-14 17:22:00清华,推理,模型,团队,成本,硬件

深圳：“深目”AI模盒发布 “深目2.0”生态联盟成立

...自主可控的国产工艺，内含国产RISC-V核，支持大模型训练推理部署。依托自研芯片DeepEdge10 Max创新的D2D chiplet架构打造的X5000推理卡，已适配并可承载10亿级SAM、百亿级Llama2等大模型运算，可广泛应用于AIoT边缘视频、移动机器人等...……更多

2024-03-29 23:02:00深圳,生态,联盟,模型,云天,算法

阿里AI三连发，连夺三项第一

7月25日，阿里巴巴全新开源千问3推理模型，性能大幅提升，一举夺下「全球最强开源模型」王座，比肩顶级闭源模型Gemini-2.5 pro、o4-mini。本周阿里已连续开源3款重磅模型，分别斩获基础模型、编程模型、推理模型等主流领域的...……更多

2025-07-25 21:34:00三连,阿里,模型,全球,阿里,推理

豆包大模型公布价格清单支持国内最高并发标准

...示豆包通用模型不同版本、不同规格的价格信息。在模型推理定价大幅低于行业价格的基础上，豆包通用模型的 TPM（每分钟Tokens）、RPM（每分钟请求数）均达到国内最高标准。以豆包主力模型 pro-32k 为例，价格比行业低99%，TPM...……更多

2024-05-21 11:57:00豆包,清单,模型,支持,标准,价格

利唐i人事：AI智能体员工驱动，实现HR管理效率新范式

...力资源的限制，实现更高效、更灵活地运作。基于DeepSeek推理模型的HR智能体员工，通过“全自主任务规划+企业级知识推理”，可精准地将复杂HR任务拆分为原子化操作，并借助API调用与数据自动执行，实现“输入需求－输出结...……更多

2025-03-14 11:45:00范式,效率,人事,员工,驱动,智能

openai正式推出完整版o1推理模型

...“shipmas”活动的首日(12月6日)，OpenAI正式推出了完整版o1推理模型。该模型是今年9月发布的有限预览版(代号“Strawberry”)的升级版。目前，完整版o1模型已向ChatGPTPlus和Teams用户开放，预计下周将扩展至Enterprise和Edu用户。OpenAI同.……更多

2024-12-08 02:42:00整版,推理,模型,模型,用户,整版