模型,国产,模型,推理,能力,数学头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...美国时间12月6日早间，谷歌发布了外界期待许久的大语言模型Gemini，在发布会现场，谷歌将Gemini的多项能力直接与OpenAI的GPT-4进行对比，雄心勃勃地宣布进入“Gemini时代”，更加剧了两大头部科技公司在大语言模型领域竞争的白...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

景顺长城基金张雪薇：AI仍是比较确定的长期主线

...经济网中国经济网北京5月22日讯近期，OpenAI发布全新大模型GPT-4o，再度引发市场对于AI的关注。对此，景顺长城基金股票投资部基金经理张雪薇分析了GPT-4o对于AI行业的发展意义，并指出，AI目前看仍是比较确定的长期主线。投...……更多

2024-05-22 16:23:00张雪,长城,主线,基金,模型,张雪

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...数据，推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中，用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4回答趣味推理问题。4月23日，在2024商汤技术交流...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...新闻网2023年4月17日，昆仑万维发布自研双千亿级大语言模型“天工1.0”。即将到来的2024年4月17日，在“天工”大模型一周年之际，昆仑万维重磅宣布，“天工3.0”正式开启公测！“天工3.0”采用4千亿级参数MoE混合专家模型，并...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

微软推出14b参数“最先进”小型语言模型

...13日消息，微软今天宣布推出14B参数“最先进”小型语言模型（SLM）Phi-4，除了传统的语言处理外，它还擅长数学等领域的复杂推理。Phi-4是Phi系列小型语言模型的最新成员，官方表示其展示了微软继续探索SLM边界的可能性。官方...……更多

2024-12-14 00:08:00微软,最先,模型,参数,语言,模型

中国首个音乐SOTA模型「天工音乐大模型」今日公测

2024年4月17日，在「天工」大模型一周年之际，昆仑万维重磅宣布，「天工3.0」基座大模型与「天工SkyMusic」音乐大模型正式开启公测！一年前的今天，第一版天工大模型正式对外发布上线，一年来我们不断迭代模型，迭代应用...……更多

2024-04-17 15:31:00天工,公测,模型,音乐,中国,天工

o1带火的CoT到底行不行？新论文引发了论战

...任务，至于其它任务，CoT 的效果并不显著甚至可能有损模型性能。另一个发现是 CoT 能帮助提升执行计算和符号操作的执行步骤，但却比不上能使用外部工具的 LLM。这是什么意思呢？该团队发现，相比于使用直接回答方法，使...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据

Anthropic再反击！发布Claude 3.5吊打GPT

...吗？” 从官方介绍来看，Claude 3.5全家桶仍会有3款系列模型，分别是“大杯”Claude 3.5 Opus、“中杯”Claude 3.5 Sonnet、及“小杯”Claude 3.5 Haiku。先问世的“中杯”就这么强，后面的系列模型确实值得期待。官方表示，Claude 3.5 O……更多

2024-06-21 11:50:00逻辑推理,推理,逻辑,视觉,方面,模型

补齐Transformer规划短板又不放弃快速思考，Dual

一个 token 就能控制模型快些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

机器之心报道机器之心编辑部方向完全搞错了？大语言模型（LLM）为什么空间智能不足，GPT-4 为什么用语言以外的数据训练，就能变得更聪明？现在这些问题有「标准答案」了。近日，一篇麻省理工学院（MIT）等机构发表在顶...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

清华提出CharacterGLM；DeepMind联创发全新

...技术优势：它支持智谱 AI、百川智能等国内领先的大语言模型，通过微调和优化提高模型的准确率和可读性，通过开放 API 接口支持个性化的数据应用搭建。（来源：“CSDN”微信公众号）《马斯克多次失手，OpenAI 异军突起，硅...……更多

2023-12-06 09:22:00联创,模型,清华,早报,一代,零售

奥特曼晒“草莓”引热议神秘新模型现身竞技场网友第一波实测

OpenAI神秘新模型，真的藏不住了！先是有匿名聊天机器人现身lmsys竞技场，声称自己是GPT-4系列模型一部分，吊足了大家的胃口。随后奥特曼又发了一个浮想联翩的推文，正是他花园里的草莓照片，并配文：i love summer in the garden...……更多

2024-08-08 15:11:00奥特,奥特曼,一波,实测,竞技场,草莓

三大股指高开，人工智能AIETF涨超2%，三六零领涨超5%

...涨超8%。消息面上，近期商汤发布“日日新SenseNova5.0”大模型，该模型在多个客观评测指标上达到或超越了GPT-4Turbo。日日新5.0在知识、数学、推理及代码能力上显著提升，多模态能力达到全球领先水平；科大讯飞星火V3.5春季上...……更多

2024-05-06 17:58:00人工智能,人工,三大,智能,人工智能,人工

优刻得首个「国产千卡智算集群」落地，支持智源千亿大模型训练

...算集群规模，才能一路突破围追堵截，进一步促进国产大模型产业生态繁荣。作为中立、安全的云计算服务厂商，优刻得持续发力人工智能智算领域，与国内主流AI芯片厂商深度合作，共同搭建的「国产千卡智算集群」现已上线...……更多

2024-06-27 19:01:00集群,落地,模型,国产,训练,支持

这才是真开源模型！公开后训练一切，性能超越Llama 3.1

开源模型阵营又迎来一员猛将：Tülu 3。它来自艾伦人工智能研究所（Ai2），目前包含 8B 和 70B 两个版本（未来还会有 405B 版本），并且其性能超过了 Llama 3.1 Instruct 的相应版本！长达 73 的技术报告详细介绍了后训练的细节。在...……更多

2024-11-26 09:44:00模型,性能,训练,模型,训练,数据

国产大模型第一梯队玩家，为什么pick了CPU？

AI一天，人间一年。现在不论是大模型本身，亦或是AI应用的更新速度简直令人直呼跟不上——Sora、Suno、Udio、Luma……重磅应用一个接一个问世。也正如来自InfoQ的调查数据显示的那般，虽然AIGC目前还处于起步阶段，但市场规模...……更多

2024-07-10 20:45:00梯队,模型,国产,玩家,模型,英特

美股异动丨金山云一度涨超13% 小米首个推理大模型MiMo开

...消息面上，今天，小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”，联动预训练到后训练，全面提升推理能力。在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理...……更多

2025-04-30 23:41:00金山,异动,小米,推理,模型,金山

“重创”美科技股后，DeepSeek除夕再发新模型，文生图测

刚刚暴击完美股，国产大模型公司深度求索（DeepSeek）又抛出新模型。1月28日，DeepSeek发布开源多模态模型Janus-Pro，其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable D……更多

2025-01-28 09:10:00文生,科技股,模型,测试,科技,模型

智谱AI推出第三代基座大模型可在手机上部署

...系技术成果转化企业智谱AI推出了全自研的第三代基座大模型ChatGLM3，继此前推出千亿基座的对话模型ChatGLM和ChatGLM2之后再次实现突破。评测显示，在44个中英文公开数据集测试中，ChatGLM3在国内同尺寸模型中排名首位。ChatGLM3语...……更多

2023-10-28 08:25:00三代,基座,可在,模型,手机,模型

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

OpenAI-o1替代品来了，大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务，一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究，被网友们齐刷刷码住了。论文...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

云天励飞发布14nm Chiplet大模型推理芯片

...总经理陈宁介绍，DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片，采用自主可控的国产工艺，内含国产RISC-V核，支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡，已适配并可承载SAM CV大模型...……更多

2023-11-16 18:36:00云天,推理,芯片,模型,芯片,云天

“国产大模型第一股”冲刺IPO 杭州资本提前布局

...上市辅导备案，由中金公司担任辅导机构。作为国内“大模型六小虎”中首家启动IPO的企业，智谱AI计划于2025年10月完成辅导，最快2026年登陆A股。你需要知道的国产大模型“六小虎”智谱AI成立于2019年，是中国最早研究大模型...……更多

2025-04-20 08:29:00杭州,布局,模型,资本,国产,模型

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

AI发展变慢了？几位AI头部创业者并不赞同

...AI发展速度非常快。从数量角度看，现在每个月都有新的模型、新的产品、新的应用涌现出来。从质量角度看，OpenAI（美国头部AI公司）今年2月份发布的Sora（视频大模型），5月份发布的GPT-4o（多模态语言大模型），9月份发布的o...……更多

2024-09-21 13:52:00创业者,头部,创业,发展,模型,大昕

腾讯推出新一代大模型“混元Turbo”，性能大幅提升，定价低

9月5日，腾讯宣布推出新一代大模型“混元Turbo”，相比前代模型，腾讯混元Turbo性能有显著提升，训练效率提升108%，推理效率提升100%，推理成本降低50%，解码速度提升20%，效果在多个基准测试上对标GPT-4o，第三方测评居国内第...……更多

2024-09-05 17:29:00腾讯,新一代,模型,定价,性能,腾讯

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地，运行成本就成为各厂商的现实考量。将模型做小，成为现实市场需求下的趋势。但模型的Scaling Law（规模定律）已指出，参数规模是决定模型性能的最关键因素。如何用更小的参...……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

小米开源首个推理大模型Xiaomi MiMo：7B参数就超越

...官方今天正式宣布，开源首个为推理（Reasoning）而生的大模型——Xiaomi MiMo。据介绍，Xiaomi MiMo在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭源推理模型o1-mini和……更多

2025-04-30 10:36:00小米,推理,模型,参数,训练,推理

OpenAI迄今最大、最贵模型！GPT-4.5正式发布

...28日消息，今天凌晨OpenAI举行直播活动，正式发布最新大模型GPT-4.5，将分阶段向付费用户开放。ChatGPT Pro用户今天开始就能在网页版、手机版和桌面版使用GPT-4.5了，下周将向Plus和Team用户开放，再下周向企业和Edu用户开放。GPT-4.5...……更多

2025-02-28 07:37:00模型,模型,用户,推理,能力,开放

专家模型不要专家并行！微软开源MoE新路径

...日，来自微软的研究人员开源了使用全新方法训练的MoE大模型，不走寻常路，且编码和数学表现出色。继Phi家族之后，微软又开源了新的混合专家大模型——GRIN MoE。与Phi-3.5同样的个头（16 * 3.8B），却采用了截然不同的训练方法...……更多

2024-11-12 09:57:00专家,微软,路径,模型,模型,专家

面壁智能发布开源大模型eurux-8x22b

5月3日消息，面壁智能发布开源大模型Eurux-8x22B，包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO，主打推理能力。官方测试中，Eurux-8x22B 在 LeetCode（180道LeetCode编程真题）与 TheoremQA（IT之家注：美国大学水准的STEM……更多

2024-05-04 08:57:00模型,智能,测试,数据,模型,推理