模型,微软,推理,框架,参数,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

西风发自凹非寺量子位 | 公众号 QbitAI谷歌开源模型Gemma 2开放了！虽然前段时间Google I/O大会上，Gemma 2开源的消息就已经被放出，但谷歌还留了个小惊喜——除27B模型外，还有一个更轻的9B版本。DeepMind创始人哈萨比斯表示，27B...……更多

2024-07-01 09:21:00二代,模型,开放,模型,性能,网友

本周硅谷发生了什么？｜OpenAI推出5项更新；微软组建新的

... 尚恩一周纵览本周硅谷大厂最值得关注的，是各家的大模型均有不少上新。OpenAI宣布了多项模型更新，同时发布了GPT-4 Turbo预览模型，提升了代码生成能力。Google发布文本生成视频模型Lumiere，生成视频在运动幅度和一致性表现...……更多

2024-01-29 09:34:00文生,硅谷,微软,模型,团队,更新

苹果AI登场，与OpenAI合作，Siri将采用GPT-4o

...是最早把AI引入到智能手机的，下一步我们将基于盘古大模型把‘小艺’打造为超级助手，融合5G-A、AI的能力，给用户提供体验更好的终端。”字节跳动计划在马来西亚投资21亿美元建区域人工智能中心：马来西亚贸易与工业部...……更多

2024-06-11 09:00:00情报局,独角兽,情报,芯片,进展,苹果

苹果大模型，不藏了

岁末年初，苹果加快了在大模型领域的步伐。上个月，苹果先是推出了名为Ferret的多模态大语言模型，图像处理技术堪称惊艳；而后又发布了一篇题为《闪存中的大型语言模型：在有限内存下高效的大型语言模型推理》的论文...……更多

2024-01-06 09:10:00模型,苹果,模型,苹果,数据,处理

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...武静静编辑｜邓咏仪放弃造车后的苹果，正在加速入局大模型战争。当地时间3月15日，苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称，苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...开的彻彻底底。这不，Meta一连放出三篇技术文章，从大模型适配方法出发，介绍了：如何使用特定领域数据微调LLM，如何确定微调适配自己的用例，以及如何管理良好训练数据集的经验法则。接下来，直接进入正题。适配大模...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

Hugging Face发布SmolVLM开源 AI 模型：

...日（11 月 26 日）发布博文，宣布推出 SmolVLM AI 视觉语言模型（VLM），仅有 20 亿参数，用于设备端推理，凭借其极低的内存占用在同类模型中脱颖而出。官方表示 SmolVLM AI 模型的优点在于体积小、速度快、内存高效，并且完全开...……更多

2024-11-28 09:47:00推理,模型,参数,模型,吞吐量,吞吐

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

... checkpoint、训练日志和训练数据都已经开源。尽管大语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...构成威胁，Arm 和台积电将获胜。”有网友说到苹果在大模型发展上的状况。也有网友认为，苹果在大模型上的发力将为其在未来的手机市场竞争中带来优势。他们认为，开源模型加上移动设备的本地数据，即本地化的原生 LLM，...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

国产GPU为底座，摩尔线程首个千卡智算中心落地

...2月19日，观察者网了解到，摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心揭幕仪式在北京举办，这宣告国内首个以国产全功能GPU为底座的大规模算力集群正式落地。与此同时，摩尔线程联合国内众多合作...……更多

2023-12-20 09:46:00摩尔,底座,线程,落地,国产,摩尔

OpenAI造芯计划曝光！拟自研AI芯片英伟达强敌来了

...最新AI趋势后，算力焦虑笼罩在各大AI厂商头上。无论是模型训练推理，还是API调用都需要算力作为支撑，有多少卡也成为衡量AI厂商实力如何的硬指标之一。而眼下的GPU市场，英伟达一家独大，市场份额超80%。与此同时，GPU不仅...……更多

2023-10-07 20:55:00英伟,强敌,芯片,芯片,微软,英伟

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...再次刷新端侧多模态天花板，面壁「小钢炮」 MiniCPM-V 2.6 模型重磅上新！仅8B参数，取得 20B 以下单图、多图、视频理解 3 SOTA 成绩，一举将端侧AI多模态能力拉升至全面对标超越 GPT-4V 水平。更有多项功能首次上「端」：小钢炮...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

微软论文一张截图，曝出GPT-3.5仅有200亿参数？AI圈

...乎「配得上」这个体量？GPT-3.5只有200亿参数？今天，大模型圈都被微软论文中的一纸截图刷爆了，究竟是怎么回事？就在前几天，微软发表了篇论文并挂在了arXiv上，该论文提出了一个参数量只有75M的小规模扩散模型——CodeFusio...……更多

2023-11-04 14:46:00微软,截图,参数,网友,论文,模型

中国电信开源星辰语义大模型，开放1t清洗数据集

1月12日消息，中国电信1月10日宣布开源星辰语义大模型TeleChat-7B版本，并开放1T清洗数据集。此外，中国电信还将在1月20日开源12B版本模型，拥抱更多开发者共建开源大模型生态。据介绍，星辰语义大模型是由中电信人工智能科...……更多

2024-01-14 09:52:00中国电信,语义,中国,星辰,清洗,模型

DeepSeek/o3的弱点找到了！三心二意明明对了又改错

DeepSeek和o1/o3一类推理大模型持续带来震撼之际，有人开始研究他们的弱点了。最新研究揭示：在遇到高难度问题时，推理大模型可能像“三心二意的学生”一样频繁切换解题思路，却因缺乏深入探索而失败——这种现象被研究...……更多

2025-02-04 19:41:00弱点,模型,推理,答案,思路,准确率

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地，运行成本就成为各厂商的现实考量。将模型做小，成为现实市场需求下的趋势。但模型的Scaling Law（规模定律）已指出，参数规模是决定模型性能的最关键因素。如何用更小的参...……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

o1突发内幕曝光？谷歌更早揭示原理大模型光有软件不存在护城

发布不到1周，OpenAI最强模型o1的护城河已经没有了。有人发现，谷歌DeepMind一篇发表在8月的论文，揭示原理和o1的工作方式几乎一致。o1突发内幕曝光？谷歌更早揭示原理，大模型光有软件不存在护城河这项研究表明，增加测试...……更多

2024-09-17 22:51:00护城,护城河,内幕,突发,模型,原理

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

华为harmonyosnext重塑全新“星盾”安全架构

...T、鸿蒙原生应用、AINative的华为云重塑千行万业、盘古大模型技术解密。这场科技盛宴不仅是对过往成就的总结，更是对未来创新生态的展望，标志着华为在鸿蒙操作系统领域迈出了崭新的一步。1鸿蒙生态：创新沃土厚植未来...……更多

2024-06-22 08:33:00华为,架构,全新,安全,华为,盘古

质量超越o1，UCSD张怡颖教授团队开源生成式AI工作流自动

...作流的形式构建和部署。AI 工作流内部可以调用各类 AI 模型、工具、数据源及其他类型的系统。典型的 AI 工作流包括 Agent 工作流和 LLM+RAG 等。与单次调用 AI 模型相比，AI 工作流提供了更强大、可定制和集成化的解决方案。当...……更多

2024-12-05 09:43:00张怡,工作流,生成,教授,团队,质量

大模型应用疯狂加速，洗牌却在静悄悄进行了

...场，正面临着这个关键的过渡。截至8月底，首批8家AI大模型企业通过备案。与上半年“甚嚣尘上”的行业境况不同，具备实力且具备满腔“产业抱负”的实力型玩家，总是姗姗来迟，但却总是能够一鸣惊人，为产业的大规模应...……更多

2023-10-07 15:24:00模型,疯狂,应用,模型,腾讯,能力

推理成本直降99%！百川智能「1+3」矩阵揭秘，两张4090

【新智元导读】大模型热，企业落地难？就在刚刚，百川智能推出「1+3」产品矩阵，一站式解决大模型商业化难题。「系列优质通用数据+领域增强训练工具链」，仅需10分钟就能让企业自主成为模型定制增强专家，实现行业最...……更多

2024-11-04 09:50:00百川,矩阵,旗舰,推理,模型,成本

如何让人工智能更节能

...迹来自云计算内部使用，但2022年谷歌称60%的能耗与语言模型有关。环境战略咨询公司iCare by BearingPoint高管利奥·热南认为：“AI企业应更透明，也应找出一些共同的新方法评估推理带来的影响。”目前，大学科研人员和企业在尝...……更多

2024-04-24 17:42:00人工智能,人工,节能,智能,研究,法国

清华提出CharacterGLM；DeepMind联创发全新

...技术优势：它支持智谱 AI、百川智能等国内领先的大语言模型，通过微调和优化提高模型的准确率和可读性，通过开放 API 接口支持个性化的数据应用搭建。（来源：“CSDN”微信公众号）《马斯克多次失手，OpenAI 异军突起，硅...……更多

2023-12-06 09:22:00联创,模型,清华,早报,一代,零售

李开复&张亚勤：未来的首富，将来自AI公司 | WISE20

...期两天的顶级商业对话，向现在提问，给未来答案。AI大模型，无疑是2023年最火热的风口。在其中，我们能看到大厂和创业者同台竞速。工信部等机构发布的报告显示，中国AI大模型专利申请总数已突破4万件；中信部的报告亦显...……更多

2023-11-28 22:29:00王大,李开复,张亚,首富,商业,公司

昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE

...转自：中国新闻网6月3日，昆仑万维宣布开源2千亿稀疏大模型Skywork-MoE，性能强劲，同时推理成本更低。Skywork-MoE基于之前昆仑万维开源的Skywork-13B模型中间checkpoint扩展而来，是首个完整将MoE Upcycling技术应用并落地的开源千亿MoE...……更多

2024-06-03 20:59:00万维,昆仑,模型,模型,万维,昆仑