边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

最强AI程序员砸饭碗：84秒跑通代码像人一样思考

...最终Genie使用该专有数据进行训练。数据集中编码了人类推理的完整过程，包括完美的信息溯源、增量知识发现，还有基于软件工程师实际工作案例的逐步决策过程。Genie的推理过程包括规划、检索、代码编写和代码运行四个主...……更多

2024-08-13 14:46:00程序员,代码,程序,数据,模型,团队

最强大模型训练芯片H200发布！

...味着什么？来看测试数据。在HBM3e加持下，H200让Llama-70B推理性能几乎翻倍，运行GPT3-175B也能提高60%。对AI公司来说还有一个好消息：H200与H100完全兼容，意味着将H200添加到已有系统中不需要做任何调整。最强AI芯片只能当半年除...……更多

2023-11-14 20:51:00芯片,模型,训练,英伟,内存,节点

OpenAI正引爆一场全球AI安全热战，我们将如何应对？

...示，如果一些商业化公司对于安全问题不够重视、并毫无边界快速往前跑的话，可能会造成一系列安全危害，甚至可能对于整个全人类有一些安全风险和影响。早在聊天机器人ChatGPT发布之前，伊利亚便提到AGI对人类社会可能的...……更多

2024-06-24 09:18:00热战,安全,全球,安全,伊利亚,模型

LeCun最新万字演讲：纯语言模型到不了人类水平，我们基本已

...：完全是胡说八道。最新的公开演讲中，他表示，系统要推理、规划和理解物理世界，至少还需要几年甚至十年的时间，这时候人工智能才能达到人类水平。他还透露，现在Meta基本已经放弃纯语言模型，因为，仅通过文本训练...……更多

2024-10-18 09:42:00模型,人类,水平,语言,系统,模型

人工智能基础大模型“九天”广州发布

...计模型结构和参数配置，实现数据构建、预训练、微调、推理加速等全链路核心技术自主掌控。二是行业定向增强，训练数据规模超两万亿Tokens，融合通信、能源、钢铁、建筑、交通等8大行业专业知识，叠加专项训练和优化，...……更多

2023-10-12 21:49:00人工智能,广州,九天,人工,模型,智能

李开复：已进入“AI教AI”时代，AI通过慢思考具备了反思能

...而且目前看起来远没有触及天花板。与此同时，大模型的推理成本在以每年降低10倍的速度快速下降，这为AI-First应用爆发提供了非常重要的条件。”在技术层面，李开复认为，虽然预训练阶段的Scaling Law（缩放法则）的增长趋势...……更多

2025-03-31 22:50:00李开复,迭代,能力,时代,模型,李开复

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿

...。Intel还采用KV Caching、PagedAttention机制和张量并行，提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速，并获得出色的大模型推理性能，包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多

2024-07-18 14:57:00三条,通义,阿里,模型,参数,通义

Cerebras 推出全球最快AI推理解决方案，速度是英伟达

... 今日宣布推出 Cerebras Inference，官方称这是全球最快的 AI 推理解决方案。该新解决方案为 Llama 3.1 8B 提供每秒 1800 个 token，为 Llama 3.1 70B 提供每秒 450 个 token，速度是微软 Azure 等超大规模云中提供的基于英伟达……更多

2024-08-28 13:37:00英伟,方案,推理,解决方案,速度,全球

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

...据具体询问的内容，模型只会激活不同的专家子模块进行推理，在吞吐量一定的情况下，可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本，简而言之就是更好的使用体验和性价比。根据xAI公布...……更多

2024-08-13 09:50:00马斯,马斯克,测试版,路线,测试,模型

冯骥吹爆国产AI大模型DeepSeek:太强了 6到不真实!

...列出了AI大模型的六项关键突破方向：1、强大。比肩O1的推理能力，暂时没有之一2、便宜。参数少，训练开销与使用费用小了一个数量级3、开源。任何人均可自行下载与部署，提供论文详细说明训练步骤与窍门，甚至提供了可...……更多

2025-01-27 08:32:00太强,模型,国产,模型,网易,中国

搞医学影像，为什么都青睐于CPU？

...ACS/RIS产品中，就采用了基于CPU的方案运行三维可视化、AI推理等工作负载。在三维可视化加持下，融合影像分析等技术，让医务人员通过旋转、缩放、分割、图像增强等操作，从多角度清晰了解到医学影像中各结构之间的空间位...……更多

2024-06-02 15:41:00医学影像,影像,医学,英特,英特尔,三维

给机器人装上大模型大脑，「若愚科技」获超5000万天使轮融资

...准机器人大脑这一方向。大模型技术拓展了机器人的能力边界。孙腾告诉36氪，“传统机器人在使用AI技术之前，主要依赖视觉和感知技术来进行本体控制，如运动学和动力学控制。这些技术帮助机器人进行路径规划和远程控制...……更多

2024-03-21 05:19:00机器人,融资,大脑,模型,机器,天使

昇思MindSpore 2.3全新发布

...级实现脚本、分布式策略，运行时的统一，Baichuan2-13B的推理部署只需1天。在大模型推理上，通过LLMServing实现推理吞吐提升2倍多；升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。为降低开发门槛，昇思持续升级MindSpore...……更多

2024-03-24 17:47:00全新,模型,开发,中国,人工智能,框架

实测苹果M3 Ultra运行DeepSeek R1满血版：速

...着M3 Ultra在所有场景下都能超越A100，单用户进行单一模型推理时，主要依赖内存带宽和容量，无法完全发挥A100的潜力，在多用户推理和大模型训练场景下，M3 Ultra则完全无法与A100相提并论。此外，M3 Ultra在大语言模型推理速度测...……更多

2025-03-12 17:20:00实测,速度,苹果,运行,模型,速度

李彦宏：大模型场景下开源是最贵的，多模态是通往AGI的必经之

...练效率提升到了原来的5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理的成本降到了原来的1%。会上，百度发布了文心大模型4.0的工具版，该工具版可以让开发者体验代码解释器功能，开发者不仅可以通过自然语言...……更多

2024-04-16 17:57:00李彦,模态,之路,必经,模型,场景

宋亭亭等：DeepSeek或催化中高阶智驾加速渗透

...车端算力要求带来了革命性的降低。通过将云端大模型的推理能力高效迁移至车端轻量模型，DeepSeek有望在保持高性能的同时，显著降低计算开销，为VLA、世界模型等复杂模型在车端部署扫清算力障碍。这一技术有望助力高阶智...……更多

2025-02-12 11:10:00亭亭,高阶,催化,模型,数据,训练

全面开源浪潮信息发布千亿参数基础大模型“源2.0”

...51B（518亿）、2B（21亿）三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能力是大模型行业和应用落地能力表现的核心支撑。在算法、数据和算力等方面，“源2.0”提出了新的改进方法...……更多

2023-11-28 07:46:00浪潮信息,浪潮,模型,参数,基础,信息

全国高校首个！东南大学上线阿里QwQ-32B 消费级显卡可本

...wQ-32B虽仅有32B参数，但通过大规模强化学习训练，在数学推理（AIME24评测）、代码生成（LiveCodeBench）、工具调用（BFCL测试）等任务中表现媲美671B参数的DeepSeek-R1，甚至部分指标实现超越。在测试中，QwQ-32B表现远胜于o1-mini及相...……更多

2025-03-10 15:47:00东南大学,阿里,显卡,消费,全国,大学

浪潮创智人工智能平台在第二届山东省数字化转型创新应用大赛斩获

...构建、智能体应用编排、模型安全监管、云边端模型部署推理服务的原子能力一站式AIOps管理工具。经山东省行业协会认定，该平台在大规模数据标注、大模型训练与应用、边缘计算模型推理集群管理等方面进行了有效创新，达...……更多

2024-12-18 18:08:00创智,山东省,人工智能,山东,佳绩,浪潮

清华开源混合精度推理系统MixQ：大模型近无损量化并提升推理

一键部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理，可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多

2024-10-22 09:57:00推理,清华,吞吐,精度,混合,模型

PC迎来AI时刻，英特尔、微软、联想等纷纷布局，产品价格将迎

...算力是上一代的8倍，可在PC上实现高能效的AI加速和本地推理，并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步，上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU，算力为16TOPS，AI性能相比上一代提升...……更多

2023-12-12 16:27:00英特,英特尔,微软,布局,时刻,价格

2022生成模型进展有多快，新论文盘点9类生成模型代表作

...er模型取得了比扩散模型更好的结果，只有900M参数，但在推理时间上比StableDiffusion1.4版本快3倍，比Imagen-3B和Parti-3B快10倍。下图是Muse与DALL・E2和Imagen的生成效果对比：文本-3D模型生成主要代表作有Dreamfusion、Magic3D……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展