• 我的订阅
  • 头条热搜
最强AI程序员砸饭碗:84秒跑通代码 像人一样思考
...最终Genie使用该专有数据进行训练。数据集中编码了人类推理的完整过程,包括完美的信息溯源、增量知识发现,还有基于软件工程师实际工作案例的逐步决策过程。Genie的推理过程包括规划、检索、代码编写和代码运行四个主...……更多
最强大模型训练芯片H200发布!
...味着什么?来看测试数据。 在HBM3e加持下,H200让Llama-70B推理性能几乎翻倍,运行GPT3-175B也能提高60%。对AI公司来说还有一个好消息:H200与H100完全兼容,意味着将H200添加到已有系统中不需要做任何调整。最强AI芯片只能当半年除...……更多
OpenAI正引爆一场全球AI安全热战,我们将如何应对?
...示,如果一些商业化公司对于安全问题不够重视、并毫无边界快速往前跑的话,可能会造成一系列安全危害,甚至可能对于整个全人类有一些安全风险和影响。早在聊天机器人ChatGPT发布之前,伊利亚便提到AGI对人类社会可能的...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...:完全是胡说八道。最新的公开演讲中,他表示,系统要推理、规划和理解物理世界,至少还需要几年甚至十年的时间,这时候人工智能才能达到人类水平。他还透露,现在Meta基本已经放弃纯语言模型,因为,仅通过文本训练...……更多
人工智能基础大模型“九天”广州发布
...计模型结构和参数配置,实现数据构建、预训练、微调、推理加速等全链路核心技术自主掌控。二是行业定向增强,训练数据规模超两万亿Tokens,融合通信、能源、钢铁、建筑、交通等8大行业专业知识,叠加专项训练和优化,...……更多
李开复:已进入“AI教AI”时代,AI通过慢思考具备了反思能力,能自我迭代
...而且目前看起来远没有触及天花板。与此同时,大模型的推理成本在以每年降低10倍的速度快速下降,这为AI-First应用爆发提供了非常重要的条件。”在技术层面,李开复认为,虽然预训练阶段的Scaling Law(缩放法则)的增长趋势...……更多
Intel三条线优化阿里云通义千问2模型:720亿参数轻松拿捏
...。Intel还采用KV Caching、PagedAttention机制和张量并行,提高推理效率。Intel的硬件也可利用软件框架和工具包进行加速,并获得出色的大模型推理性能,包括PyTorch以及Intel PyTorch扩展包、OpenVINO工具包、DeepSpeed、Hugging F……更多
Cerebras 推出全球最快AI推理解决方案,速度是英伟达方案的20倍
... 今日宣布推出 Cerebras Inference,官方称这是全球最快的 AI 推理解决方案。该新解决方案为 Llama 3.1 8B 提供每秒 1800 个 token,为 Llama 3.1 70B 提供每秒 450 个 token,速度是微软 Azure 等超大规模云中提供的基于英伟达……更多
马斯克官宣Grok-2测试版!xAI将继续拥抱开源路线吗?
...据具体询问的内容,模型只会激活不同的专家子模块进行推理,在吞吐量一定的情况下,可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本,简而言之就是更好的使用体验和性价比。根据xAI公布...……更多
冯骥吹爆国产AI大模型DeepSeek:太强了 6到不真实!
...列出了AI大模型的六项关键突破方向:1、强大。比肩O1的推理能力,暂时没有之一2、便宜。参数少,训练开销与使用费用小了一个数量级3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可...……更多
搞医学影像,为什么都青睐于CPU?
...ACS/RIS产品中,就采用了基于CPU的方案运行三维可视化、AI推理等工作负载。在三维可视化加持下,融合影像分析等技术,让医务人员通过旋转、缩放、分割、图像增强等操作,从多角度清晰了解到医学影像中各结构之间的空间位...……更多
给机器人装上大模型大脑,「若愚科技」获超5000万天使轮融资|36氪首发
...准机器人大脑这一方向。大模型技术拓展了机器人的能力边界。孙腾告诉36氪,“传统机器人在使用AI技术之前,主要依赖视觉和感知技术来进行本体控制,如运动学和动力学控制。这些技术帮助机器人进行路径规划和远程控制...……更多
昇思MindSpore 2.3全新发布
...级实现脚本、分布式策略,运行时的统一,Baichuan2-13B的推理部署只需1天。在大模型推理上,通过LLMServing实现推理吞吐提升2倍多;升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。 为降低开发门槛,昇思持续升级MindSpore...……更多
实测苹果M3 Ultra运行DeepSeek R1满血版:速度超过8卡A100!
...着M3 Ultra在所有场景下都能超越A100,单用户进行单一模型推理时,主要依赖内存带宽和容量,无法完全发挥A100的潜力,在多用户推理和大模型训练场景下,M3 Ultra则完全无法与A100相提并论。此外,M3 Ultra在大语言模型推理速度测...……更多
李彦宏:大模型场景下开源是最贵的,多模态是通往AGI的必经之路
...练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。会上,百度发布了文心大模型4.0的工具版,该工具版可以让开发者体验代码解释器功能,开发者不仅可以通过自然语言...……更多
...车端算力要求带来了革命性的降低。通过将云端大模型的推理能力高效迁移至车端轻量模型,DeepSeek有望在保持高性能的同时,显著降低计算开销,为VLA、世界模型等复杂模型在车端部署扫清算力障碍。这一技术有望助力高阶智...……更多
全面开源 浪潮信息发布千亿参数基础大模型“源2.0”
...51B(518亿)、2B(21亿)三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能力是大模型行业和应用落地能力表现的核心支撑。在算法、数据和算力等方面,“源2.0”提出了新的改进方法...……更多
全国高校首个!东南大学上线阿里QwQ-32B 消费级显卡可本地部署
...wQ-32B虽仅有32B参数,但通过大规模强化学习训练,在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)等任务中表现媲美671B参数的DeepSeek-R1,甚至部分指标实现超越。在测试中,QwQ-32B表现远胜于o1-mini及相...……更多
浪潮创智人工智能平台在第二届山东省数字化转型创新应用大赛斩获佳绩
...构建、智能体应用编排、模型安全监管、云边端模型部署推理服务的原子能力一站式AIOps管理工具。经山东省行业协会认定,该平台在大规模数据标注、大模型训练与应用、边缘计算模型推理集群管理等方面进行了有效创新,达...……更多
清华开源混合精度推理系统MixQ:大模型近无损量化并提升推理吞吐
一键部署LLM混合精度推理,端到端吞吐比AWQ最大提升6倍!清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理,可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多
PC迎来AI时刻,英特尔、微软、联想等纷纷布局,产品价格将迎上涨
...算力是上一代的8倍,可在PC上实现高能效的AI加速和本地推理,并适配超过10款国产大模型。英特尔的老对手AMD则抢先一步,上周发布Ryzen 8040系列处理器。该处理器集成了升级的专用AI引擎NPU,算力为16TOPS,AI性能相比上一代提升...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...er模型取得了比扩散模型更好的结果,只有900M参数,但在推理时间上比StableDiffusion1.4版本快3倍,比Imagen-3B和Parti-3B快10倍。下图是Muse与DALL・E2和Imagen的生成效果对比:文本-3D模型生成主要代表作有Dreamfusion、Magic3D……更多
Sam Altman或筹数十亿美元自造AI芯片,DeepMind首席科学家或将辞职创业
...比的G42和软银集团。2.能力达到奥数金牌级,DeepMind几何推理模型登上Nature,这个叫AlphaGeometry的模型在国际数学奥林匹克(IMO)的30道几何题中做出了25道,这一成就标志着AI在数学领域推理能力的史诗级升级。3.DeepMind首席科学家...……更多
阿里云百炼上线Qwen2.5-Turbo模型,可支持100万超长上下文
... Qwen2.5-Turbo在长文本、短文本任务评测集上均表现优秀在推理速度方面,通义千问团队利用稀疏注意力机制将注意力部分的计算量压缩了约12.5倍,将处理1M tokens上下文时的首字返回时间从4.9分钟降低到68秒,实现了4.3倍的速度提...……更多
AI PC是噱头还是更快的马车?
...的马车”,而是颠覆了PC的使用模式,拓展了用户的能力边界。盘点已有的ISV与解决方案,我们可以将AIPC的应用总结为六大场景:·AlChatbot:针对特定行业和领域更加专业的问答。·AIPC助理:直接对PC操作,处理个人文件、照片...……更多
...阶段:训练和日常使用,后者用信息技术语言来说就是“推理”。萨莎·卢乔尼说道:“推理可能比训练带来的影响更大。一次使用可能并不需要很多计算,但时常更新就不一样了,例如人们熟知的谷歌翻译每天要更新数十亿次...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...经远超计算最优的时长。结果表明,这些较小模型在相同推理预算下的表现优于计算最优模型。在后训练阶段,Meta 使用了 405B 的旗舰模型进一步提高了 70B 和 8B 模型这些较小模型的质量。3、为了支持 405B 模型的大规模生产推理...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...复适配器进行微调,它们不会产生任何额外的内存使用或推理成本。关于适配器的大小,团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而,为了提供更多的灵活性,苹果提供了一套不同秩的精度恢复适...……更多
深夜登顶,全网刷屏!来自杭州的DeepSeek震惊硅谷
...上。”不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、...……更多
...以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。据了解,s1模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。李飞飞团队研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini 2.0 Fl...……更多
更多关于科技的资讯:
中国网12月16日讯 据网信中国微信公众号消息,党的二十届四中全会明确坚持扩大内需这个战略基点,强调要大力提振消费,要以新需求引领新供给
2025-12-16 16:06:00
近日,瑞众人寿唐山中支围绕客服节“拾光美好·瑞意相伴”核心主题,开展了2025年客服节健康生活系列活动。通过线上线下融合
2025-12-16 16:04:00
【宅男财经|专家面对面】人工智能全面融入人类的生活,还有多久能够实现?工业和信息化部电子科技委主任王江平12月16日接受宅男财经采访时表示
2025-12-16 16:52:00
《科学智能生态报告》于腾冲科学家论坛发布——我国科学智能生态培育取得6项进展
12月5日至8日,由云南省人民政府和中国科学技术协会共同主办的2025腾冲科学家论坛在腾冲举行。论坛期间上海财经大学数字经济研究院与新华网融媒体未来研究院在“未来之问”可持续发展
2025-12-16 15:20:00
6.5折、每日5张!第九届雪博会优惠力度拉满了
12月18日至22日,第九届吉林冰雪产业国际博览会将在长春东北亚国际博览中心盛大启幕,以“购物最低享6.5折+1亿元冰雪消费券+企业特惠”等多重福利组合拳
2025-12-16 16:06:00
借势“疯狂动物城”热潮,叮当快药携手百多邦开启家庭健康新“城”事
伴随动画电影《疯狂动物城2》11月26日起全球热映,叮当健康旗下专业送药平台叮当快药与皮肤健康专业品牌百多邦,开展了一场覆盖线上线下的深度跨界合作
2025-12-16 14:03:00
从濒临倒闭到业绩暴增!“沸点计划”成功模型引爆区域代理签约潮
“沸点计划”上海合生汇店以一组硬核数据印证了其商业模型的爆发力:单日营业额最高突破6万元,平均翻台率稳定在5轮,远超行业平均水平
2025-12-16 14:04:00
中国消费者报南宁讯(杨霞 记者顾艳伟)知识产权纠纷曾是不少“出海”企业面临的难题。12月12日,记者从广西壮族自治区桂林市市场监管局了解到
2025-12-16 11:07:00
河北沧州:一张操作指南卡破解企业信息填报难题
中国消费者报石家庄讯(谭鑫 记者李建)记者近日从河北省沧州市标准化所获悉,今年以来,该所紧扣行风建设,以“群众易懂、流程畅通
2025-12-16 11:07:00
江苏省消保委调查货运平台发现:价格不透明、信息掺水、服务保障差等乱象突出
中国消费者报报道(记者薛晶晶)随着网络货运市场规模持续扩容,相关平台已成为货主发货、司机找活的核心渠道,但其背后的乱象也让消费者苦不堪言
2025-12-16 11:07:00
中国消费者报报道(记者李燕京)12月8日,《疯狂动物城2》在中国内地的票房突破30亿元。数据显示,截至11月30日,2025年度国产片票房已达403
2025-12-16 11:07:00
中国消费者报报道(记者桑雪骐)中央经济工作会议12月10日至11日在北京举行。在部署明年重点任务时,会议提到了“优化‘两新’政策实施”
2025-12-16 11:07:00
海尔集团与歌尔集团达成战略合作,新时达将助力歌尔深化智能制造领域布局
12月11日,海尔集团与歌尔集团正式签署战略合作协议,双方将聚焦智能家电、工业互联网、新能源及人工智能等领域展开深度合作
2025-12-16 11:33:00
于琛刚刚过去的这个“双十二”,除了各电商平台推出的促销活动,抖音出台严打“假揭黑真带货”等违规行为的多项举措,也成为人们热议的话题
2025-12-16 11:02:00
近日,全国首家“现代骑手学院”正式揭牌,该学院设在广州职业技术大学,为在职外卖骑手和快递员提供学历和技能“双提升”通道
2025-12-16 08:07:00