• 我的订阅
  • 头条热搜
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...比,苹果已用Amazon Graviton、Inferentia等AWS芯片在机器学习推理工作负载方面实现了40%以上的效率提升,并预计在Trainium 2上预训练模型时,效率将提高50%。被亚马逊豪掷80亿美元投资的Anthropic,宣布与AWS共同构建面向机器学习训练...……更多
中国银河证券:Sora将推动推理端算力占比将大幅提升
...。目前OpenAI已加入算力芯片军备竞赛中,根据OpenAI论文,推理阶段算力需求是模型参数数量与训练数据集规模乘积的2倍,Sora将推动推理端算力占比将大幅提升。此外,通信端等配套实施需要全方位升级,网络上行下载速度需大...……更多
大模型“免费”送,厂商们图什么?
...,零一万物CEO李开复接受采访时表示:“未来整个行业的推理成本每年降低10倍是可以期待的,而且这个趋势是必然的。”未来,大模型的成本将呈阶梯状下探,但目前大模型的价格却断崖式下探,甚至部分企业免费送,降价幅...……更多
推理成本直降99%!百川智能「1+3」矩阵揭秘,两张4090玩转旗舰新模型
...」。模型升级:Baichuan4-Turbo两张4090即可部署,Baichuan4-Air推理成本下降99%接下来,如何将Baichuan4-Turbo、Baichuan4-Air应用在实际场景中?从名字中不难看出,它们都是Baichuan 4系列基础模型的升级。对于企业来说,在不同场景阶段……更多
为AI加速而生 英特尔第五代至强CPU带来AI新表现
...来概括它的特点,那就是——AI味道越发得浓厚。以训练、推理大模型为例:• 与第四代相比,训练性能提升多达29%,推理性能提升高达42%;• 与第三代相比,AI训练和推理性能提升高达14倍。什么概念?现在若是将不超过200亿参数的模型...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...我进化的方式,解决代码模型在处理复杂问题时缺少中间推理过程。核心观点:自我进化的力量跟随上述自我进化的思想,在 SRA-MCTS(Self-guided MCTS-based data generation for Reasoning Augmentation)方法中,作者无需借助额外的任何监……更多
大模型这把大火,烧到了手机领域
...手机圈的大模型大战已经开始了。资料显示,今年8月,小米宣布其已经成功自研了一个13亿参数的端侧模型,并且在手机端实现了运行。同时公布其自研的大规模预训练语言模型MiLM-6B,参数规模达到了64亿,在权威中文评测榜单...……更多
算力直降97%,GPT-3存储只用20MB?!这篇新论文火了
...开始,作者提到前人研究已经表明,大语言模型(LLM)的推理可以在1.58-bit精度下进行,且不会有任何性能损失。比如下面这篇论文,有人引入了1-bit的LLM变体(即BitNet b1.58),其中LLM的每个参数或权重都是三元的{-1, 0, 1}。它在...……更多
位列第一梯队,腾讯混元再度领跑国内大模型
...维度的综合性测评基准,由十大基础任务组成,包括逻辑推理、代码、语言理解、长文本、角色扮演等。本次报告选取了国内外具有代表性的32个大模型4月份的版本,通过多维度综合性测评,真实准确地反映了国内外大模型在中...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...技等也分别推出全新的大模型产品。李开复表示,大模型推理成本的下降会推动中国AI大模型进入”落地为王”的阶段,今年会迎来“大模型应用爆发元年”。他同时预测,明年下半年,随着大模型推理成本的大幅度下降,人们...……更多
「学术版ChatGPT」登场!Ai2打造科研效率神器OpenScholar,让LLM帮你搞定文献综述
...78%~90%。 检索增强(retrieval-augmented)的语言模型可以在推理时检索并集成外部知识源,从而缓解上述问题。然而,许多此类系统依赖于黑盒API或通用的LLM ,既没有针对文献综合的任务进行优化,也没有搭配适合科研的开放式...……更多
京东云:智能体大规模“上岗”,企业深度应用正当时
...模型一体机软硬协同,支持千人规模企业并发需求,实现推理速度提升50%,满血版、标准版、轻量版为不同规模企业提供灵活选择,助力企业快速构建企业级AI服务能力,极大降低专业技术门槛。今天,京东云正式发布三大垂直...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
...l Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后,Mistral Large 2 的发布让开源大模型的赛道一下子热闹起来,而这一模型的特点是 ——「足够大...……更多
重磅!OpenAI o1模型还没有实现真正的逻辑推理能力
...-preview和o1-mini模型已经可以使用。OpenAI宣布,“新模型在推理能力上代表了人工智能能力的新水平,因此,计数器将重置为1”。根据OpenAI的自测,o1在竞赛编程问题(Codeforces)中排名第89个百分点,在美国数学奥林匹克竞赛(AIM...……更多
Meta发布开源大模型Llama 4:首次采用“混合专家”架构
...ma 4的推出将让AI智能体变得更强大,使其具备更高水平的推理和行动能力。据知情人士透露,Llama 3已经推出一年了,而Llama4之所以迟迟未能发布,是因为在开发过程中,该模型在技术基准上没有达到Meta的预期,尤其是在推理和...……更多
真香!智谱大模型,有了首个免费的API
...同时,GLM-4 支持了更长的上下文、更强的多模态、更快的推理速度,以及更多并发请求,大大降低了推理成本。在此基础上发展出的 GLM-4-Flash,则带来了一系列技术优势:数据预训练:引入大语言模型进入数据筛选流程,使用 10...……更多
芯片战场丨瞄准大模型 摩尔线程首个千卡智算中心落地
...模型智算加速卡MTT S4000,以及专为千亿参数大模型训练和推理提供支持的摩尔线程KUAE平台。近年在AI热潮之下,国内的智算中心不断兴建。根据此前国家信息中心联合浪潮信息发布的《智能计算中心创新发展指南》统计,目前全...……更多
...的飞跃,就无法进入家庭领域,而Helix模型能像人类一样推理。据Figure AI介绍,Helix不仅实现了对整个机器人的上半身,包括手腕、躯干、头部和单个手指输出高速率连续控制,也可以在两台机器人上同时运行,使它们能够解决...……更多
权威AI开源标准1.0版发布:Llama也不算开源
...、验证和测试、支持库(如分词器和超参数搜索代码)、推理代码和模型架构。 参数:模型参数,例如权重或其他配置。参数应根据 OSI 批准条款提供。 例如,训练中间阶段的检查点以及优化器状态。对于机器学习系统,模型...……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练,再基于特定策略丢掉部分轨迹,Dualformer模型可以在模仿慢思考的同时,像快思考一样走捷径。由此能形成更简洁的思维链(CoT)。从结...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...小尺寸版o1-mini。OpenAI官方发文称,新模型旨在解决复杂推理问题,训练模型在响应之前花更多时间思考,类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称,该模型可以解决科学、编程和数学等更...……更多
大模型价格战“卷”向何方?|深度
...千亿参数MoE架构模型。MoE架构中基于多个专家并行机制,推理时只激活部分专家,以稀疏性压缩了参数数量和推理成本。“这就可以极大地节省算力耗费”。而率先掀起价格战的幻方DeepSeek-V2,就是其通过架构创新,实现了大模...……更多
很强也很贵!OpenAI12天12场直播收官,官宣最新推理模型o3
...,和网友猜测的一样,人工智能(AI)巨头OpenAI发布最新推理模型o3和o3-mini。前一天,OpenAI公司CEO山姆·奥特曼(Sam Altman)就曾发文提到三个“o”暗示了o3的到来。为何新模型跳过了o2直接命名o3?奥特曼表示是为了避免和英国电...……更多
人类和AI在推理任务中的表现相似,Google DeepMind研究揭示AI局限性
...人工智能(AI),特别是大型Transformer语言模型(LMs)在推理任务中的表现及其局限性。研究结果显示,尽管这些模型在处理自然语言方面表现卓越,但在复杂逻辑推理任务中,人类和语言模型都会受到语义内容合理性和可信度...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务,每个级别都有其独特的难点和解决方案,需要不同的技术和方法来优化性能。受参数量和知识更新的限制,大模型在执行很多真实场景下的任务时,都需要连接...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...,从跨模态预训练、到下游任务的微调都可以完成。而在推理端,他们为该领域量身定制地打造了生物与AI融合的计算引擎。这个值得说道说道。因为在我们日常大模型语境中,可能只需要针对AI模型本身进行推理优化,就能在...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
手机上能跑的「GPT-4V」来啦!多图、视频理解首次上端!面壁小钢炮开源史上最强端侧多模态
...类模型低 75%。端侧友好:量化后端侧内存仅占 6 GB;端侧推理速度高达 18 tokens/s,相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理;且支持多种语言。统一高清框架,高效能力一拖三:小钢炮的传统优势 OCR 能力延...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比...……更多
更多关于科技的资讯:
丰台怡海中学无人驾驶实训教学项目落地
11月28日,AI驭见未来——怡海教育&加州伯克利大学机器人自动驾驶大赛ROAR实训基地揭牌仪式在北京市丰台区怡海中学(北校区)举行
2025-12-02 12:04:00
●杨炯上周末,在珠海的亚洲通航展上,奥捷龙航空科技有限公司格外引人注目。虽然已多次到珠海参展,但这次它“来自厦门”。这一全球市场份额第一的德国旋翼机品牌
2025-12-02 08:18:00
博物馆进入“沉浸时代”,感官残障观众如何“入场”
视障文化博物馆“触摸文明”展厅。中青报·中青网记者 李怡蒙/摄如今,许多博物馆将视觉、听觉、触觉等多种感知方式融合,创造出多层次
2025-12-02 05:43:00
烟台联通举办客服人员心理健康专题讲座
胶东在线12月1日讯为加强对一线客服员工的人文关怀,帮助员工有效应对工作压力,提升情绪管理与自我调适能力,11月26日
2025-12-02 06:42:00
摘要:本文分析现代物流网络布局与供应链弹性提升的内在关联,探讨节点布局合理性、线路连接多样性、资源整合协同性对供应链冗余能力
2025-12-02 07:09:00
摘要:本文聚焦管理会计在企业战略决策中的应用,首先解析其与战略决策的内在关联,即通过整合财务与非财务信息,为战略制定提供系统性支持
2025-12-02 07:10:00
中国网12月2日讯 据国家安全部官微消息,国家安全部提示,SDK(软件开发工具包)是一套为特定软件框架、硬件平台或操作系统提供的开发工具集合
2025-12-02 07:26:00
全球首创全动压空气轴承产业化成果发布,开启高端制造新纪元
北京讯—— 2025年11月28日,“全球首创全动压空气轴承产业化成果发布会”在北京首钢园香格里拉酒店圆满落幕。此次盛会标志着我国在超精密制造领域取得了重大突破
2025-12-02 07:32:00
联通超清电视狂欢双十一,临沂IPTV用户喜获iPhone17豪礼
鲁网12月1日讯一年一度的双十一购物狂欢盛宴圆满收官,在这场全民消费热潮中,山东联通精心策划的“双十一福利再升级”活动脱颖而出
2025-12-01 11:12:00
千里运荔藏巧思 现代加盟终端拓新局
“就算失败,我也想知道,自己倒在距离终点多远的地方。”电视剧《长安的荔枝》中这句掷地有声的台词,精准道出了当下创业者选择加盟之路时的执着与忐忑
2025-12-01 12:23:00
赛事总奖金160万元!WCI国际冠军赛苏州完美收官
2025年坦克世界国际冠军赛(WCI)11月30日在苏州阳澄国际电竞馆落下帷幕。来自中国、欧洲、北美和亚太地区的八支顶尖战队经过激烈角逐
2025-12-01 13:58:00
2025年北京市中小学生电子与信息创意实践活动圆满举行
当AI小球听懂指令,当智能车驰骋赛场,当电路在指尖点亮创意……孩子们像科学家一样思考,像工程师一样实践。11月30日,2025年北京市中小学生电子与信息创意实践活动在北京市第十四中学(畿辅校区)火热开幕
2025-12-01 14:26:00
烟台联通创新应用高压直流供电技术 破解高铁5G基站供电瓶颈
胶东在线12月1日讯在青烟威荣高铁5G覆盖扩容工程建设中,烟台联通成功应用高压直流供电技术创新方案,有效解决了牟平北山隧道西口
2025-12-02 05:00:00
海尔智慧家庭成立创新实验室布局好房子住居生态
海尔智慧家庭战略持续强化、开放和加速布局,又交出新成果。11 月 28日,以“AI 新纪元 共筑智慧家”为主题的海尔智慧家庭生态创新研讨会在北京召开
2025-12-01 14:51:00
海尔智慧家庭新成果:2025物联网大会斩获两项大奖
海尔智慧家庭持续强化、开放并加速智慧居住领域战略布局,如今再添重磅新成果。11 月 29 日,在首届全球万物智联数字经济可持续发展大会暨2025(第十届)世界物联网大会上
2025-12-01 14:51:00