• 我的订阅
  • 头条热搜
中国移动山东青岛分公司持续加快推动数据算力与实体经济深度融合
...力保障,创新性引入RDMA技术,参数网络带宽达200GB,数据吞吐量达TB/s级,为大模型带来极致通信效率,最短训练时间。中国移动智算中心(青岛)依托移动云自研智算平台和国内顶尖算法调优队伍,可支撑超大规模、超高复杂...……更多
阿里最新开源推理模型发布:性能比肩DeepSeek-R1
阿里通义发布最新开源推理模型,称其性能比肩DeepSeek-R1。3月6日凌晨,阿里巴巴正式发布最新的开源推理模型通义千问QwQ-32B。据介绍,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩De...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
... OpenAI 在大语言模型领域的新尝试,也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看,相比以往的 GPT 模型,「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力,使其成为通用人...……更多
360智脑7b参数模型采用3.4万亿tokens训练
...AMBADA,考察的能力包括自然语言理解、知识、数学计算和推理、代码生成、逻辑推理等。其中360模型在四个评测数据集上达到第一,平均分为第三。在LongBench(多任务、中英双语、针对大语言模型长文本理解能力的评测基准)测...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\'24
...的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多
挑战Scaling Law,Meta发布移动端350M小模型MobileLLM,性能比肩7B LLaMA-v2
...做个假设,如果把GPT-4(大约有1万亿参数)以50tokens/s的推理速度部署在生活中,你需要什么样的硬件?答案是1亿个H100 GPU。别说是移动设备了,家里都放不下。那如果降低标准,用LLaMA-v2 7B这样的模型,再加上8-bit量化呢?简单...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
...考两种模式。对于需要深入思考的复杂问题,模型会逐步推理,经过深思熟虑后给出最终答案。对于速度有要求的简单问题,模型则提供快速、近乎即时的响应,让用户实现对模型思考程度的控制。阿里通义团队认为,这两种模...……更多
专精特新下半场:AI算力驱动竞争力升级|专精时氪直播回顾
...卡、多机互联就需要大流量的互联能力;第四,对于存储吞吐量的要求变得非常高。为了支撑上述变化,底层的基础设施也正在发生不小的改变。北京华恒盛世科技有限公司副总经理王文星指出,算力、调度和服务是AI基础设施...……更多
AI改变京东618:1.4万智能体上岗、1.7万数字人直播,超6亿消费者和百万商家受益
...,相比通用大模型,能大幅降低训练所需算力、提升推理吞吐量。基于JoyIndustrial的应用,可以实现99.3%的技术降本和32%的合规降本。长期以来,京东持续优化和创新“产品、价格、服务”,为消费者带来又好又便宜的商品、为商...……更多
...、避让、停靠等操作。 “作为智慧零碳码头,C段码头年吞吐量超200万标箱,相比同规模的传统自动化码头,集装箱倒运环节减少了50%,人员减少60%。”在数百米外的码头智控中心,天津港第二集装箱码头系统优化师范春奇向记...……更多
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
...开源模型系列,将“很快”放出基于最新模型Qwen2.5-Max的推理模型。2月21日,全球开发者大会(GDC)在上海开幕,在阿里云魔搭社区主办的论坛上,据阿里巴巴通义实验室科学家黄斐介绍,到目前为止,整个通义千问(Qwen)系列...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
春节假期济宁大安机场旅客吞吐29828人
...2024年2月17日),济宁大安机场安全保障航班229架次,旅客吞吐量29828人;旅客吞吐量同比2023年春节假期增长52.82%,完成了春节假期保障任务,为全年安全平稳运行开好局、起好步,实现了济宁民航2024年“开门红”。人气旺!加密...……更多
DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入,供用户按需部署
...eepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。截至2月5日,国内外已有众多云平台宣布上线DeepSeek- R1大模...……更多
...达1000AITOPS处理能力和128GB统一内存,实现无缝模型开发和推理先进架构:NVIDIA?GB10GraceBlackwell超级芯片配备BlackwellGPU、20核ArmCPU和NVLink-C2C?技术,可有效提升AI工作负载扩展互联:配置为独立或私有云系统,以在桌面上驱动AI……更多
首发!优刻得云平台上新DeepSeek-V3-0324模型
... 不仅将模型参数量由原版的671B提升至685B,编程、数学等推理思考能力大幅提升,性能表现可以与Claude3.5/3.7Sonnet相媲美。同时,模型的开源协议升级为更宽松的MIT许可,进一步降低了商业应用门槛。 优刻得云平台始终密切关注A...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
《永劫无间》手游首次将具有18亿参数的大语言模型引入终端侧
...可以大幅提升腾讯混元大模型在终端侧的运行效率,端侧推理实现首个token生成时延达到150ms,解码速率达到超过 30tokens/秒。腾讯混元大模型已为腾讯内部超过700个业务场景和C端应用提供底层技术支持,在骁龙8至尊版芯片上部...……更多
年少财富自由,拒绝过盖茨、马斯克、奥特曼,传奇程序员的AGI之路
...性,可以随上下文长度的增加线性扩展,具有5倍的推理吞吐量,基于该架构的语言模型表现超越了Transformer架构的模型。图源:Tri Dao X 账号最近,原作者带队的Mamba-2架构正式发布,在训练速度和任务执行方面都有了更大提升。...……更多
AMD发布最强AI芯片,对标英伟达Blackwell,2025年上市
...能、带宽和规模提高了两倍。AMD Pensando Salina DPU 支持 400G 吞吐量,可实现快速数据传输速率,是 AI 前端网络集群中的关键组件。AMD Pensando Pollara 400 搭载了 AMD P4 可编程引擎,是业界首款支持 UEC(Ultra Ethernet……更多
amd推出10亿参数语言模型系列amdolmo
...ens进行预训练,让模型在处理自然语言任务时具有强大的推理能力。IT之家援引新闻稿,OLMo模型采用解码器(decoder-only)架构,并通过下一个标记预测(next-tokenprediction)进行训练,这种架构在生成文本和理解上下文方面表现出...……更多
AI PC处理器“此芯P1”发布;李想疑在朋友圈回应车企抵制周销榜
...求,可运行100亿参数以内的端侧大模型,运行大语言模型吞吐量可达30tokens/s以上。其他方面,“此芯P1”最高支持64GB LPDDR5 6400Mbps内存、4K 120帧显示+最多10路外接显示;接口支持4 x USB-C、PCIe 4.0、AI加速卡、2 x GMAC等。此芯科技表……更多
成都人形机器人创新中心全国首发 R-DDIRM 高速推理模型
...现突破,于近日全国首发基于扩散架构的人形机器人高速推理模型 R-DDIRM(Denoising Diffusion Implicit Robot Model)。这是继今年 5 月推出中国首个基于扩散架构人形机器人任务生成式模型 R-DDPRM(Denoising Diffusion Proba……更多
...展的“头号工程、核心工作”。工程按照满足2030年旅客吞吐量8300万人次、货邮吞吐量100万吨,飞机起降59.5万架次的目标进行设计,机场工程总概算批复469.29亿元,占地11992.5亩。在数字、智能建造的加持下,“长安圣殿、丝路...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...含四个主要任务:信息抽取、信息定位、定性分析和数值推理。不同于现有的长文本基准测试,”企鹅卷轴”有以下几个优势:数据多样性:”企鹅卷轴”包含了各种真实场景下的长文本,如财务报告、法律文档、学术论文等,...……更多
ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类推理
...M) 是如何解数学题的?是通过模板记忆,还是真的学会了推理思维?模型的心算过程是怎样的?能学会怎样的推理技能?与人类相同,还是超越了人类?只学一种类型的数学题,是会对通用智能的发展产生帮助?LLM 为什么会犯...……更多
首个国产单池万卡液冷算力集群投入运营,满足万亿级大模型训练需求
...企业提供从算力供给、算力输送、算力调度到模型训练及推理应用的一站式服务。会上,八家合作伙伴宣布将作为首批用户入驻临港国产算力池,其中既有通用语言大模型公司百川智能、稀宇科技、思必驰科技、天壤智能,也有...……更多
轻量化模型架构catvton的优势在哪里
...分简洁高效:2个网络模块(VAE+UNet)899.06M总参数量<8G推理显存(输出图像1024×768)轻量化的架构来源于CatVTON对现有方法模块冗余的观察:基于Warping的方法依靠几何匹配对服装进行形变再利用试穿模块融合,结果生硬不自然;...……更多
谷歌发布gemma2大语言模型,共有两种大小
...亿参数(27B)两种大小。Gemma2大语言模型相比较第一代,推理性能更高、效率更高,并在安全性方面取得了重大进步。谷歌在新闻稿中表示,Gemma2-27B模型的性能媲美两倍规模的主流模型,而且只需要一片英伟达H100ensorCoreGPU或TPU...……更多
更多关于科技的资讯:
摘要:随着生成式人工智能技术在各行业的广泛应用,模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性,对输出不确定性进行量化分析成为重要方向
2025-12-04 06:17:00
杭州博士后用AI让机器懂协作、更安全杭州日报讯 让机器从执行命令的“孤岛”,成为懂得协作的群体?让机器人安全走进人类生活
2025-12-04 06:38:00
12月3日从紫林醋业获悉,紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification),获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)
2025-12-04 07:31:00
中新经纬12月3日电 12月3日,豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应,称不存在任何黑客行为。具体来看
2025-12-04 07:42:00
支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖
12月1日-3日,由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上,首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式
2025-12-04 07:47:00
近期,在“智绘星空胜算在天—太空数据中心建设工作推进会”上,北京拟在700—800公里晨昏轨道建设运营超GW(千兆瓦)级集中式大型数据中心系统
2025-12-03 09:42:00
太极韵动武汉,一场独属于银发爱好者的健康之约
承武当余韵,赴江城之约——小糖乐学以“传韵江城汇,小糖太极行”为引,再启太极文化与健康同行之旅。继武当山“问道太极”盛会圆满落幕
2025-12-03 13:40:00
杭州日报讯 产品还没走下生产线,就能在虚拟世界预知它未来十年会不会开裂、变形——这样的场景正在杭州成为现实。日前,工业科技企业浙江远算科技有限公司发布“AI质检数实融合验证平台”
2025-12-03 13:41:00
本报记者 陆春花 为进一步深化江苏与中东地区在“一带一路”倡议下的经贸合作,推动江苏制造高质量“走出去”、精准“引进来”
2025-12-03 13:41:00
曹操出行与越疆合作,人形机器人入驻行业首个“绿色智能通行岛”,推进具身智能在出行、物流领域的规模化应用
12月1日,曹操出行与越疆科技正式签署战略合作协议。双方将围绕Robotaxi(自动驾驶出租车)运营场景,共同探索机器人技术在车辆清洁
2025-12-03 13:41:00
江苏“领航工厂”引领“智造”变革
从“智慧车间”到“工业大脑”,“江苏智造”通过数据驱动全流程变革,赋能产业链协同升级 近日,全国首批15家领航级智能工厂名单发布
2025-12-03 13:41:00
国内首款AI助盲眼镜发布,基于通义千问打造
12月3日,杭州瞳行科技公司正式发布国内首款AI助盲眼镜。该眼镜基于通义千问Qwen-VL、OCR等系列模型打造,具有出行避障
2025-12-03 13:41:00
橙友“橙汁儿”向橙柿直通车反映:这几天收到了短信,是杭州市公共自行车公司发来的——“尊敬的用户,由于业务升级,您之前办理的绑卡租车功能即将在2025年12月底取消
2025-12-03 13:41:00
北京上班族李想称,健身私教课结束后,教练为索要好评,直接拿他手机代笔修改达3分钟。好评既影响消费者选择,也关联平台推流与服务者收益
2025-12-03 13:41:00
找“搭子” 聊技术 谈合作每日商报讯 一个多星期前,“魔搭社区”(杭州)开发者中心启用。这个中心是国内规模最大的模型开源社区“魔搭社区”的首个线下实体空间
2025-12-03 13:41:00