• 我的订阅
  • 头条热搜
国内首个!百度文心大模型X1 Turbo斩获信通院最高评级证书
...息,在5月20日的百度AI Day 上,中国信通院公布了大模型推理能力评估结果。百度文心大模型X1 Turbo在24项能力评估中,16项达5分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。其中,文心X1 Turbo在逻辑推理...……更多
实测车载DeepSeek:做北京旅游攻略 避开喝豆汁儿那种
接入DeepSeek后,理想又为车机自研了一个推理模型:它能帮你编故事哄孩子,提供买房建议,还能制定旅游攻略,直接筛掉你不想要的体验。虽然此前的推理模型也能胜任这些任务,不过理想自研推理模型有所不同——它能自主...……更多
抽卡效率提升4.8倍!东北大学等开源优化版Stable-Diffusion.cpp:分辨率越高越快,生成质量更好
...需外部依赖的情况下在CPU(以及可能配置GPU)上实现高效推理。Sdcpp作为一个高效的推理框架,不仅能够显著加速模型的运行,还能大幅减少内存占用。 Sdcpp的实现中,计算密集型的2D卷积运算是图像生成的主要瓶颈,虽然功能...……更多
Cerebras 推出全球最快AI推理解决方案,速度是英伟达方案的20倍
... 今日宣布推出 Cerebras Inference,官方称这是全球最快的 AI 推理解决方案。该新解决方案为 Llama 3.1 8B 提供每秒 1800 个 token,为 Llama 3.1 70B 提供每秒 450 个 token,速度是微软 Azure 等超大规模云中提供的基于英伟达……更多
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...0美元的云计算费用,成功训练出了一个名为s1的人工智能推理模型。该模型在数学和编码能力测试中的表现,据称与OpenAI的O1和DeepSeek的R1等尖端推理模型不相上下。这一消息无疑在AI界投下了一颗重磅炸弹,真相究竟如何?《科...……更多
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...Hot Chips 2024大会上,Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示,WSE-3依然是采用了一整张12英寸晶圆来制作,基于台积电5nm制程,芯片面积为46225平方毫米,拥有的晶体管数量达到了4万亿个,拥有90...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...。本次新上线了包括:模型训练新基座,支持模型训练、推理、量化、评测等功能。 卓世科技MaaS平台是一款基于知识增强大模型的一站式行业模型训练开发平台。面向开发者和企业提供从基础算力服务、数据服务、模型训练服...……更多
...这个思路,我们开始思考:视觉模型是否也能实现类似的推理能力?”与传统大模型训练的 SFT(Supervised Fine-Tuning)方法不同,R1方法的突破在于其路径创新。SFT依赖海量标注数据进行“填鸭式”教学,而R1方法则通过强化学习,...……更多
...相对低配的GPU和显卡内存,就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后,这家上海人工智能企业立即成为它的用户。“这个大模型有6710亿参数,激活参数为370亿,在14.8万亿token(词元)上进行了预训练,生成速度比...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...中的表现,研究者们提出了各种提示策略来提升大模型的推理和规划能力,比如思维链、思维树和思维图谱。这些进步与工具集成一起,推动着通用 AI 智能体的发展,让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多
...版本升级,当前版本为DeepSeek-R1-0528,模型的思维深度与推理能力显著提升。更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写...……更多
京东云发布八大领先智算产品,助力企业火速用上大模型
...云DeepSeek大模型一体机,通过自研的算力池化能力、智能推理加速引擎,充分融合软硬件,实现了性能的全面提升,推理速度提升50%,企业可以根据自己的需求灵活选择不同版本,开箱即用。目前,在河南鹤壁、江苏宿迁、山东...……更多
英伟达没有慌,黄仁勋再谈DeepSeek:“推理”的计算需求可能增加上百万倍
...于DeepSeek、Grok、OpenAl等冲击,AI正在从感知和生成式AI向推理和逻辑推理领域发展。而推理AI又增加了一条扩展规律——增加训练的计算能力能让模型变得更智能,而增加深度思考的计算能力则能让答案更精准,与一次性推理相比...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...爆火,利用纯提示方法让普通LLM摇身一变,成为具备复杂推理能力的OpenAI o1。九月份,OpenAI o1正式登场。作为新一代的老大哥,o1系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...很多不同的GPU型号和显存大小。再加上,目前广泛应用于推理阶段的量化技术,比如可以用FP16或FP8精度,这会改变推理和训练/微调成本的比重。以上这些限制因素,都让模型规模的选择成为一个非常具有挑战性的问题。总体而...……更多
腾讯大模型混元Turbo:御气升昺云,梓桐金鼎开
...模型,腾讯混元Turbo性能有显著提升,训练效率提升108%,推理效率提升 100%,推理成本降低 50%,解码速度提升 20%,效果在多个基准测试上对标GPT-4o。最新第三方测评在国内位居第一。腾讯混云大模型已经落地腾讯700+个业务场景...……更多
华尔街不买账英伟达GTC发布,黄仁勋讲不出新故事?|氪金·大事件
...英伟达提上日程,是市场预期之内的事情。首先在训练向推理过渡的背景下,客户开始考虑降本增效,英伟达不得不做得更精细,其中就包括通过芯片上下游环节的革新,提升整体性能及效率。黄仁勋在大会现场表示,这一系统...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
NVIDIA首秀Blackwell GB200超级芯片系统:AI推理性能飙升1.5倍
...性能方面只给出了一个数据:Llama 3.1 700亿参数大模型的AI推理性能对比H200提高了足足1.5倍。散热怎么办?NVIDIA透露正在开发热水散热系统,可以将耗电量减少28%。不过,NVIDIA仍然没有给出Blackwell GPU服务器的出货时间,估计在...……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
...元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏宣布,腾讯混元Turbo在腾讯云上线,输入和输出价格只...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,...……更多
长上下文能力只是吹牛?最强GPT-4o正确率仅55.8%,开源模型不如瞎蒙
...较长的小说了。更重要的是,LLM真的能在这个长度上进行推理吗?近日,有两篇独立研究分别表明:长上下文水分很大!LLM实际上并不能「理解」内容。读小说挑战首先是来自UMass、AI2和普林斯顿的研究人员,推出了一项针对性...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...I正在壮大。 能力一览11B和90B这两款模型,不仅支持图像推理场景,包括图表和图形在内的文档级理解、图像描述以及视觉定位任务,而且还能基于现有图表进行推理并快速给出回答。比如,你可以问「去年哪个月销售业绩最好...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...不断提升,例如GPT-4o在大学水平上的多学科多模态理解和推理(MMMU)基准测试中取得了69.1%的准确率。不过,基准测试结果是否真的能反映模型对多样化主题的深入理解,仍然有争议,或者说模型是否只是利用了统计模式,而非...……更多
本周硅谷发生了什么?|苹果Vision Pro正式开售;Neuralink完成人类脑机接口植入;字节Coze国内版上线;
...推出数据分析工具“办公小浣熊”面壁智能发布2B模型,推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型,更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
... 3.5依旧答错了。LeCun在此嘲讽大模型一番,大模型竟可以推理...?问题在于,LLM没有常识,不理解现实世界,也不会规划和推理。LLM行不行,就看提示了一位网友分析总结了,以上LLM失败的原因。他表示,LLM本身就是个「哑巴」...……更多
...具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理、操作系统等复杂场景。以代码功能为例,它既可以让代码“小白”也具备技术能力、为女友写一段能呈现爱心图样的代码,也可以成为程序员的帮手,让它帮助生成...……更多
NPU IP累计出货超1亿颗!芯原股份一站式AI解决方案揭秘
...的IP更重要,一定要有比较好的PPA。因为端侧主要是要做推理,也要有一些浮点运算的能力,更关注的是低比特的量化及压缩能力。而在云端一定是高性能、非常高的TOPS,它要能够去做训练和推理。而且不光是单卡的训练推理,...……更多
Claude 3.5深夜觉醒,学会模仿人类用电脑!编程干翻o1,Agent一夜变天
...、输入文本,还能查找代码错误、自动搜集信息填表。AI推理已至瓶颈,下一个爆破点,就是AI操作电脑!Claude 3.5深夜迎来重磅升级!不出所料,Anthropic AI这周终于有了大动作——首发Claude 3.5 Haiku,全新升级版Claude 3.5 Sonnet也来...……更多
空间压缩术:英特尔携生态伙伴推出高性能双卡工作站
...的魔术一般,让小巧紧凑的产品组合,也能释放出色的AI推理算力。方寸之间,GPU显存密度的突破相比于千年前荔枝的“冷链”难题,英特尔更聚焦于“方寸之间”如何巧妙组合。当前主流工作站体积普遍维持在50升左右,虽小...……更多
更多关于科技的资讯:
清华大学安徽校友会AI大数据专委会揭牌
大皖新闻讯 11月20日,清华大学安徽校友会AI大数据专委会揭牌仪式暨人工智能前沿洞察与产业创新论坛在中国视界举行。人工智能是安徽省十大战略性新兴产业之一
2025-11-21 12:23:00
中新经纬11月21日电 据中消协网站21日消息,近日,有媒体曝光了一批盗版剧APP,这些APP不仅盗用大量剧集资源,更会窃取用户个人隐私信息
2025-11-21 12:37:00
“消失的法老”回来了!“BesTV上海博物馆”今天上线 计划实现上海电视用户全覆盖
11月18日,“廿念不忘,帧帧日上——百视通成立20周年分享会”在国际会议中心举行。作为20周年重磅发布之一,由百视通与上海博物馆联合打造的“BesTV上海博物馆”产品正式亮相并登陆上海移动高清电视
2025-11-20 08:06:00
入住4年仍甲醛超标!福建卫视《现场》探访实录,解码智能门的健康升级路径
近日,福州居然之家王力安防门店迎来了一位特别的客人——消费者丁先生专程送来一面写有“贴心服务暖人心,智能监测护健康”的锦旗
2025-11-20 08:06:00
厦门网讯(厦门日报记者 林露虹) 近日,专注于毫米波雷达芯片研发的厦企——矽杰微电子(厦门)有限公司(简称“矽杰微电子”)完成C1轮增资
2025-11-20 08:29:00
厦门围绕“金鸡”品牌 在影视产业链上持续发力
陈铎(中)指导员工进行《活宝档案》动画制作。海丝(厦门)电影工业产业基地施工现场。 厦门网讯(文/图 厦门日报记者 邬秀君)走进位于软件园一期的继来之(厦门)人工智能研究院有限公司
2025-11-20 08:30:00
记者走基层|集装箱“搬上”无人车 解锁配送新技能
11月1日,在廊坊座头鲸科技有限公司智能制造基地,工作人员对蓝丁智能无人配送车底盘进行性能测试。 河北日报记者 刘 杰摄11月1日清晨
2025-11-20 08:49:00
破局之法,精耕之道 《精耕者访谈》第三季·区域之王重磅开启!
11月18日,由蓝河乳业独家冠名的《精耕者访谈》第三季·区域之王正式启动。作为母婴行业首个高端访谈栏目,其始终着眼于市场一线
2025-11-20 09:06:00
北京博大健康体检管理中心盛大启幕 以“科技+精准”重新定义健康管理新标杆
11月18日上午,北京博大健康体检管理中心(简称“博大体检”或“中心”)在京举行开业典礼,正式落地北京经济技术开发区南海绿茵国际园区
2025-11-20 09:06:00
以儿童为本——赖园青的幼儿教育科学实践之路
在人工智能与教育深度融合的浪潮中,如何让技术真正服务于幼儿认知发展?上海浦东新区民办普瑞姆幼儿园园长赖园青用贯穿理论与实践的智慧教育探索
2025-11-20 10:06:00
山东移动招远分公司秋冬宽带服务义诊暖心启动 专业服务守护数字生活
胶东在线11月19日讯(通讯员王少娜徐冰鑫)秋冬时节,居民居家上网需求激增,网络卡顿、信号盲区、设备老化等问题更易影响用户使用体验
2025-11-20 10:17:00
四梯科技重磅发布智能产业工程师证书项目 推动教育科技人才一体化发展
2025年11月14日,在深圳第二十七届中国国际高新技术成果交易会第二届产教融合与科教融汇论坛上,北京四梯科技有限公司(以下简称“四梯科技”)首次面向社会正式发布“四梯智能产业工程师证书项目”(4T SIEC)
2025-11-20 11:37:00
一屏承古韵,元景越千年!联通数智重构文博文创新范式的野望
11月17日,“中华文明起源系列——‘看·见殷商’”展览总结暨博物馆高质量发展研讨会在北京大运河博物馆举行。会上回顾了“看·见殷商”展览的创新实践
2025-11-20 12:07:00
名创优品斩获国际零售地产大奖MAPIC 2025\
在法国戛纳举办的 2025 年全球零售商业地产峰会大奖(MAPIC Awards)中,名创优品凭借其MINISO LAND战略级店态
2025-11-20 14:38:00