• 我的订阅
  • 头条热搜
...赖算力资源的预训练阶段竞争终结了,下一阶段的重点在推理,并将出现一批新公司,DeepSeek的出现也是必然,用更低的算力资源就可以实现同等甚至更高的效能。虽然这几年大模型发展速度很快,但我们并没有投资大模型项目...……更多
若愚科技推出九天机器人大脑,大模型总参数规模达130亿 |项目报道
...翻译、思维链、工具使用等多种类型的指令数据, 在逻辑推理、关系推理、感知能力上都能呈现出较好的效果。 基于自研的基于语言大模型和多模态大模型,若愚科技构建了多模态具身决策大模型,凭借人类世界通用知识和强...……更多
小米开源首个推理大模型Xiaomi MiMo:7B参数就超越OpenAI o1-mini
...快科技4月30日消息,小米官方今天正式宣布,开源首个为推理(Reasoning)而生的大模型——Xiaomi MiMo。据介绍,Xiaomi MiMo在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,超越了OpenAI的闭……更多
连发两款模型“补课”,百度AI成色如何?
...李彦宏,百度近日低调发布两款大模型——文心4.5和深度推理模型文心X1,免费。两年前的3月,百度发布了对标ChatGPT的文心一言。这是全球大厂中首个生成式AI产品,也让外界看到百度相对迅速的先手布局。不过,百度后来采取...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...“秋季发布”(9月至11月)要更早。上述报道称,专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题,但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力,希望通过近几个月...……更多
...算领域也将因DeepSeek的兴起而受益匪浅。AI模型的训练和推理都需要强大的算力支持,随着AI应用的增多和普及,市场整体对于云端推理算力需求或将大幅增加。国内头部云计算公司陆续接入DeepSeek,有望推动云服务商算力租赁及A...……更多
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
...中的商业周期、物理学中的电磁波,以及数学运算和逻辑推理等。因此,在许多任务和场景中,人们希望对周期进行建模,以便根据以往的经验进行推理。尽管以 MLP 和 Transformer 为代表的基础模型已经取得了显著的成功,但是它...……更多
...举一反三、融会贯通,可处理视觉、听觉、语言、学习、推理、决策、规划等各类任务。类脑计算即是将生物神经网络的工作机理应用于计算机系统设计中,构建像大脑一样的低功耗、高并行、高效率、智能化的计算系统。“悟...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并行能...……更多
阿里QwQ-32B API接口服务上线国家超算互联网:零门槛部署 免费100万Tokens
...联网官微获悉,本周,超算互联网平台上线阿里巴巴开源推理模型QwQ-32B API接口服务,现在用户可获得免费的100万Tokens。据了解,基于国产深算智能加速卡以及全国一体化算力网,平台支持海量用户便捷调用QwQ-32B、DeepSeek-R1等国...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
...兴的需求驱动的导航任务要求根据人类抽象需求进行语义推理。先前研究工作都围绕某一种特定类型的指令设计一个特定类型的导航方法,然而在真实应用中,人类可能向机器人下达不同形式的指令,甚至混合类型指令,现有的...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...交互能力的核心是模型能够直接在语音模态上进行理解和推理,这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程:首先将输入语音内容转换为文本,其次利用大语言模型进行文本推理,最后利用...……更多
被认可的大模型价格战
...要减少幻觉,同时需要有强大的记忆能力、查文献能力、推理能力,如果把行业上能共识的能力都投射到做医生的标准中,那么这便可以成为一个指标——“人造医生”就是AGI。 李大海则尝试从经济学的角度定义AGI。在他看来...……更多
DeepSeek点燃AI赛道,指数布局正当时
...,DeepSeek也拥有卓越的性能,有效降低了AI模型的训练和推理成本,其V3模型仅耗费约558万美元,显著低于GPT和Llama系列。同时,DeepSeek模型开源进一步降低了AI应用开发与部署门槛,极大拓展了AI应用场景,让人们看到了人工智能...……更多
OpenAI怎么了?11人创始团队如今仅剩3人,GPT-5也将缺席10月的开发者大会
...新AI模型。从Anthropic透露的信息看,该模型在研究生水平推理(GPQA)、编码能力(HumanEval)、文本推理(DROP)等方面的成绩均好于GPT-4o,但在数学问题解决能力上稍逊于后者。值得注意的是,Anthropic的核心成员几乎都是OpenAI原...……更多
李彦宏批“百模大战”:造成算力极大浪费 开源模型并不万能
...源模型的能力,就需要更大的参数规模,这将导致更高的推理成本和更慢的响应速度。李彦宏表示,大多数应用场景并不适合开源模型,商业化的闭源模型才是真正有竞争力的。他指出,没有实际应用的基础模型,无论开源还是...……更多
理想的智能驾驶,到底「City 不 City」?
...人过去的经验和习惯所形成的直觉;系统 2 则代表了思维推理能力,人们需要借助思考和推理来处理复杂的问题和应对未知的场景。端到端模型主要用于处理常规的驾驶行为,从传感器的感知数据输入到行驶轨迹的决策输出只经...……更多
理想自研芯片进展曝光:在新加坡设立办公室,团队规模已超160人
...芯片自研方面,理想同时在研发用于智能驾驶场景的 AI 推理芯片,和用于驱动电机控制器的 SiC 功率芯片。报道称,理想目前正在新加坡组建团队,从事 SiC 功率芯片的研发。在职场应用 LinkedIn 上,已经可以看到理想近期发布的...……更多
冯骥吹爆国产AI大模型DeepSeek:太强了 6到不真实!
...列出了AI大模型的六项关键突破方向:1、强大。比肩O1的推理能力,暂时没有之一2、便宜。参数少,训练开销与使用费用小了一个数量级3、开源。任何人均可自行下载与部署,提供论文详细说明训练步骤与窍门,甚至提供了可...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...用混合专家架构,超10TB tokens训练,覆盖大量合成数据,推理时上下文窗口达200K左右。云、端、边全栈大模型产品矩阵中,用于终端设备的“商汤端侧大模型”可满足各类终端用户对大模型技术的应用需求。“日日新5.0”和GPT-4...……更多
年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...成热潮,多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世,带来的思维链CoT+强化学习这一新范式,正推动生成式AI迈入新的阶段。大语言模型仍在狂飙,但价格战、营销战硝烟燃起,融资热度正在降温。不过...……更多
超强AI来袭!OpenAI最新AI模型 “草莓”即将上线,推理能力惊艳
...但其实这个模型的能力可不容小觑,它能够通过多步骤的推理解决复杂的问题。根据《信息》网站的报道,“草莓” 模型将视为一种推理模型,这意味着它能够处理一些需要多步骤来完成的请求,比如解答难度较大的代数题,...……更多
亚马逊推出“自动推理检查”工具,对抗 AI 幻觉
...拉斯维加斯举办的 re:Invent 2024 大会上,AWS 推出了“自动推理检查”(Automated Reasoning checks)工具,该工具通过交叉引用客户提供的信息来验证模型的响应准确性。AWS 宣称,这是“第一个”也是“唯一”的针对幻觉的防护措施。...……更多
...息,能实时检索最新的医学文献,生成诊断建议,并通过推理过程展示,帮助医生验证诊断的可靠性。作为“侦探”,它能实时检索最新的医学文献,生成诊断建议,并通过推理过程展示,抽丝剥茧地分析疾病在孩子身上留下的...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...Ovis在OpenCompass上的测评数据情况据介绍,Ovis能够在数学推理问答、物体识别、文本提取和复杂任务决策等方面展现出色表现。例如,Ovis可以准确回答数学问题,识别花的品种,支持多种语言的文本提取,甚至可以识别手写字体...……更多
联想发布端侧AI新技术 PC本地推理能力媲美 OpenAI-mini
...想展示了其在端侧算力方面的最新创新成果 —— “联想推理加速引擎”。据了解,这款由联想、清华大学及无问芯穹联合研发的推理引擎,是专为高效AI PC推理而设计的软硬件协同优化平台,可以让一台普通PC的本地推理能力,...……更多
华为联合WPS AI,见证昇腾大模型推理应用启航
...华为联合WPS AI等11 家生态伙伴及客户发布基于昇腾大模型推理解决方案的五大场景优秀实践,共同见证人工智能大模型在“文本生成、文生视图、辅助编程、终端应用、智能办公/客服”应用启航的历史时刻。昇腾大模型推理解...……更多
美股异动丨金山云一度涨超13% 小米首个推理大模型MiMo开源
...收涨14.2%,报7.4港元。消息面上,今天,小米开源首个为推理(Reasoning)而生的大模型“Xiaomi MiMo”,联动预训练到后训练,全面提升推理能力。 在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo仅用7B的参数规模,...……更多
谷歌推出其最先进AI模型Gemini,希望击败GPT-4
...当天开始,谷歌聊天机器人Bard将使用Gemini Pro来实现高级推理、规划、理解和其他功能。明年初,谷歌将推出Bard Advanced,其将使用Gemini Ultra,这代表了Bard发布以来的最大更新。从发布会当天开始,Pixel 8 Pro手机的两项功能将由Gem...……更多
大模型这把“火”,烧到了人形机器人
...脑”负责运动控制,“大脑”则主导机器人的环境感知、推理决策和语言交互。而大模型的出现,将语义理解能力和推理生成能力引入其中,相当于给人形机器人换了个“大脑”。大模型对人形机器人的提升主要体现在两个方面...……更多
更多关于社会的资讯:
山师附小学生出版社里探秘“字里春秋”邂逅汉字之美
2025年11月29日上午,一场别开生面的“字里春秋”沉浸式阅读体验活动在山东画报出版社落下帷幕。山师附小2023级6班的学生及其家长共同参与此次活动
2025-12-06 16:07:00
替主人还债的宠物猫二拍降至3600元起拍
大皖新闻讯 12月6日,大皖新闻记者从阿里资产平台看到,替主人还债的缅因猫二拍上架了,起拍价下降了900元,调至3600元起拍
2025-12-06 12:51:00
贵医大二院:医生仅用10秒钟,胎儿从“臀位”变成“头位”
多彩贵州网讯 12月4日,一位慕名而来的准妈妈,在贵州医科大学第二附属医院翁义院区妇产儿科,邂逅了一段短暂却满是暖意的奇妙体验
2025-12-06 12:02:00
河北沧州一小区被指向农地排水致树苗死亡
近日,河北沧州沧县纸房头镇南小营村村民何先生向海报新闻记者反映,其于9月29日至30日发现,当地碧桂园凤凰城项目私自将积水排放至相邻的农用地
2025-12-06 10:57:00
时政微纪录丨中法两国元首在成都进行友好交流
12月5日,国家主席习近平在四川省成都市都江堰同法国总统马克龙进行友好交流。初冬的都江堰,苍山掩翠。马克龙夫妇抵达时,受到习近平和彭丽媛热情迎接
2025-12-06 09:50:00
停课通知,杭州一个班18名孩子确诊!紧急提醒:高峰或将到来,95%以上是H3N2
每年秋冬都是流感高发季,近期,全国流感患病人数持续上升。中国疾控中心专家表示,预计全国流感在12月上中旬达峰的可能性较大
2025-12-06 09:19:00
长白时评评论员 唐小兰冰天雪地、粉雪飞扬,是吉林刻在大众心中的鲜明标识。当各地文旅项目陷入同质化竞争的内卷,当网红热度如流星般转瞬即逝
2025-12-06 06:07:00
在最近的复查中,46岁的王女士(化名)拿到了腹部CT和骨髓检查的正常报告,曾经缠身多年的乏力、反复发热、腹痛等不适彻底消失
2025-12-06 07:16:00
近日,王阿姨来到拱宸桥街道社区卫生服务中心拱北院区,将一面印有“医德高尚医术精,关爱病患暖人心”的锦旗送到她的签约医生中医师贾春霞的手中
2025-12-06 07:17:00
新华社杭州12月5日电 “10秒钟,让你画的小人儿在屏幕上动起来!”杭州市春晖小学的课堂上,授课教师齐传鹏话音刚落,学生们就迅速拿笔埋头创作
2025-12-06 07:17:00
广州43岁男子驾车时突发疾病失控,致4人受伤
12月5日,广州市公安局花都分局发布警情通报:12月5日17时47分,花都区花城北路发生一起交通事故,致4人受伤。接报后
2025-12-06 07:47:00
“外卖诗歌”架起中意文化桥梁 《下午三点》在罗马引共鸣
中国青年报客户端讯(中青报·中青网记者 谭思静 李超)12月3日,意大利时间12月2日19点30分,《“下午三点”——一首“外卖诗歌”的世界回响》分享会在意大利罗马9号中意经济文化交流中心举行
2025-12-06 05:53:00
灵隐飞来峰免票后 首个周末预约已满
记者 陈中秋 摄灵隐飞来峰景区从12月1日开始实行“实名预约、分时游览”免票预约制以来,每天都迎来大批市民和游客参观游览
2025-12-06 07:47:00
当代中国画作品展郑州启幕,高兰女士盛赞跨域艺术交融
2025年11月19日,“在东方丨画里中国——当代中国画作品展”在郑州美术馆(新馆)正式开幕。这场由广东省中国画学会、广东省美术家协会中国画艺委会
2025-12-05 15:55:00
散货船“华德858”轮航经台湾海峡途中触礁断裂
微信公众号“福州海事”消息,12月3日18时40分,福州市海上搜救中心接报,一艘散货船“华德858”轮在航经台湾海峡途中
2025-12-05 15:57:00