• 我的订阅
  • 头条热搜
面壁智能发布开源大模型eurux-8x22b
...大模型Eurux-8x22B,包括 Eurux-8x22B-NCA 与 Eurux-8x22B-KTO,主打推理能力。官方测试中,Eurux-8x22B 在 LeetCode(180道LeetCode编程真题)与 TheoremQA(IT之家注:美国大学水准的STEM题目)测试上超越了 Llama3-70B……更多
OpenAI新功能 “深度研究” 登场,人类终极考试的表现超过DeepSeek R1
...过专门优化,适配网页浏览和数据分析场景。它能够运用推理能力,在互联网上搜索、解读和分析海量的文本、图像和PDF文件,并能根据所遇到的信息灵活调整研究方向。 值得注意的是,在对这个智能体的能力评测中,OpenAI特...……更多
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
...到,人类大脑生成和解析语言的神经网络并不负责形式化推理,而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具,而不是思考的工具,对于任何经过测试的思维形式都不是必需的」,引发了科技...……更多
科大讯飞:在智能汽车领域将持续融合集成行业最新相关技术
...信息的真实性与可靠性。投资者:你好,请问公司的深度推理X1什么时候能升级一个版本,支持所有问题的推理,而不仅仅是数学题。科大讯飞董秘:您好,2025年1月15日,科大讯飞首发国内首个基于全国产算力平台训练的具备深...……更多
万字技术干货!LLM工程师必读量化指南,可视化图解揭秘大模型如何压缩
...型的参数可能超过数十亿,通常需要显存较大的GPU来加速推理过程。因此,越来越多的研究开始关注如何缩小模型,比如改进训练方法或使用适配器。该领域的一项主要技术被称为量化(quantization)。ML工程师Maarten Grootendorst撰...……更多
小红书技术副总裁王晓博:大模型让AI越来越像人,更懂小红书的内容与用户
...数据对用户和内容进行建模,会导致新笔记分发难,缺乏推理能力导致信息茧房等问题。在小红书的推荐系统中,率先将大模型作为笔记的语义编码器来使用,通过语义压缩提示词(prompt)结合对比学习技术,让大模型能够把笔...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...SIQA、HellaSwag、WinoGrande等多个数据集,来评估Yi的“常识推理能力”“阅读理解能力”“数学与代码能力”等多维度能力。Yi能力。结果显示,Yi-6B在常识推理能力和阅读理解能力上达到了国内外开源模型的平均水平,但在数学与...……更多
研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
...工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统,会在对提示做出...……更多
大模型“免费”送,厂商们图什么?
...,零一万物CEO李开复接受采访时表示:“未来整个行业的推理成本每年降低10倍是可以期待的,而且这个趋势是必然的。”未来,大模型的成本将呈阶梯状下探,但目前大模型的价格却断崖式下探,甚至部分企业免费送,降价幅...……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...CLM-Baseline取得了更高的平均分,且在ARC(小学生科学问题推理)、HellaSwag(常识推理)、MMLU等任务上表现更好。 “小”模型成新趋势回到开头,“小”模型最近已成新趋势。先是HuggingFace推出了小模型家族“SmolLM”,其中包含1...……更多
Meta首款多模态Llama 3.2开源!1B羊驼宝宝,跑在手机上了
...I正在壮大。 能力一览11B和90B这两款模型,不仅支持图像推理场景,包括图表和图形在内的文档级理解、图像描述以及视觉定位任务,而且还能基于现有图表进行推理并快速给出回答。比如,你可以问「去年哪个月销售业绩最好...……更多
...强结合,GLM-4稳定、高效运行于云端,并具备大规模实时推理能力,成功实现了成本效益和服务质量的平衡。这一创新使得智谱大模型能够深入理解用户需求,快速作出响应,为用户提供智能化生活的便利与高效。自2022年起,优...……更多
媲美OpenAI事实性基准,这个中文评测集让o1-preview刚刚及格
...样本,提升数据集的难度,以发现 LLM 的普遍存在的知识边界。具体来说,如果一个问题四个模型都能正确回答,则认为该问题过于简单并予以舍弃。2. 质量控制阶段,我们引入了严格的人工验证流程:(1)每条数据在隐藏答案...……更多
AI行业深度研究:乘大模型之风,AI芯片元老寒武纪再度起航
... 的 AI 服 务器收入也大幅增加。我们预计未来针对训练和推理的 AI 算力需求有 望长 时间高景气,据 IDC 及 TheNextPlatform 统计,2023 年全球 AI 服务器 市场 规模预计将超 500 亿美元,2027 年预计将超 946 亿美元。在这一场科 技盛 宴...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...爆火,利用纯提示方法让普通LLM摇身一变,成为具备复杂推理能力的OpenAI o1。九月份,OpenAI o1正式登场。作为新一代的老大哥,o1系列专注于复杂的推理任务,一经推出也是直接屠榜了大模型竞技场。在下面这些难度较大的数学...……更多
ChatGPT o1满血版上线!实测中它竟然败给了国产AI?
...特曼用一个简单的柱状图给出了对比:可以看到o1在数学推理和编程领域的表现要明显优于o1-preview,提升幅度在50%左右,而在科研领域的测试里,o1相对于o1-preview的表现就提升有限了。图源:OpenAI考虑到o1模型不需要额外加钱就...……更多
...达1000AITOPS处理能力和128GB统一内存,实现无缝模型开发和推理先进架构:NVIDIA?GB10GraceBlackwell超级芯片配备BlackwellGPU、20核ArmCPU和NVLink-C2C?技术,可有效提升AI工作负载扩展互联:配置为独立或私有云系统,以在桌面上驱动AI……更多
技术最前沿|瞄准行业痛点, AI验布机赋能传统行业技术焕新
...面,TeleAI创新性采用“大小模型”训练+“多层金字塔”推理的训练、推理两段式算法策略。“大小模型”训练中的大模型是指依托电信自研星辰大模型基座,打造布匹质检行业预训练基础大模型;小模式是指针对不同客户场景...……更多
ChatGPT已经慢了,这是国内AI搜索新高度,免费可用
...连发大语言模型「天工 1.0」到「天工 3.0」并拓展 AI 能力边界的重要举措和一大支点。 不过,AI 搜索厂商想要持续在这个赛道分得一杯羹,则需要丰富自己的「武器库」。一直以来,昆仑万维正是这样做的,通过迭代更新集成...……更多
AMD的GPU跑AI模型终于Yes了?PK英伟达H100不带怕的
...:「算力这块,你可以用别的芯片,但是这些芯片用来做推理还 OK,做训练的话还要等几年的样子,英伟达还是处在一个垄断的地位。」但基于实证的对比研究却往往又会给出不一样的答案,比如在同一个演讲中,李沐还提到了...……更多
...法不准确。同时,它还附上了正确做法。聚集增强数学、推理及代码能力商汤生成式AI产品系列的突破性表现,得益于其最新发布的日日新5.0版本大模型。记者了解到,自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正...……更多
语音克隆达到人类水平,微软全新VALL-E 2模型让DeepFake堪比配音员
...零样本TTS依旧是一个有挑战性的问题。「零样本」意味着推理过程中,模型只能参照一段简短的陌生语音样本,用相同的声音说出文本内容,就像一个能即时模仿的口技大师。听到这里,不知道你会不会突然警觉——有这种能力...……更多
黄仁勋首次回应DeepSeek冲击波:市场理解完全反了,本质上利于AI计算需求
...中国AI(人工智能)初创公司深度求索(DeepSeek)的开源推理模型R1“令人兴奋不已”,而市场对于R1的反应中存在一些误解,R1的发布本质上利好AI市场。黄仁勋表示:“我认为市场对R1的反应是,‘天哪,AI已经完了’。你知道...……更多
商汤 AI 办公小程序“Raccoon 智能助手”上线:提炼文章重点
... 大模型,该模型采用 MOE 混合专家架构,在知识、数学、推理和代码能力方面大幅提升。该模型基于超过 10TB tokens 训练,具备 200K 推理上下文窗口(相当于 36.5 万个汉字),推理时上下文窗口达到 200K 左右,提供自然语言处理...……更多
晶圆级AI芯片WSE-3性能公布:80亿参数模型上每秒生成1800个Token
...Hot Chips 2024大会上,Cerebras Systems详细介绍了这款芯片在AI推理方面的性能。根据官方资料显示,WSE-3依然是采用了一整张12英寸晶圆来制作,基于台积电5nm制程,芯片面积为46225平方毫米,拥有的晶体管数量达到了4万亿个,拥有90...……更多
本周(4.8-4.14)AI界发生了什么?
...模型中,只需一次API调用,该模型就可以分析图像并应用推理。“欧洲版OpenAI”Mistral AI也正式开源了大模型Mixtral8x22B,参数规模高达1760亿,仅次于马斯克AI公司的Grok-1大模型。苹果或在9月发布新电脑,搭载AI功能当地时间4月11...……更多
商汤联合发布白皮书,首次提出新一代AI基础设施评估体系
...。AI2.0时代,需要新一代的基础设施来支撑大模型的训练与推理、生成式AI应用的规模化落地,其核心要素,如计算、存储、网络以及数据服务都要做精细化的设计和重构,而非简单的服务器或GPU实例堆砌。《白皮书》明确了新一代AI...……更多
字节猛踩油门
...型3.0、视觉理解模型,并推出OS Agent解决方案及AI云原生推理套件,用于企业客户构建与部署Agent应用。其中,豆包1.5深度思考模型作为字节首款推理模型,具备“边想边搜”能力,同时借助视觉推理能力,可以综合理解图片中的...……更多
学而思今天正式发布接入DeepSeek的全新“随时问”APP
...提问环节的辅助亮点,启发式追问能够帮助孩子拓展思维边界;更有“苏格拉底式提问”模式,AI小助手不直接给出解答,而是通过连续提问的方式,一步步引导用户自己得出答案或结论。 ……更多
超擎数智重磅发布擎天、锋锐、元景系列AI服务器,打造人工智能新质生产力强劲引擎
...擎天、锋锐、元景系列AI服务器产品,为大规模数据训练和推理提供强劲性能,帮助AI用户高效构建AI基础设施和应用环境,满足AI场景下的多元算力需求,为AI新质生产力提供强劲引擎。擎天系列L20 AI服务器,4U8卡PCle擎天系列L20 AI服务...……更多
更多关于科技的资讯:
每集2分钟、一共28集,短剧《昭世录》在美国、英国、泰国等地的短视频平台上线后爆火,海外播放量近2亿。这部短剧由位于嘉兴经开区的嘉兴九州文化传媒有限公司出品
2025-12-15 07:32:00
12月11日,金华市蓝海光电技术有限公司激光雷达事业部总经理刘崇求向记者展示了一款新型机器人导航激光雷达。该雷达除了能360度平面扫描探测
2025-12-15 07:32:00
12月14日,首届全国独角兽企业大赛总决赛在宁波高新区收官。本次总决赛由工业和信息化部火炬高技术产业开发中心、中国电子学会
2025-12-15 07:32:00
12月12日下午,“2025浙江省新消费创新大赛资源对接活动”在杭州余杭未来科技城举办。活动以“潮起新消费 智汇浙未来”为主题
2025-12-15 07:32:00
“亲,这个问题难倒我了”“对不起,我理解不了您的意思”……这些出自AI客服的经典“名言”你熟悉吗?你是不是也被AI客服“逼疯”过呢?随着年终消费季的到来
2025-12-15 07:50:00
杭州故事,叩开世界的“心门”
在中国美术学院举办的“黑神话:悟空”艺术展。记者 步恩撒 摄踏上取经路,比抵达灵山更重要——黑神话:悟空。来西游神话当一回“天命人”
2025-12-15 08:03:00
巨头入局,珠海面向全球打造中国RISC-V生态之城
日前,一则重磅消息惊动全球半导体产业圈。当地时间12月10日晚,全球半导体巨头高通公司宣布完成对 Ventana Micro Systems的收购
2025-12-14 15:35:00
近日,上城区发布第四批“人工智能+”机会场景清单,25个场景聚焦产业升级、金融服务、智慧教育、智能医疗等重点领域。据悉
2025-12-13 08:06:00
“甩一甩”就能测温的水银体温计,即将在2026年1月1日全面禁产的政策下退出历史舞台。这则消息引发的全网热议,恰是怀旧情感与环保理性
2025-12-13 08:16:00
厦门网讯(厦门日报记者 应洁)昨日,“新质设计——红点产品设计大奖·中国获奖作品精选展”在红点厦门设计博物馆开展,来自70多家中国企业的百余件“红点奖”获奖作品呈现出国际一流设计的“中国力量”
2025-12-13 08:39:00
第六届中国人工智能大赛配套论坛在厦成功举办
厦门网讯(厦门日报记者 翁华鸿 通讯员 张晶晶 王艳红)12日,第六届中国人工智能大赛配套论坛在厦门成功举办。论坛以“融新汇智
2025-12-13 08:39:00
中新经纬12月13日电 据“网信中国”微信号13日消息,2025年12月2日,中央网信办提出并归口的《数据安全技术 电子产品信息清除技术要求》强制性国家标准由国家市场监督管理总局
2025-12-13 10:42:00
中国科大利用磁力系统实现宽带磁声混合频率梳
大皖新闻讯 12月13日,大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队在磁力系统研究中取得新进展。该团队董春华教授研究组通过磁振子与高频声子相互作用
2025-12-13 14:35:00
京东宠物百千万爆品计划启动:联合pidan打造确定性产品 单款猫砂月销1500万
猫砂是猫用品购买频率最高的产品,其潜力被外界看好。不过,因行业门槛低,这两年入局者多、竞争加剧,猫砂利润像纸一样薄,最低仅1%
2025-12-13 14:56:00