• 我的订阅
  • 头条热搜
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
...新品发布活动最后一日,OpenAI宣布了“压轴大作”:o1的下一代模型o3,而且一开始就要推出两个版本,一个正式的o3,还有一个相对较小的精简版o3-mini。OpenAI的CEO Sam Altman在直播中提到,OpenAI本次12日的活动第一天官宣了上线正...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...12天的技术分享直播活动的最后一天!周五,OpenAI发布了下一代的推理模型o3,这是今年早些时候发布的o1推理模型的升级版本。更准确地说,o3是一个模型系列——就像o1一样,同时有o3和o3-mini两个版本,后者是一款更小的精简...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...就大幅改善智能、速度和成本之间的权衡曲线。除了开发下一代模型系列外,还正在开发新模式和功能,以支持更多企业用例。谈及AI安全,Anthropic强调,“模型已经过严格安全测试,且会注重保护用户隐私。除非用户明确允许...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...非常大的提升。下一步,上海AI实验室将把相关技术融入下一代书生大模型,并继续沿着通专融合发展路径,通过开源与产学研各界共同推动技术进步。InternThinker已经开启了测试使用,你可以通过下方链接测试更多有趣的题目!...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...人工智能AGI又进一步。专注于推理的“草莓”可能也是为下一代AI模型“猎户座”或者说ChatGPT 5奠基的必经之路。软件开发机构Technology Rivers创始人兼CEO Ghazenfer Mansoor指出,借助“草莓”项目,OpenAI对人类推理水平的追求不仅是...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...是,此前据外媒报道,OpenAI或正考虑给“草莓”大模型或下一代旗舰模型制定更高的收费标准,最高或将达到每月2000美元。作为对比的是,目前ChatGPT Plus的收费标准是每月20美元。动荡不安的OpenAI,GPT-5何时到来?据外媒报道,...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
... CTO曾放话说GPT-4已经达到了「聪明高中生」的智力水平,下一代模型要达到博士水平…这番言论放在众多LLM失败案例面前显得格外讽刺。 我们之所以会如此震惊于LLM在简单的推理任务上翻车,不仅仅是因为与语言任务的惨烈对...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
... AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后,Mistral Lar……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...平台……“LiveKit很高兴能与Cerebras合作,帮助开发者构建下一代多模态AI应用。结合Cerebras的计算能力和模型以及LiveKit的全球边缘网络,所开发的语音和视频AI应用将实现超低延迟并更接近人类特征。”LiveKit公司的CEO兼联合创始...……更多
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...全力打造成为全栈人工智能服务商。AI时代,大模型将是下一代操作系统,超级AI云是下一代计算机。吴泳铭认为,超级AI云需要超大规模的基础设施和全栈的技术积累,未来,全世界可能只会有5-6个超级云计算平台。阿里云将持...……更多
ASC24超算大赛启动会在京举行,大模型推理等成为赛题
...大学杰出教授杰克·唐加拉(Jack Dongarra)表示,ASC旨在激励下一代的HPC(高性能计算)科学家和工程师们,使用最前沿的技术提供创新的解决方案。ASC竞赛是世界上最大的超算竞赛,致力于培养下一代有才华的年轻优秀学生,在超算...……更多
近 日 ,DeepSeek发 布DeepSeek—V3.1,基于下一代国产芯片训练。DeepSeek—V3.1采用UE8M0FP8精度训练,可以直接在任何支持MXFP8+UE8M0的硬件上执行,能降低内存流量、提升矩阵乘法吞吐。V3.1通过软件定义与更多芯片适配,能让超低精度...……更多
百度发布深度思考大模型文心X1:性能对标R1,API调用价格减半
...而坚定的AI转型步伐,专注于发现用户真正需要和想要的下一代搜索体验。”另值得关注的是,2月25日,百度与YY逾四年的收购事项告一段落,百度收购YY的价格缩水,有超110亿元资金释放予百度,百度计划将有关释放的资金投资...……更多
DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?
...得注意的是,此前有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。不...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...快。他们所采用的架构,已经可以和o1匹敌,如果更新到下一代大模型,甚至还有可能实现领先。没错,这次周鸿祎和OpenAI所采用的路线殊途同归,不谋而合了。360首创的CoE架构,已经可以媲美OpenAI o1的思维链模式。不仅在技术...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
本周(4.8-4.14)AI界发生了什么?
...新架构,解决大模型“内存”问题4月12日消息,谷歌发布下一代Transformer模型Infini-Transformer。Infini-Transformer引入了一种有效方法,可将基于 Transformer 的大语言模型拓展到无限长输入,而不增加内存和运算需求。就在4月5日,谷歌...……更多
DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目
...,DeepSeek团队认为,业界越来越认识到长上下文建模对于下一代大型语言模型的重要性。然而,随着序列长度的增加,标准注意力机制的高复杂度成为了关键的延迟瓶颈。据了解,NSA通过高效的长序列处理能力,使模型能够直接...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...使用该芯片。当天,英特尔还分享了企业AI各细分领域的下一代产品和服务的最新信息。英特尔为面向数据中心、云和边缘发布了下一代处理器英特尔至强6。配备能效核(E-cores)的英特尔至强6处理器将于2024年第二季度推出,配...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...在GPU上根本不可能实现的产品。而且,它甚至比英伟达的下一代Blackwell(B200)更快、更便宜!如今最先进的AI模型,无一不是基于Transformer的,比如ChatGPT、Sora、Gmini、Stable Diffusion 3等等。如果Transformer被SSM、RWKV或……更多
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...现AI,现在AI正在彻底改变GeForce。”黄仁勋由此宣布推出下一代RTX Blackwell系列,即基于Blackwell架构的GeForce RTX 50系列。黄仁勋称这款GPU“就像一个怪兽”,有920亿个晶体管,每秒4000万亿次AI运算,比上一代Ada高出三倍。每秒380万...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...布的大模型Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等。谷歌官方称“这是Bard自推出以来最大的升级”。Gemini Nano被称为“端侧任务最高效的模型”,Android开发者可以通过AICore来使用。据悉AICore是Android 14 ...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...与AWS共同构建面向机器学习训练的世界最大计算集群,其下一代Claude大模型将在拥有数十万颗Trainium2芯片的集群上进行训练。总体来看,AWS的计算、存储、数据库、AI推理,四大板块都迎来一大波重要更新。一、全新自研大模型A...……更多
李彦宏再谈开源:开源模型是智商税,永远应该选择闭源模型
...的技术人员、需要很多算力、需要很多数据,才能训练出下一代大模型,我们还可能需要下下一代、下下下一代的大模型。所以最终我觉得大家是要去拼谁的技术更好,你的技术好,你为客户产生了更好的价值。今天之所以把这...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...的性能。 在发布会上,李开复还宣布,零一万物已启动下一代 Yi-XLarge MoE 模型训练,将冲击 GPT-5 的性能与创新性。从 MMLU、GPQA、HumanEval、MATH 等权威评测集中,仍在初期训练中的 Yi-XLarge MoE 已经与 Claude-3-Opus、GPT4……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...。正如小扎之前宣布的,Meta囤积了越来越多的GPU,因此下一代模型将继续扩展。 对于网友们所说的,无法在家里运行Llama 3.1,这很有可能是事实。但如果进行FP8量化,依旧可以用128k的上下文窗口在单节点上运行。从另一个角...……更多
沙特主权基金旗下人工智能企业推动OpenAI开源模型落地Groq平台
...的推出旨在提供全面的人工智能服务、产品和工具;建设下一代数据中心、人工智能基础设施和云功能;以及提供先进的人工智能模型和解决方案。此外,HUMAIN还着手推动阿拉伯语大语言模型的研发。自推出以来,HUMAIN已与包括...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外,更重要的是,它揭示了大模型...……更多
Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了
...从哲学层面上讲,这也是我如此坚信在 AI 和 AR/VR 领域为下一代计算机建立开放生态系统的一个重要原因。人们常常问我是否担心因为开源 Llama 而失去技术优势,但我认为这忽略了大局,原因有以下几点:首先,为了确保我们能...……更多
Meta推出新版自研AI芯片:性能较上代提高三倍,降低对英伟达依赖
...于计算芯片,还要投资于内存带宽、网络和容量以及其他下一代硬件系统。”Meta新款MTIA芯片。来源:Meta官网据介绍,新款MTIA芯片“从根本上专注于提供计算、内存带宽和内存容量的适当平衡”。初代MTIA v1芯片采用台积电的7nm...……更多
更多关于科技的资讯:
浙江日报义乌12月3日电 (记者 拜喆喆 何贤君 共享联盟·义乌 吴峰宇) 3日,义乌今年第1亿个跨境电商进口订单完成打包
2025-12-04 08:41:00
中国科大新实验终结爱因斯坦与玻尔世纪之辩
大皖新闻讯 大皖新闻记者从中国科学技术大学获悉,该校潘建伟、陆朝阳、陈明城教授等组成的研究团队,利用光镊囚禁的量子基态单原子
2025-12-04 11:03:00
中新经纬12月4日电 “北京市场监管”微信号4日消息,为应对AI合成技术滥用风险,规范电商直播行业秩序,近日,北京市消费者协会(以下简称“北京消协”)联合京东
2025-12-04 11:06:00
用一张照片告别2025:富士胶片X-SPACE三城点亮\
2025年11月起,富士胶片影像共享空间X-SPACE于上海、南京、杭州三地先后启动年末特别企划——"影像之树"作品征集与交流活动
2025-12-04 11:49:00
《2026年中国礼品行业展望白皮书》发布“差异化”和“质价比”等关键词
2025年10月20-23日,第33届深圳礼品家居展于深圳国际会展中心举办,展会同期进行的2025中国礼业高峰论坛上,展会主办方励展华博第三次携手国际知名咨询公司凯度重磅首发《2026年中国礼品行业展望白皮书》
2025-12-04 11:55:00
中国网12月4日讯 据国家体育总局网站消息,体育总局日前印发《关于进一步推进篮球改革发展的意见》。其中提出,有序促进职业篮球开放
2025-12-04 12:16:00
长白时评评论员 刘颂寒12月1日,电视剧《家业》和制片方华策影视发文,谴责部分短剧投机取巧,擅自截取《家业》宣传物料中的创意元素“跟拍”
2025-12-04 13:48:00
近年来,智能制造产业园引导企业顺应数字化浪潮,积极落实智改数转,推动科技创新与产业创新深度融合。以南汽集团为核心的汽车产业
2025-12-04 11:20:00
储热赋能双碳 智慧引领供热 泰山集团高电压直入式电储能技术破解能源转型难题
鲁网12月4日讯在“双碳”目标深入推进、能源结构加速转型的时代背景下,电网峰谷差拉大、清洁供热需求迫切、弃风弃光资源浪费等问题成为制约绿色发展的关键瓶颈
2025-12-04 09:57:00
上海街头的数字生活指南,是城市数字品牌与公共艺术的对话
在上海,街头悄然出现的“数字城市指示牌”成为了市民与游客驻足讨论的热点。这些立体的、新颖的指示牌,是“智云上海”这个城市信息化名片的立体呈现
2025-12-04 08:17:00
摘要:随着生成式人工智能技术在各行业的广泛应用,模型输出结果的不确定性问题日益受到关注。为提高模型在关键领域的可靠性,对输出不确定性进行量化分析成为重要方向
2025-12-04 06:17:00
杭州博士后用AI让机器懂协作、更安全杭州日报讯 让机器从执行命令的“孤岛”,成为懂得协作的群体?让机器人安全走进人类生活
2025-12-04 06:38:00
12月3日从紫林醋业获悉,紫林醋业部分主导产品通过欧盟有机认证(EU Organic Certification),获准使用欧盟统一有机标识“欧洲叶标”(Euro-Leaf)
2025-12-04 07:31:00
中新经纬12月3日电 12月3日,豆包手机助手在官方微信号就“侵犯用户隐私”等问题进行回应,称不存在任何黑客行为。具体来看
2025-12-04 07:42:00
支付宝AI4SDL研发安全体系斩获首届“AI领航杯”星光金奖
12月1日-3日,由中国互联网协会主办的2025“人工智能+”产业生态大会在北京举办。开幕式上,首届“AI领航杯”“人工智能+”应用与技能大赛总决赛举行了隆重的颁奖仪式
2025-12-04 07:47:00