• 我的订阅
  • 头条热搜
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
...新品发布活动最后一日,OpenAI宣布了“压轴大作”:o1的下一代模型o3,而且一开始就要推出两个版本,一个正式的o3,还有一个相对较小的精简版o3-mini。OpenAI的CEO Sam Altman在直播中提到,OpenAI本次12日的活动第一天官宣了上线正...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...12天的技术分享直播活动的最后一天!周五,OpenAI发布了下一代的推理模型o3,这是今年早些时候发布的o1推理模型的升级版本。更准确地说,o3是一个模型系列——就像o1一样,同时有o3和o3-mini两个版本,后者是一款更小的精简...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...就大幅改善智能、速度和成本之间的权衡曲线。除了开发下一代模型系列外,还正在开发新模式和功能,以支持更多企业用例。谈及AI安全,Anthropic强调,“模型已经过严格安全测试,且会注重保护用户隐私。除非用户明确允许...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...非常大的提升。下一步,上海AI实验室将把相关技术融入下一代书生大模型,并继续沿着通专融合发展路径,通过开源与产学研各界共同推动技术进步。InternThinker已经开启了测试使用,你可以通过下方链接测试更多有趣的题目!...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...人工智能AGI又进一步。专注于推理的“草莓”可能也是为下一代AI模型“猎户座”或者说ChatGPT 5奠基的必经之路。软件开发机构Technology Rivers创始人兼CEO Ghazenfer Mansoor指出,借助“草莓”项目,OpenAI对人类推理水平的追求不仅是...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...是,此前据外媒报道,OpenAI或正考虑给“草莓”大模型或下一代旗舰模型制定更高的收费标准,最高或将达到每月2000美元。作为对比的是,目前ChatGPT Plus的收费标准是每月20美元。动荡不安的OpenAI,GPT-5何时到来?据外媒报道,...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
... CTO曾放话说GPT-4已经达到了「聪明高中生」的智力水平,下一代模型要达到博士水平…这番言论放在众多LLM失败案例面前显得格外讽刺。 我们之所以会如此震惊于LLM在简单的推理任务上翻车,不仅仅是因为与语言任务的惨烈对...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
... AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后,Mistral Lar……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...平台……“LiveKit很高兴能与Cerebras合作,帮助开发者构建下一代多模态AI应用。结合Cerebras的计算能力和模型以及LiveKit的全球边缘网络,所开发的语音和视频AI应用将实现超低延迟并更接近人类特征。”LiveKit公司的CEO兼联合创始...……更多
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...全力打造成为全栈人工智能服务商。AI时代,大模型将是下一代操作系统,超级AI云是下一代计算机。吴泳铭认为,超级AI云需要超大规模的基础设施和全栈的技术积累,未来,全世界可能只会有5-6个超级云计算平台。阿里云将持...……更多
ASC24超算大赛启动会在京举行,大模型推理等成为赛题
...大学杰出教授杰克·唐加拉(Jack Dongarra)表示,ASC旨在激励下一代的HPC(高性能计算)科学家和工程师们,使用最前沿的技术提供创新的解决方案。ASC竞赛是世界上最大的超算竞赛,致力于培养下一代有才华的年轻优秀学生,在超算...……更多
近 日 ,DeepSeek发 布DeepSeek—V3.1,基于下一代国产芯片训练。DeepSeek—V3.1采用UE8M0FP8精度训练,可以直接在任何支持MXFP8+UE8M0的硬件上执行,能降低内存流量、提升矩阵乘法吞吐。V3.1通过软件定义与更多芯片适配,能让超低精度...……更多
百度发布深度思考大模型文心X1:性能对标R1,API调用价格减半
...而坚定的AI转型步伐,专注于发现用户真正需要和想要的下一代搜索体验。”另值得关注的是,2月25日,百度与YY逾四年的收购事项告一段落,百度收购YY的价格缩水,有超110亿元资金释放予百度,百度计划将有关释放的资金投资...……更多
DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?
...得注意的是,此前有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。不...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...快。他们所采用的架构,已经可以和o1匹敌,如果更新到下一代大模型,甚至还有可能实现领先。没错,这次周鸿祎和OpenAI所采用的路线殊途同归,不谋而合了。360首创的CoE架构,已经可以媲美OpenAI o1的思维链模式。不仅在技术...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
本周(4.8-4.14)AI界发生了什么?
...新架构,解决大模型“内存”问题4月12日消息,谷歌发布下一代Transformer模型Infini-Transformer。Infini-Transformer引入了一种有效方法,可将基于 Transformer 的大语言模型拓展到无限长输入,而不增加内存和运算需求。就在4月5日,谷歌...……更多
DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目
...,DeepSeek团队认为,业界越来越认识到长上下文建模对于下一代大型语言模型的重要性。然而,随着序列长度的增加,标准注意力机制的高复杂度成为了关键的延迟瓶颈。据了解,NSA通过高效的长序列处理能力,使模型能够直接...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...使用该芯片。当天,英特尔还分享了企业AI各细分领域的下一代产品和服务的最新信息。英特尔为面向数据中心、云和边缘发布了下一代处理器英特尔至强6。配备能效核(E-cores)的英特尔至强6处理器将于2024年第二季度推出,配...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...在GPU上根本不可能实现的产品。而且,它甚至比英伟达的下一代Blackwell(B200)更快、更便宜!如今最先进的AI模型,无一不是基于Transformer的,比如ChatGPT、Sora、Gmini、Stable Diffusion 3等等。如果Transformer被SSM、RWKV或……更多
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...现AI,现在AI正在彻底改变GeForce。”黄仁勋由此宣布推出下一代RTX Blackwell系列,即基于Blackwell架构的GeForce RTX 50系列。黄仁勋称这款GPU“就像一个怪兽”,有920亿个晶体管,每秒4000万亿次AI运算,比上一代Ada高出三倍。每秒380万...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...布的大模型Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等。谷歌官方称“这是Bard自推出以来最大的升级”。Gemini Nano被称为“端侧任务最高效的模型”,Android开发者可以通过AICore来使用。据悉AICore是Android 14 ...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...与AWS共同构建面向机器学习训练的世界最大计算集群,其下一代Claude大模型将在拥有数十万颗Trainium2芯片的集群上进行训练。总体来看,AWS的计算、存储、数据库、AI推理,四大板块都迎来一大波重要更新。一、全新自研大模型A...……更多
李彦宏再谈开源:开源模型是智商税,永远应该选择闭源模型
...的技术人员、需要很多算力、需要很多数据,才能训练出下一代大模型,我们还可能需要下下一代、下下下一代的大模型。所以最终我觉得大家是要去拼谁的技术更好,你的技术好,你为客户产生了更好的价值。今天之所以把这...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...的性能。 在发布会上,李开复还宣布,零一万物已启动下一代 Yi-XLarge MoE 模型训练,将冲击 GPT-5 的性能与创新性。从 MMLU、GPQA、HumanEval、MATH 等权威评测集中,仍在初期训练中的 Yi-XLarge MoE 已经与 Claude-3-Opus、GPT4……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...。正如小扎之前宣布的,Meta囤积了越来越多的GPU,因此下一代模型将继续扩展。 对于网友们所说的,无法在家里运行Llama 3.1,这很有可能是事实。但如果进行FP8量化,依旧可以用128k的上下文窗口在单节点上运行。从另一个角...……更多
沙特主权基金旗下人工智能企业推动OpenAI开源模型落地Groq平台
...的推出旨在提供全面的人工智能服务、产品和工具;建设下一代数据中心、人工智能基础设施和云功能;以及提供先进的人工智能模型和解决方案。此外,HUMAIN还着手推动阿拉伯语大语言模型的研发。自推出以来,HUMAIN已与包括...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外,更重要的是,它揭示了大模型...……更多
Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了
...从哲学层面上讲,这也是我如此坚信在 AI 和 AR/VR 领域为下一代计算机建立开放生态系统的一个重要原因。人们常常问我是否担心因为开源 Llama 而失去技术优势,但我认为这忽略了大局,原因有以下几点:首先,为了确保我们能...……更多
Meta推出新版自研AI芯片:性能较上代提高三倍,降低对英伟达依赖
...于计算芯片,还要投资于内存带宽、网络和容量以及其他下一代硬件系统。”Meta新款MTIA芯片。来源:Meta官网据介绍,新款MTIA芯片“从根本上专注于提供计算、内存带宽和内存容量的适当平衡”。初代MTIA v1芯片采用台积电的7nm...……更多
更多关于科技的资讯:
从榨菜月饼到榨菜咖啡,乌江榨菜以创新打破品类边界
近年来,伴随区域化、特色化产品的迅速增长,各大品牌在深耕主业的同时也开始积极探索新赛道、新领域。乌江榨菜作为涪陵榨菜集团旗下的核心品牌
2025-09-29 08:03:00
华北首家!多美卡品牌专卖店登陆北京玩具反斗城
[北京] – 继中国首家多美卡品牌专卖店入驻玩具反斗城上海南丰城店并成功引爆小车收藏热潮后,玩具反斗城(Toys“R”Us)与多美(TAKARA TOMY)的战略合作再结硕果
2025-09-29 07:33:00
南报网讯(记者张甜甜)10月2日至3日,由南京报业传媒集团旗下南报优选供应链公司主办的首届紫金山国潮漫文化嘉年华,将在南京国际展览中心举办
2025-09-29 07:42:00
9月26日,购在中国(山西站)暨中石化易捷第八届易享节在我市启动,诸多三晋名特优产品将陆续入驻中石化易捷,走向全国。今后
2025-09-28 08:20:00
刚刚闭幕的长春航空展上,“净月号”成瞩目焦点
9月23日,长春航空展圆满闭幕,“净月号”凭借其震撼的实体造型与深厚的文化内涵,成为展会瞩目的焦点。这艘承载中式太空梦想的“星舰”
2025-09-28 10:07:00
为更好的服务广大客户,富德生命人寿安平支公司积极组织员工开展《产品健康增值服务》培训。培训中,讲师细致讲解公司产品健康增值服务
2025-09-28 10:12:00
河北新闻网讯(王丽英)9月24日至25日,宁晋县晶龙集团举行人力资源专业培训,内训师靳桂峰、王素峰和张晓宁分别围绕工伤保险及识人辨人
2025-09-28 10:18:00
美团Keeta上线阿联酋!40天连开3国,国际化全速推进
当地时间9月27日上午11点,美团旗下国际外卖品牌Keeta正式在阿联酋迪拜启动运营,这是Keeta继8月上线卡塔尔、9月上线科威特后
2025-09-28 10:22:00
小米17系列9月27日开售,卢伟冰称ProMax需求远超预期,已安排快速提拉生产
9月27日上午10点,小米17系列开售,价格4499元起!并全系首发第五代骁龙 8 至尊版。据悉,小米17尺寸6.3,7000mAh 电池
2025-09-28 10:22:00
齐鲁晚报·齐鲁壹点 王会广 通讯员 李杰在数字经济蓬勃发展的当下,大数据、云计算、物联网、移动互联网、人工智能以及区块链等新兴技术的广泛应用
2025-09-28 10:56:00
实时互动x高效制播:佳能携手《密室大逃脱大神版 互动直播》真人秀实现制作新范式
在直播与正片并行制作逐渐成为综艺内容生产新常态的当下,真人秀现场对影像系统的要求不断提升:既要满足直播的即时输出,又要兼顾正片制作的高质量成片
2025-09-28 11:51:00
齐鲁晚报·齐鲁壹点菏泽光影在线摄影摄像实战培训班11月初开启
从“拍摄小白”到“拍摄大神”,你只差这一套实战课!齐鲁晚报(光影在线实战培训)告别“自动挡”,用镜头讲故事。这是一个视觉统治注意力的时代
2025-09-28 12:03:00
烟台银行威海荣成支行“金融+”开辟服务新路径
近日,烟台银行荣成支行通过创新推出的“智慧物业”合作解决方案,成功为当地多家物业公司纾困解难,有效破解了长期困扰行业发展的收费难
2025-09-28 12:05:00
莫林酒店洛阳首店落子!完善文旅服务补中高端住宿
作为中国第一古刹,洛阳白马寺的文旅热度在 2025 年暑期再攀新高 —— 日均接待游客超 8000 人次,35 元亲民票价搭配免费斋饭政策
2025-09-28 12:22:00
国庆车票开抢第三天,在全网“开票即候补”的声音中,假期出行的火热程度可见一斑。而且今年又是一次中秋假期叠加国庆假期,连续八天假
2025-09-28 12:22:00