• 我的订阅
  • 头条热搜
超级推理模型正面对垒:谷歌版o1发布次日,OpenAI o1下一代o3登场
...新品发布活动最后一日,OpenAI宣布了“压轴大作”:o1的下一代模型o3,而且一开始就要推出两个版本,一个正式的o3,还有一个相对较小的精简版o3-mini。OpenAI的CEO Sam Altman在直播中提到,OpenAI本次12日的活动第一天官宣了上线正...……更多
OpenAI直播最后一天放出“王炸”:下一代推理模型o3亮相
...12天的技术分享直播活动的最后一天!周五,OpenAI发布了下一代的推理模型o3,这是今年早些时候发布的o1推理模型的升级版本。更准确地说,o3是一个模型系列——就像o1一样,同时有o3和o3-mini两个版本,后者是一款更小的精简...……更多
Anthropic再反击!发布Claude 3.5吊打GPT-4o,视觉、逻辑推理等方面表现更强
...就大幅改善智能、速度和成本之间的权衡曲线。除了开发下一代模型系列外,还正在开发新模式和功能,以支持更多企业用例。谈及AI安全,Anthropic强调,“模型已经过严格安全测试,且会注重保护用户隐私。除非用户明确允许...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...非常大的提升。下一步,上海AI实验室将把相关技术融入下一代书生大模型,并继续沿着通专融合发展路径,通过开源与产学研各界共同推动技术进步。InternThinker已经开启了测试使用,你可以通过下方链接测试更多有趣的题目!...……更多
专注于推理的OpenAI“草莓”模型两周内发布?是人工智能下一重大突破
...人工智能AGI又进一步。专注于推理的“草莓”可能也是为下一代AI模型“猎户座”或者说ChatGPT 5奠基的必经之路。软件开发机构Technology Rivers创始人兼CEO Ghazenfer Mansoor指出,借助“草莓”项目,OpenAI对人类推理水平的追求不仅是...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...是,此前据外媒报道,OpenAI或正考虑给“草莓”大模型或下一代旗舰模型制定更高的收费标准,最高或将达到每月2000美元。作为对比的是,目前ChatGPT Plus的收费标准是每月20美元。动荡不安的OpenAI,GPT-5何时到来?据外媒报道,...……更多
菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
... CTO曾放话说GPT-4已经达到了「聪明高中生」的智力水平,下一代模型要达到博士水平…这番言论放在众多LLM失败案例面前显得格外讽刺。 我们之所以会如此震惊于LLM在简单的推理任务上翻车,不仅仅是因为与语言任务的惨烈对...……更多
精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B
... AI 也加入了竞争。刚刚,Mistral AI 宣布其旗舰开源模型的下一代产品:Mistral Large 2,该模型拥有 1230 亿个参数,在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后,Mistral Lar……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...平台……“LiveKit很高兴能与Cerebras合作,帮助开发者构建下一代多模态AI应用。结合Cerebras的计算能力和模型以及LiveKit的全球边缘网络,所开发的语音和视频AI应用将实现超低延迟并更接近人类特征。”LiveKit公司的CEO兼联合创始...……更多
阿里云重磅升级全栈AI体系,一文看懂云栖大会技术发布
...全力打造成为全栈人工智能服务商。AI时代,大模型将是下一代操作系统,超级AI云是下一代计算机。吴泳铭认为,超级AI云需要超大规模的基础设施和全栈的技术积累,未来,全世界可能只会有5-6个超级云计算平台。阿里云将持...……更多
ASC24超算大赛启动会在京举行,大模型推理等成为赛题
...大学杰出教授杰克·唐加拉(Jack Dongarra)表示,ASC旨在激励下一代的HPC(高性能计算)科学家和工程师们,使用最前沿的技术提供创新的解决方案。ASC竞赛是世界上最大的超算竞赛,致力于培养下一代有才华的年轻优秀学生,在超算...……更多
近 日 ,DeepSeek发 布DeepSeek—V3.1,基于下一代国产芯片训练。DeepSeek—V3.1采用UE8M0FP8精度训练,可以直接在任何支持MXFP8+UE8M0的硬件上执行,能降低内存流量、提升矩阵乘法吞吐。V3.1通过软件定义与更多芯片适配,能让超低精度...……更多
百度发布深度思考大模型文心X1:性能对标R1,API调用价格减半
...而坚定的AI转型步伐,专注于发现用户真正需要和想要的下一代搜索体验。”另值得关注的是,2月25日,百度与YY逾四年的收购事项告一段落,百度收购YY的价格缩水,有超110亿元资金释放予百度,百度计划将有关释放的资金投资...……更多
DeepSeek R2没等来,R1“小升级”发布:思考时间更长,效果如何?
...得注意的是,此前有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。不...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...快。他们所采用的架构,已经可以和o1匹敌,如果更新到下一代大模型,甚至还有可能实现领先。没错,这次周鸿祎和OpenAI所采用的路线殊途同归,不谋而合了。360首创的CoE架构,已经可以媲美OpenAI o1的思维链模式。不仅在技术...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
本周(4.8-4.14)AI界发生了什么?
...新架构,解决大模型“内存”问题4月12日消息,谷歌发布下一代Transformer模型Infini-Transformer。Infini-Transformer引入了一种有效方法,可将基于 Transformer 的大语言模型拓展到无限长输入,而不增加内存和运算需求。就在4月5日,谷歌...……更多
DeepSeek发布最新NSA技术论文!创始人梁文锋参与引人注目
...,DeepSeek团队认为,业界越来越认识到长上下文建模对于下一代大型语言模型的重要性。然而,随着序列长度的增加,标准注意力机制的高复杂度成为了关键的延迟瓶颈。据了解,NSA通过高效的长序列处理能力,使模型能够直接...……更多
英特尔推出新款AI芯片:推理性能比英伟达H100快50%
...使用该芯片。当天,英特尔还分享了企业AI各细分领域的下一代产品和服务的最新信息。英特尔为面向数据中心、云和边缘发布了下一代处理器英特尔至强6。配备能效核(E-cores)的英特尔至强6处理器将于2024年第二季度推出,配...……更多
00后华裔小哥哈佛辍学组团挑战英伟达,史上最快AI芯片Sohu推理性能超H100二十倍!
...在GPU上根本不可能实现的产品。而且,它甚至比英伟达的下一代Blackwell(B200)更快、更便宜!如今最先进的AI模型,无一不是基于Transformer的,比如ChatGPT、Sora、Gmini、Stable Diffusion 3等等。如果Transformer被SSM、RWKV或……更多
一文读懂黄仁勋CES重磅发布:最新5090芯片、世界最大AI计算机、首个世界模型
...现AI,现在AI正在彻底改变GeForce。”黄仁勋由此宣布推出下一代RTX Blackwell系列,即基于Blackwell架构的GeForce RTX 50系列。黄仁勋称这款GPU“就像一个怪兽”,有920亿个晶体管,每秒4000万亿次AI运算,比上一代Ada高出三倍。每秒380万...……更多
谷歌和微软两位“印度老乡”CEO,正面硬刚
...布的大模型Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等。谷歌官方称“这是Bard自推出以来最大的升级”。Gemini Nano被称为“端侧任务最高效的模型”,Android开发者可以通过AICore来使用。据悉AICore是Android 14 ...……更多
亚马逊连甩6款大模型!推出3nm AI训练芯片,最强AI服务器算力爆表
...与AWS共同构建面向机器学习训练的世界最大计算集群,其下一代Claude大模型将在拥有数十万颗Trainium2芯片的集群上进行训练。总体来看,AWS的计算、存储、数据库、AI推理,四大板块都迎来一大波重要更新。一、全新自研大模型A...……更多
李彦宏再谈开源:开源模型是智商税,永远应该选择闭源模型
...的技术人员、需要很多算力、需要很多数据,才能训练出下一代大模型,我们还可能需要下下一代、下下下一代的大模型。所以最终我觉得大家是要去拼谁的技术更好,你的技术好,你为客户产生了更好的价值。今天之所以把这...……更多
零一万物Yi-1.5来了,国产开源大模型排行榜再次刷新
...的性能。 在发布会上,李开复还宣布,零一万物已启动下一代 Yi-XLarge MoE 模型训练,将冲击 GPT-5 的性能与创新性。从 MMLU、GPQA、HumanEval、MATH 等权威评测集中,仍在初期训练中的 Yi-XLarge MoE 已经与 Claude-3-Opus、GPT4……更多
Llama 4训练已开启!Meta科学家最新采访,揭秘Llama 3.1是如何炼成的
...。正如小扎之前宣布的,Meta囤积了越来越多的GPU,因此下一代模型将继续扩展。 对于网友们所说的,无法在家里运行Llama 3.1,这很有可能是事实。但如果进行FP8量化,依旧可以用128k的上下文窗口在单节点上运行。从另一个角...……更多
沙特主权基金旗下人工智能企业推动OpenAI开源模型落地Groq平台
...的推出旨在提供全面的人工智能服务、产品和工具;建设下一代数据中心、人工智能基础设施和云功能;以及提供先进的人工智能模型和解决方案。此外,HUMAIN还着手推动阿拉伯语大语言模型的研发。自推出以来,HUMAIN已与包括...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外,更重要的是,它揭示了大模型...……更多
Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了
...从哲学层面上讲,这也是我如此坚信在 AI 和 AR/VR 领域为下一代计算机建立开放生态系统的一个重要原因。人们常常问我是否担心因为开源 Llama 而失去技术优势,但我认为这忽略了大局,原因有以下几点:首先,为了确保我们能...……更多
Meta推出新版自研AI芯片:性能较上代提高三倍,降低对英伟达依赖
...于计算芯片,还要投资于内存带宽、网络和容量以及其他下一代硬件系统。”Meta新款MTIA芯片。来源:Meta官网据介绍,新款MTIA芯片“从根本上专注于提供计算、内存带宽和内存容量的适当平衡”。初代MTIA v1芯片采用台积电的7nm...……更多
更多关于科技的资讯:
一句话、一张图,共绘古祠新名片!陈家祠商圈标识及宣传语邀您来设计
为提升陈家祠商圈品牌形象与文化内涵,扩大商圈影响力,进一步彰显岭南文化商圈特色,打造文化消费新地标,现面向全社会公开征集陈家祠商圈标识(LOGO)及宣传语
2025-12-12 09:23:00
晚上6点半,杭州遥望科技大楼的直播间里,灯光亮如白昼。小五对着镜子最后检查了一下妆容,深吸一口气,走向镜头。五年前,她站在黑龙江齐齐哈尔的寒风中
2025-12-12 08:08:00
如果未来的高速公路能像人一样“思考”,预判几公里外的风险;如果跨海大桥有“专属医生”,能飞檐走壁进行体检;如果服务区不再只是简简单单的驿站
2025-12-12 08:09:00
河北新闻网讯(杨春辉)如何深化信贷业务专业化能力,推动一线员工全面掌握产品体系与营销策略,从而为“一池两新万企”行动提供坚实支撑
2025-12-12 06:53:00
12月10日-12日,由浙江传媒学院主办、浙江传媒学院实践教学与艺术创作中心协办的 “剧想天开”——《儿童剧人物造型设计创新人才培训》成果展在杭州时尚中心正式展出
2025-12-12 07:07:00
站在4K摄像机前,主播“俍一”落落大方,此刻她站在演播室里,但直播间的观众们看到的却是由AI实时生成的背景。这样的场景在以前是不可想象的
2025-12-12 07:08:00
家电业创新驱动拓蓝海
家电业正朝着绿色、智能化方向升级,既精准匹配消费者需求,也开拓了市场新空间从电视、冰箱、洗衣机的传统“三大件”到智慧互联
2025-12-12 07:14:00
今年“双12”,南京企业捧出主题多元、内容丰富的促消费活动,推动消费市场提质扩容据悉,今年南京将“双12”作为南京市“四季有约·暖冬跨年庆”促消费活动的重要节点
2025-12-12 07:14:00
在直播间买了商品退货难、赔付慢等情况一直是困扰消费者的难题,临近“双12”,由杭州高新区(滨江)市场监管局联合辖区内头部直播电商企业共同起草的团体标准《放心消费直播间管理与运营规范》(以下简称《规范》)正式发布
2025-12-12 07:38:00
鲁网12月11日讯近日,建设银行泰安分行高效推进网点服务数字化转型,顺利完成泰安花园支行、新泰向阳支行、新汶翟镇支行、东平白佛山支行等4家网点的排队机轻量化叫号模式试点改造
2025-12-11 14:40:00
意大利ICA意卡亮相大湾区设计论坛:以色彩、技术与资源,赋能设计师
2025年广州设计周于12月5日至8日盛大开幕,在广州保利世贸博览馆、广州国际采购中心及海珠国际会展中心三馆共18个展厅同时举行
2025-12-11 14:53:00
苏大课堂来了位虚拟数字人老师
近日,在苏州大学传媒学院副教授程曦的《新媒体运营》课堂上,迎来了一位与她外型一模一样的虚拟数字人老师,只要是关于课程中的问题
2025-12-11 14:57:00
中新经纬12月11日电 11日,“网信中国”微信号发布汽车行业网络乱象专项整治行动公开曝光第二批典型案例。近期,国家网信办会同工业和信息化部等部门持续开展汽车行业网络乱象专项整治行动
2025-12-11 15:10:00
鲁网12月11日讯走进建行青岛市分行瞿塘峡路支行,大堂经理正俯身协助客户核对账单、同步讲解线上查询技巧;城阳支行营业部里
2025-12-11 15:17:00
【儒商风采】德州市恩锋企业管理咨询有限公司董事长李媛媛:先做朋友,再做生意
鲁网12月11日讯(记者 赵洪斌 通讯员 赵慧)“让一个企业家在半小时内,向陌生人交底,说出自己公司的核心难题——这事儿
2025-12-11 15:17:00