下一代,推理,正面,模型,模型,测试头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...新品发布活动最后一日，OpenAI宣布了“压轴大作”：o1的下一代模型o3，而且一开始就要推出两个版本，一个正式的o3，还有一个相对较小的精简版o3-mini。OpenAI的CEO Sam Altman在直播中提到，OpenAI本次12日的活动第一天官宣了上线正...……更多

2024-12-21 09:15:00下一代,推理,正面,模型,模型,测试

OpenAI直播最后一天放出“王炸”：下一代推理模型o3亮相

...12天的技术分享直播活动的最后一天！周五，OpenAI发布了下一代的推理模型o3，这是今年早些时候发布的o1推理模型的升级版本。更准确地说，o3是一个模型系列——就像o1一样，同时有o3和o3-mini两个版本，后者是一款更小的精简...……更多

2024-12-21 17:02:00下一代,推理,模型,直播,模型,推理

Anthropic再反击！发布Claude 3.5吊打GPT

...就大幅改善智能、速度和成本之间的权衡曲线。除了开发下一代模型系列外，还正在开发新模式和功能，以支持更多企业用例。谈及AI安全，Anthropic强调，“模型已经过严格安全测试，且会注重保护用户隐私。除非用户明确允许...……更多

2024-06-21 11:50:00逻辑推理,推理,逻辑,视觉,方面,模型

上海AI实验室版o1已上线！数学题、Leetcode全拿下，

...非常大的提升。下一步，上海AI实验室将把相关技术融入下一代书生大模型，并继续沿着通专融合发展路径，通过开源与产学研各界共同推动技术进步。InternThinker已经开启了测试使用，你可以通过下方链接测试更多有趣的题目！...……更多

2024-11-29 09:27:00数学题,上海,实验室,实验,数学,模型

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...人工智能AGI又进一步。专注于推理的“草莓”可能也是为下一代AI模型“猎户座”或者说ChatGPT 5奠基的必经之路。软件开发机构Technology Rivers创始人兼CEO Ghazenfer Mansoor指出，借助“草莓”项目，OpenAI对人类推理水平的追求不仅是...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

又慢又贵？OpenAI推理模型“草莓”来了，GPT-5还有多

...是，此前据外媒报道，OpenAI或正考虑给“草莓”大模型或下一代旗舰模型制定更高的收费标准，最高或将达到每月2000美元。作为对比的是，目前ChatGPT Plus的收费标准是每月20美元。动荡不安的OpenAI，GPT-5何时到来？据外媒报道，...……更多

2024-09-13 15:28:00多远,推理,草莓,模型,模型,思维

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Cl

... CTO曾放话说GPT-4已经达到了「聪明高中生」的智力水平，下一代模型要达到博士水平…这番言论放在众多LLM失败案例面前显得格外讽刺。我们之所以会如此震惊于LLM在简单的推理任务上翻车，不仅仅是因为与语言任务的惨烈对...……更多

2024-07-01 08:58:00菲尔,得主,难题,经典,农夫,模型

精准狙击Llama 3.1？Mistral AI开源Larg

... AI 也加入了竞争。刚刚，Mistral AI 宣布其旗舰开源模型的下一代产品：Mistral Large 2，该模型拥有 1230 亿个参数，在代码生成、数学、推理等方面与 OpenAI 和 Meta 的最新尖端模型不相上下。紧随 Llama 3.1 405B 之后，Mistral Lar……更多

2024-07-26 09:36:00模型,基准,多语,测试,性能,生成

比GPU性价比高百倍！Cerebras推出新AI推理服务，号

...平台……“LiveKit很高兴能与Cerebras合作，帮助开发者构建下一代多模态AI应用。结合Cerebras的计算能力和模型以及LiveKit的全球边缘网络，所开发的语音和视频AI应用将实现超低延迟并更接近人类特征。”LiveKit公司的CEO兼联合创始...……更多

2024-08-29 09:49:00性价比高,推理,性价比,全球,服务,推理

阿里云重磅升级全栈AI体系，一文看懂云栖大会技术发布

...全力打造成为全栈人工智能服务商。AI时代，大模型将是下一代操作系统，超级AI云是下一代计算机。吴泳铭认为，超级AI云需要超大规模的基础设施和全栈的技术积累，未来，全世界可能只会有5-6个超级云计算平台。阿里云将持...……更多

2025-09-24 13:30:00一文,阿里,重磅,体系,大会,升级

ASC24超算大赛启动会在京举行，大模型推理等成为赛题

...大学杰出教授杰克·唐加拉(Jack Dongarra)表示，ASC旨在激励下一代的HPC(高性能计算)科学家和工程师们，使用最前沿的技术提供创新的解决方案。ASC竞赛是世界上最大的超算竞赛，致力于培养下一代有才华的年轻优秀学生，在超算...……更多

2024-01-07 19:35:00启动会,推理,模型,大赛,模型,上海大学

AI正加速迈进应用落地关键期

近日，DeepSeek发布DeepSeek—V3.1，基于下一代国产芯片训练。DeepSeek—V3.1采用UE8M0FP8精度训练，可以直接在任何支持MXFP8+UE8M0的硬件上执行，能降低内存流量、提升矩阵乘法吞吐。V3.1通过软件定义与更多芯片适配，能让超低精度...……更多

2025-08-27 09:14:00关键期,落地,关键,应用,国产,精度

百度发布深度思考大模型文心X1：性能对标R1，API调用价格

...而坚定的AI转型步伐，专注于发现用户真正需要和想要的下一代搜索体验。”另值得关注的是，2月25日，百度与YY逾四年的收购事项告一段落，百度收购YY的价格缩水，有超110亿元资金释放予百度，百度计划将有关释放的资金投资...……更多

2025-03-16 11:07:00文心,深度,模型,性能,价格,文心

DeepSeek R2没等来，R1“小升级”发布：思考时间更

...得注意的是，此前有传言称，深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。有报道称，DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE)，其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。不...……更多

2025-05-29 15:55:00效果,升级,时间,模型,升级,版本

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

...快。他们所采用的架构，已经可以和o1匹敌，如果更新到下一代大模型，甚至还有可能实现领先。没错，这次周鸿祎和OpenAI所采用的路线殊途同归，不谋而合了。360首创的CoE架构，已经可以媲美OpenAI o1的思维链模式。不仅在技术...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

全球最强开源大模型Llama 3发布：使用15T数据预训练，

就在刚刚，Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍，Llama 3 在 24K GPU 集群上训练，使用了 15T 的数据，提供了 8B 和 70B 的预训练和指令微调版本，可以支持广泛的应用。同时，Llama 3 在广泛的行业...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

本周（4.8-4.14）AI界发生了什么？

...新架构，解决大模型“内存”问题4月12日消息，谷歌发布下一代Transformer模型Infini-Transformer。Infini-Transformer引入了一种有效方法，可将基于 Transformer 的大语言模型拓展到无限长输入，而不增加内存和运算需求。就在4月5日，谷歌...……更多

2024-04-14 20:33:00模型,特斯,马斯,芯片,融资,英特

DeepSeek发布最新NSA技术论文！创始人梁文锋参与引人

...，DeepSeek团队认为，业界越来越认识到长上下文建模对于下一代大型语言模型的重要性。然而，随着序列长度的增加，标准注意力机制的高复杂度成为了关键的延迟瓶颈。据了解，NSA通过高效的长序列处理能力，使模型能够直接...……更多

2025-02-19 12:26:00文锋,技术论文,创始人,论文,技术,推理

英特尔推出新款AI芯片：推理性能比英伟达H100快50%

...使用该芯片。当天，英特尔还分享了企业AI各细分领域的下一代产品和服务的最新信息。英特尔为面向数据中心、云和边缘发布了下一代处理器英特尔至强6。配备能效核（E-cores）的英特尔至强6处理器将于2024年第二季度推出，配...……更多

2024-04-10 10:52:00英特,英特尔,英伟,能比,推理,芯片

00后华裔小哥哈佛辍学组团挑战英伟达，史上最快AI芯片Soh

...在GPU上根本不可能实现的产品。而且，它甚至比英伟达的下一代Blackwell（B200）更快、更便宜！如今最先进的AI模型，无一不是基于Transformer的，比如ChatGPT、Sora、Gmini、Stable Diffusion 3等等。如果Transformer被SSM、RWKV或……更多

2024-06-27 09:25:00小哥,英伟,哈佛,华裔,推理,芯片

一文读懂黄仁勋CES重磅发布：最新5090芯片、世界最大AI

...现AI，现在AI正在彻底改变GeForce。”黄仁勋由此宣布推出下一代RTX Blackwell系列，即基于Blackwell架构的GeForce RTX 50系列。黄仁勋称这款GPU“就像一个怪兽”，有920亿个晶体管，每秒4000万亿次AI运算，比上一代Ada高出三倍。每秒380万...……更多

2025-01-07 19:00:00一文,世界,重磅,芯片,模型,计算机

谷歌和微软两位“印度老乡”CEO，正面硬刚

...布的大模型Bard将使用Gemini Pro的微调版本来进行更高级的推理、规划和理解等。谷歌官方称“这是Bard自推出以来最大的升级”。Gemini Nano被称为“端侧任务最高效的模型”，Android开发者可以通过AICore来使用。据悉AICore是Android 14 ...……更多

2023-12-08 16:29:00印度,微软,老乡,正面,模型,微软

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...与AWS共同构建面向机器学习训练的世界最大计算集群，其下一代Claude大模型将在拥有数十万颗Trainium2芯片的集群上进行训练。总体来看，AWS的计算、存储、数据库、AI推理，四大板块都迎来一大波重要更新。一、全新自研大模型A...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

李彦宏再谈开源：开源模型是智商税，永远应该选择闭源模型

...的技术人员、需要很多算力、需要很多数据，才能训练出下一代大模型，我们还可能需要下下一代、下下下一代的大模型。所以最终我觉得大家是要去拼谁的技术更好，你的技术好，你为客户产生了更好的价值。今天之所以把这...……更多

2024-07-31 16:00:00模型,李彦,智商,选择,模型,李彦

低成本可溯源！类chatgpt小冰链测试体验

...Demo不是ChatGPT这种对话大模型，是利用大模型技术，实现下一代的控制中枢。通俗来讲，小冰链展示的不只是“聊天”，而是在“逻辑思维”驱动下的“下一代行动中枢”，能影响数字和物理世界。小冰链所解决的问题包括：解...……更多

2023-02-21 12:06:00成本,体验,测试,能力,逻辑,模型

零一万物Yi-1.5来了，国产开源大模型排行榜再次刷新

...的性能。在发布会上，李开复还宣布，零一万物已启动下一代 Yi-XLarge MoE 模型训练，将冲击 GPT-5 的性能与创新性。从 MMLU、GPQA、HumanEval、MATH 等权威评测集中，仍在初期训练中的 Yi-XLarge MoE 已经与 Claude-3-Opus、GPT4……更多

2024-05-14 09:56:00万物,模型,国产,再次,排行榜,模型