下一代,推理,正面,模型,模型,测试头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

人类和AI在推理任务中的表现相似，Google DeepMind研究揭示AI局限性

...人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

去太空训练AI大模型，24小时太阳能供电的GPU明年上天

...然后是可扩展性。轨道数据中心将解锁地球上前所未见的下一代集群规模，发电量将远超 GW 范围。它们可以几乎无限地线性扩展，不受地面项目的物理和规划限制，可以在 3D 空间的各个方向上扩展。如果按照大模型领域目前的...……更多

2024-09-06 10:01:00太阳能,供电,模型,训练,小时,太阳

DeepSeek开源周才第二天有些公司就已经坐不住了

...了。号称他们迄今为止最聪明的 Claude 3.7 Sonnet ，还是个推理模型和传统模型的 “ 混血 ” 。我估计今天那些专门做模型测评的博主，都快要忙不过来了吧。。。再加上 Grok 3 、 DeepSeek R1 、 o3 mini ，世超猜到了今年推理模型必有...……更多

2025-02-26 08:04:00二天,公司,模型,推理,阿里,通义

阿里巴巴“AI驱动”战略提速夸克发布自研大模型

...里巴巴集团CEO吴泳铭预判，在可见的未来，会有更智能的下一代产品进入人们的生活，AI助理会无处不在，成为每个人工作、生活、学习中的助手。“AI时代已经来临，大模型应用的全新体验临界点近在咫尺。”阿里巴巴智能信...……更多

2023-11-14 16:05:00夸克,阿里巴巴,阿里,提速,模型,驱动

NPU IP累计出货超1亿颗！芯原股份一站式AI解决方案揭秘

...plet构建云端高性能AIGC方案；也能够满足基于Chiplet技术的下一代可扩展高性能自动驾驶芯片设计需求，利用超高算力在边缘端运行大模型。同时，芯原还提供了完整的软件解决方案，可以满足推理、训练和数据通信需求。在此次...……更多

2024-06-14 11:39:00解决方案,股份,方案,芯片,模型,处理器

阿里CEO吴泳铭：AI计算正在加速演进，成为计算体系的主导

...超过690万开发者。这一切才刚刚开始，要实现真正的AGI，下一代模型需要具备更大规模、更通用、更泛化的知识体系，同时也将具备更复杂更多层次的逻辑推理能力。全世界先进模型竞争的投入门槛，将达到数十亿、数百亿美金...……更多

2024-09-19 13:53:00阿里,主导,体系,正在,世界,模型

对着3个中国AI大模型，两个美国科技界大佬深聊了半小时

...前AI行业快速发展，竞争也越来越激烈，特别是各种高级推理模型之间的竞争。过去一段时间，中国科技公司陆续发布了3款自研的AI模型，分别是DeepSeek（深度求索）的Deepseek R1、阿里巴巴的Marco-1以及香港中文大学与商汤科技的...……更多

2024-12-04 09:48:00大佬,科技界,美国,模型,两个,小时

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

科学家推出大模型数据集，涵盖奥赛数学题，有望让AI辅导数学课

...解决复杂数学问题的能力。通过此，他们不仅提高了算法推理速度，还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100，也更加符合算法在复杂数学问题下的评价场景。目前，赵子龙的合作者正在基于本次成果开...……更多

2024-03-13 10:26:00数学,数学题,科学家,模型,辅导,课程

成本不到150元！26分钟训出个推理模型媲美o1和R1

成本不到150元，训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型？！这不是洋葱新闻，而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作：s1。在数学和编程能力的评测集上，s1的表现比肩Dee...……更多

2025-02-07 15:14:00推理,模型,成本,模型,团队,推理

东方财富金融AI大突破，「妙想」助理重磅发布

前言11月30日，东方财富在2024风云际会上正式发布下一代智能金融终端——妙想投研助理（以下简称妙想）。东方财富首席科学家、AI总监曹巍博士在大会上提到，基于推理强化与多信源分析，妙想对金融业务拥有更深层次的理...……更多

2024-12-04 11:46:00妙想,重磅,助理,突破,财富,金融

库克现身上海首次谈及AI话题，苹果真急了

人工智能(AI)巨头OpenAI的自研芯片和下一代大模型GPT-5又有了新进展。当地时间3月19日，据The Business Insider援引匿名知情人士的消息，OpenAI公司正计划筹备在今年年中推出GPT-5预计时间是夏季。这一新一代模型的性能大幅提升，有...……更多

2024-03-21 11:37:00库克,上海,苹果,话题,奥特,奥特曼

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

Hugging Face发布SmolVLM开源 AI 模型：

...lVLM AI 视觉语言模型（VLM），仅有 20 亿参数，用于设备端推理，凭借其极低的内存占用在同类模型中脱颖而出。官方表示 SmolVLM AI 模型的优点在于体积小、速度快、内存高效，并且完全开源，所有模型检查点、VLM 数据集、训练...……更多

2024-11-28 09:47:00推理,模型,参数,模型,吞吐量,吞吐

交通类 AI 项目预演阶段，本地化部署的一些新思路

...模型；资源调度类：还有团队在考虑利用DeepSeek的深度推理能力，对历史流量、天气、事件等多源数据进行融合分析，开发出大模型能够动态地优化信号灯控制策略，提升路口通行效率和交通资源利用率。这其中，报告生成类...……更多

2025-04-24 18:00:00思路,阶段,交通,项目,模型,交通

唯一全国产算力训练！讯飞星火深度推理模型X1正式发布：多项指

...天的新品发布会上，科大讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1，这也是目前唯一一个全国产算力上训练的深度推理模型。据介绍，与通用大模型相比，X1的解题过程更接近人类的“慢思考”方式，并且...……更多

2025-01-15 10:24:00讯飞,星火,推理,深度,模型,指标

新视角设计下一代时序基础模型，Salesforce推出Moi

...究者以模型专家化这一全新视角作为抓手，设计并提出了下一代时序预测基础模型 Moirai-MoE。该模型将模型专业化设计在 token 这一细粒度运行，并且以完全自动的数据驱动模式对其赋能。模型性能方面，不同于仅在少量数据集上...……更多

2024-11-01 09:27:00时序,下一代,视角,模型,基础,设计

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...类模型低 75%。端侧友好：量化后端侧内存仅占 6 GB；端侧推理速度高达 18 tokens/s，相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理；且支持多种语言。统一高清框架，高效能力一拖三：小钢炮的传统优势 OCR 能力延...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

英伟达推出新一代ai芯片，预计今年晚些时候发货

...能，而不是在云服务器上运行。此外，英伟达还宣布推出下一代人工智能超级计算机，发布6G研究云平台，以推进无线通信技术。英伟达推出的新一代AI芯片Blackwell，名为GB200，将于今年晚些时候发货。Blackwell平台拥有六项革命性...……更多

2024-03-20 01:28:00英伟,新一代,芯片,时候,英伟,运行

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

...据具体询问的内容，模型只会激活不同的专家子模块进行推理，在吞吐量一定的情况下，可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本，简而言之就是更好的使用体验和性价比。根据xAI公布...……更多

2024-08-13 09:50:00马斯,马斯克,测试版,路线,测试,模型

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...的 agent，是关键的一步。而这篇论文就重点研究了扩展「推理期计算」（inference-time computation）这个问题。研究团队分析了扩展测试时计算的两种主要机制：（1）针对密集的、基于过程的验证器奖励模型进行搜索；（2）根据测...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

国产GPU万卡集群终于来了！摩尔线程CEO张建中：做难而正确

...换机芯片来搭建集群，后期也会考虑与合作伙伴共同研发下一代大规模交换机，持续发展卡间通信。在框架和算法层面，夸娥万卡集群支持多种自适应混合并行策略与高效显存优化，可根据应用负载选择并自动配置最优的并行...……更多

2024-07-09 09:47:00摩尔,张建中,万卡,张建,集群,线程

360智脑7b参数模型采用3.4万亿tokens训练

...AMBADA，考察的能力包括自然语言理解、知识、数学计算和推理、代码生成、逻辑推理等。其中360模型在四个评测数据集上达到第一，平均分为第三。在LongBench（多任务、中英双语、针对大语言模型长文本理解能力的评测基准）测...……更多

2024-04-14 01:04:00模型,训练,参数,模型,文本,评测

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1「超时」前完成回答，然后突然有了「啊哈」时刻 4 scaling参数规模的挑战，以及继续沿着强化学习算法进步之路5 许...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

清华开源混合精度推理系统MixQ：大模型近无损量化并提升推理

一键部署LLM混合精度推理，端到端吞吐比AWQ最大提升6倍！清华大学计算机系PACMAN实验室发布开源混合精度推理系统——MixQ。MixQ支持8比特和4比特混合精度推理，可实现近无损的量化部署并提升推理的吞吐。△图1 MixQ吞吐与已有...……更多

2024-10-22 09:57:00推理,清华,吞吐,精度,混合,模型

对标o1，Kimi放出了最能打的国产模型

...历新一轮技术范式的变化，预训练 Scaling Law 放缓之后，推理时间计算成为了新的性能提升关键。两个月前，OpenAI o1 的诞生再次引领了大模型技术的突破。从后训练阶段入手，通过更多的强化学习、原生的思维链和更长的推理时...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

手机市场深陷泥沼，厂商如何破冰？

...着成为“鲶鱼”的潜质。如今，OPPO已经开始深度参与到下一代天玑芯片的设计当中，“潮汐架构”的未来充满了无限可能性。70亿参数大模型在手机端的真正落地OPPO同时也在探索大模型的可能性。2023年11月13日，OPPO官方宣布其...……更多

2024-01-09 10:18:00泥沼,厂商,手机,市场,手机,模型

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instruct可胜任复杂推理任务，Phi-3.5-vision-instruct则兼具文本与视觉能力。性能最强大的Phi-3.5-MoE-instruct模型有419亿个参数，……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能