多远,推理,草莓,模型,模型,思维头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

科大讯飞联手华为首次攻克全国产算力下推理模型训练难关

...15日，科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一，并率先应用于教育、医疗等刚需场景。同时，讯飞星火4.0 Turbo底座能力再次迎来全新升级，图文、数学和长文...……更多

2025-01-15 15:07:00讯飞,华为,难关,模型,训练,全国

9.11比9.9大？多个大模型翻车！业内人士：就是偏科，文科

...文认为，模型产生幻觉的三大来源：数据源、训练过程和推理。大模型可能会过度依赖训练数据中的一些模式，如位置接近性、共现统计数据和相关文档计数，从而导致幻觉。此外，大模型还可能会出现长尾知识回忆不足、难以...……更多

2024-07-17 20:56:00理科,文科,业内人士,模型,业内,多个

OpenAI取消独立发布o3模型未来将推出整合多项技术的G

...AI不再计划将o3作为独立模型发布。o3是OpenAI推出的第二个推理模型，该公司于1月底上线了o3-mini，并承诺将在不久后推出o3。“我们希望更好地分享我们的预期路线图，同时大幅简化产品布局，”奥尔特曼周三在社交媒体平台X上...……更多

2025-02-13 07:20:00模型,整合,独立,技术,奥尔,奥尔特曼

大模型价格战“卷”向何方？｜深度

...千亿参数MoE架构模型。MoE架构中基于多个专家并行机制，推理时只激活部分专家，以稀疏性压缩了参数数量和推理成本。“这就可以极大地节省算力耗费”。而率先掀起价格战的幻方DeepSeek-V2，就是其通过架构创新，实现了大模...……更多

2024-05-25 10:34:00何方,价格战,深度,模型,价格,模型

谷歌员工曝AI改进速度放缓，Gemini已成立新团队解决问题

...无解可能会导向悲观派所说的“AI泡沫”。世界离AGI还有多远？还要看这些巨头公司们多久突破技术瓶颈。来源：The Information ……更多

2024-11-15 09:51:00立新,团队,员工,速度,问题,模型

9.11和9.9哪个大？实测12个大模型8个都答错，Chat

...模型的短板，此前行业也多次讨论过大模型的数学和复杂推理能力较差，即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次，第一财经曾在6月报道过，根据司南评测体系OpenCompass的高考全卷测试，包括GPT-4在内，7...……更多

2024-07-17 11:56:00实测,模型,模型,数学,小数,问题

o1带火的CoT到底行不行？新论文引发了论战

...To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据

周鸿祎的预判对不对

...只手就是有两个头，极不自然。我们离通用人工智能还有多远？在周鸿祎的讲话中，通用人工智能似乎就在眼前，但在Sora官网发布的视频作品中各种漏洞却让人们对他这番话有些怀疑。以Sora官网上发布的一个蚂蚁为主角的视频...……更多

2024-02-23 06:19:00周鸿,人工智能,人工,智能,周鸿,视频

Bengio团队提出多模态新基准，直指Claude 3.5和

...型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等技术正是由此产生的灵感。然而，可能很多人并没有意识到，很多对人类来说很简单的认知任务也往往伴随着非常复杂...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

手机上能跑的「GPT-4V」来啦！多图、视频理解首次上端！面

...类模型低 75%。端侧友好：量化后端侧内存仅占 6 GB；端侧推理速度高达 18 tokens/s，相比上代模型快 33%。并且发布即支持 llama.cpp、ollama、vllm 推理；且支持多种语言。统一高清框架，高效能力一拖三：小钢炮的传统优势 OCR 能力延...……更多

2024-08-07 09:42:00多图,小钢炮,模态,上端,手机,视频

百度发布两款大模型，对标DeepSeek、聚焦多模态

...的螺旋中不断改进。随着人工智能技术从基础问答向复杂推理跃迁，除了百度外，近期包括阿里旗下AI应用夸克、字节旗下豆包、腾讯混元等都陆续上线了“深度思考”功能。这也意味着生成式AI的竞争已从早期的信息整合、简...……更多

2025-03-16 14:03:00模态,模型,文心,模型,哪吒,模态

英伟达没有慌，黄仁勋再谈DeepSeek：“推理”的计算需求

...于DeepSeek、Grok、OpenAl等冲击，AI正在从感知和生成式AI向推理和逻辑推理领域发展。而推理AI又增加了一条扩展规律——增加训练的计算能力能让模型变得更智能，而增加深度思考的计算能力则能让答案更精准，与一次性推理相比...……更多

2025-02-27 11:55:00英伟,推理,需求,英伟,增长,推理

2023IDEA大会：让大模型更好应对复杂问题

...本正经的胡说八道”怎么解？众所周之，大模型存在深度推理能力差、知识不可追溯、实时更新代价高等局限性，这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷，是当下AI应用的重要课题。为此，IDEA...……更多

2023-11-24 10:53:00模型,大会,问题,模型,研究,能力

全球瞩目，又是杭州！这款视觉推理模型一夜起飞

...这个思路，我们开始思考：视觉模型是否也能实现类似的推理能力？”与传统大模型训练的 SFT（Supervised Fine-Tuning）方法不同，R1方法的突破在于其路径创新。SFT依赖海量标注数据进行“填鸭式”教学，而R1方法则通过强化学习，...……更多

2025-02-26 07:07:00杭州,推理,模型,视觉,又是,全球

阿里多模态检索智能体，自带o1式思考过程！复杂问题逐步拆解

多模态检索增强生成（mRAG）也有o1思考推理那味儿了！阿里通义实验室新研究推出自适应规划的多模态检索智能体。名叫OmniSearch，它能模拟人类解决问题的思维方式，将复杂问题逐步拆解进行智能检索规划。随便上传一张图，...……更多

2024-12-05 09:45:00模态,拆解,阿里,检索,过程,智能

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k，GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

昆仑万维：“天工大模型3.0”将于4月17日正式发布同步开

...“天工2.0”MoE大模型，“天工3.0”在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升，其模型技术知识能力提升超过20%，数学/推理/代码/文创能力提升超过30%。同时，“天工...……更多

2024-04-01 19:56:00万维,昆仑,模型,将于,同步,参数

综述｜5月全球人工智能领域新看点

...版本升级，当前版本为DeepSeek-R1-0528，模型的思维深度与推理能力显著提升。更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化，能够输出篇幅更长、结构内容更完整的长篇作品，同时呈现出更加贴近人类偏好的写...……更多

2025-06-02 13:09:00人工智能,看点,人工,领域,智能,全球

智启新元年：PC成为AI落地首选终端

...，真正走入大众生活，已经到时候了。距离AI普惠，还有多远？可以说，当下生成式AI的“涌现”，是多种软硬件技术发展成熟的共同结果。硬件方面，GPU技术高速发展、框架不断更新，已自比CPU更快运行3D图像的“显卡”角色脱...……更多

2023-12-22 12:43:00启新,落地,终端,模型,终端,应用

AI发展变慢了？几位AI头部创业者并不赞同

...月份发布的GPT-4o（多模态语言大模型），9月份发布的o1（推理大模型），质量都可圈可点。与去年相比，他认为，今年AI行业的特色是，之前只有OpenAI一家独大，现在已经变成了群雄并起、你追我赶的状态，各家公司都在提速。...……更多

2024-09-21 13:52:00创业者,头部,创业,发展,模型,大昕

补齐Transformer规划短板又不放弃快速思考，Dual

...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

16家头部大模型公司上海神秘碰头，现场人挤人人人

...最为关键的三大层面，即：算力层：用于基础模型训练和推理的基础设施模型层：使用基础模型加速生成式AI应用构建应用层：开箱即用的生成式AI应用至于能力如何，我们直接来看下最为直观的效果。在生成式AI应用方面，...……更多

2024-05-30 17:18:00上海,头部,模型,人人,公司,亚马

华东师范大学的老师，上课已经用上了大模型

...的算力，还要有灵活组合、弹性扩展的能力，既能兼顾AI推理等新型负载，又要进一步强化传统的通用计算平台及应用。第二，软硬兼修的优化适配。随着大模型在教育领域的应用兴起，高校对AI平台提出了更高的要求。一方面...……更多

2024-07-01 09:22:00华东师范大学,华东,师范,模型,老师,大学

构建数字经济新引擎：枫清科技高雪峰解读AI技术的未来趋势

...地过程中也暴露出一系列问题，如大模型“幻觉”现象、推理能力不足、解释性差等。这些问题导致很多企业面临大模型“好玩不好用”的困境。如何真正推动大模型技术在企业场景中的深度应用，成为当前AI产业发展的重要课...……更多

2024-09-13 18:28:00雪峰,趋势,数字,引擎,经济,技术

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你

...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务，每个级别都有其独特的难点和解决方案，需要不同的技术和方法来优化性能。受参数量和知识更新的限制，大模型在执行很多真实场景下的任务时，都需要连接...……更多

2024-11-22 09:54:00银弹,数据,姿势,难度,解决方案,方案

英伟达、微软、亚马逊三家美国巨头同日接入DeepSeek 网

...eepSeek，英伟达更是直言不讳地表示，DeepSeek-R1具备最先进推理能力。1月31日，英伟达宣布，NVIDIA NIM已经可以使用DeepSeek-R1。NIM，即NVIDIA Inference Microservices，是一种云原生微服务技术，可简化生成式AI模型在云端、数据中……更多

2025-02-02 11:40:00亚马,亚马逊,三家,英伟,微软,实测