推理,模型,思维,语言,社区,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...科技11月5日消息，近日，摩尔线程上线了大语言模型高速推理框架开源项目vLLM的MUSA移植版本，为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的范例。摩尔线程表示，正努力围绕自主研发的统一系统架构GPU、MUSA软件...……更多

2024-11-05 21:09:00摩尔,线程,国产,摩尔,线程,移植

微软推出xot新型人工智能方法

...思维搜索的领域知识。策略和价值网络指导搜索过程。在推理过程中，预训练的MCTS模块使用策略网络来探索LLM的思想轨迹。随后，LLM审查MCTS的思想并识别任何错误，然后进行额外的MCTS模拟以生成修改后的想法。最后，将修改后...……更多

2023-11-16 09:37:00微软,人工智能,人工,智能,方法,微软

大模型“翻车”小学题？

...相关性，使得AI在文字创作上达到人类平均水平，而数学推理更需要的是因果性，数学是高度抽象和逻辑驱动的，与语言模型处理的语言数据在本质上有所不同。这意味着大模型要学好数学，除了学习世界知识外，还应该有思维...……更多

2024-07-18 16:39:00模型,小学,模型,小数,记者,南都

2023IDEA大会：让大模型更好应对复杂问题

...本正经的胡说八道”怎么解？众所周之，大模型存在深度推理能力差、知识不可追溯、实时更新代价高等局限性，这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷，是当下AI应用的重要课题。为此，IDEA...……更多

2023-11-24 10:53:00模型,大会,问题,模型,研究,能力

马斯克官宣Grok-2测试版！xAI将继续拥抱开源路线吗？

...据具体询问的内容，模型只会激活不同的专家子模块进行推理，在吞吐量一定的情况下，可以更快地完成推理、给出回答。这让Grok-1拥有了更快的生成速度和更低的推理成本，简而言之就是更好的使用体验和性价比。根据xAI公布...……更多

2024-08-13 09:50:00马斯,马斯克,测试版,路线,测试,模型

探索终端操作系统领域AI大模型创新趋势 OpenHarmon

...发展带来了崭新的机遇,有望通过强大的语义理解和常识推理能力大大提升智能个人代理支持功能的广度和深度。”清华大学助理研究员李元春主题分享中软国际有限公司智能物联网军团产品研发管理部总经理、OpenHarmony项目群技...……更多

2023-11-06 14:46:00终端,模型,趋势,大会,领域,智能

加码“AI+编程教育”！商汤科技与编程猫达成战略合作

...、强化学习等技术突破，商汤“日日新V6”在长思维链、推理、数理、全局记忆方面拥有显著优势，多模态推理能力国内第一，对标GPT-o1，数据分析能力大幅领先GPT-4o，将为编程猫的课程体系和教育方案的开发，提供强大支持。...……更多

2025-04-29 16:22:00商汤,编程,战略,合作,教育,科技

“AI科学家”登场科研自动化时代来了？

...语言模型之外的其他技术。例如，解决数学问题需要逻辑推理，而目前大多数AI模型都不擅长逻辑推理。鉴于此，谷歌深度思维公司开发出AlphaGeometr，将语言模型与符号引擎(使用符号和逻辑规则进行推理)相结合，构建出一种神...……更多

2024-09-12 07:47:00科学家,科研,自动化,科学,时代,科学家

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

...设定了一个新的前沿”。Mistral Large 2尤其擅长代码和数学推理，上下文窗口128k，支持数十种自然语言以及80+编程语言。特别在MMLU上，其预训练版本更是达到了84.0%的准确率。消息一出，Mistral AI联创兼首席科学家第一时间转发，...……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理

chatgpt低成本复现流程开源

...。相比原生PyTorch，单机训练速度最高可提升7.73倍，单卡推理速度提升1.42倍，仅需一行代码即可调用。对于微调任务，可最多提升单卡的微调模型容量3.7倍，同时保持高速运行，同样仅需一行代码。要知道，ChatGPT火是真的火，...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

AI表现直逼国际奥数优秀选手，它要 “征服”数学了吗？

...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力，训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶，往往意味着人类智慧极限的突破。迄今为止，解决或协助解决高等级数...……更多

2024-06-14 11:54:00奥数,选手,数学,国际,数学,数学家

看Sora如何赋能作战指挥

...，目前已初具“近似人类”的自我认知、情感体验、思维推理能力，能够“听”懂人类语言、“理解”人的情绪和意图，并能较为逼真地呈现出来。基于此，随着脑机接口技术的发展，Sora或可成为连接人脑与人脑、人脑与机脑...……更多

2024-04-09 05:19:00作战,指挥,指挥,作战,指挥员,视频

谷歌王者归来？最新推出的大模型到底有多强，能否挑战GPT-4

...问题，这就使其尤其擅长解释数学和物理等复杂科目中的推理。Gemini能够根据照片按步骤讲题。来源：官方视频谷歌还发布了一个时长六分钟的视频，展现了测试员和Gemini的一些有趣互动，其中包括让Gemini识别图片并用多种语言...……更多

2023-12-07 18:27:00王者,模型,模型,视频,微软,测试

年度生成式AI大会上海站公布最新嘉宾，报名进入最后阶段

...成热潮，多模态世界模型的研究热度渐起。更具革命性的推理模型o1悄然出世，带来的思维链CoT+强化学习这一新范式，正推动生成式AI迈入新的阶段。大语言模型仍在狂飙，但价格战、营销战硝烟燃起，融资热度正在降温。不过...……更多

2024-11-26 09:38:00上海站,上海,嘉宾,生成,阶段,大会

谷歌发布gemma2大语言模型，共有两种大小

...亿参数（27B）两种大小。Gemma2大语言模型相比较第一代，推理性能更高、效率更高，并在安全性方面取得了重大进步。谷歌在新闻稿中表示，Gemma2-27B模型的性能媲美两倍规模的主流模型，而且只需要一片英伟达H100ensorCoreGPU或TPU...……更多

2024-06-28 10:18:00模型,大小,语言,模型,性能,英伟

新一批南京大模型通过国家备案

...火X1全新升级，作为业界唯一基于全国产算力训练的深度推理大模型，升级后的星火X1，在数学、代码、逻辑推理、文本生成、语言理解、知识问答等通用任务上效果提升，在模型参数比业界同类模型小一个数量级的情况下，整...……更多

2025-05-23 07:03:00南京,模型,国家,模型,南京,智能

openai发布多语言大规模多任务语言理解

...语言。其结构旨在评估模型在不同研究领域中需要常识、推理、解决问题和理解能力的任务中的表现。MMMLU的创建反映了OpenAI对测量模型实际能力的关注，尤其是在NLP研究中代表性不足的语言，纳入多种语言可确保模型在使用英...……更多

2024-09-24 22:07:00多语,大规,大规模,任务,语言,语言

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

... OpenAI 在大语言模型领域的新尝试，也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看，相比以往的 GPT 模型，「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力，使其成为通用人...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...交互能力的核心是模型能够直接在语音模态上进行理解和推理，这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程：首先将输入语音内容转换为文本，其次利用大语言模型进行文本推理，最后利用...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

阿里又干了件大事：发布并开源全新推理模型性能比肩DeepS

...天凌晨，阿里巴巴又默默干了件大事：发布并开源全新的推理模型通义千问QwQ-32B。千问QwQ-32B是阿里探索推理模型的最新成果。通过大规模强化学习，它在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。在保持...……更多

2025-03-07 07:27:00阿里,推理,模型,大事,性能,全新

“深思熟虑”的 AI：OpenAI 提出全新安全对齐方法

...方法直接教授模型安全规范，并训练它们在生成响应之前推理这些准则进，将安全原则融入推理过程中。整个过程分为两个阶段，第一阶段，监督微调（SFT）训练模型参考并推理安全规范，使用从基础模型生成的数据集。第二...……更多

2024-12-26 09:29:00深思,全新,方法,安全,模型,安全

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文

...够在多模态大模型（如 LLaVA）的训练中显著提升复杂视觉推理的表现。代码与模型均已公开，欢迎访问 https://aka.ms/llm2clip 了解详情和试用。LLM2CLIP 目前已被 NeurIPS 2024 Workshop: Self-Supervised Learning - Theory and Practice 接收……更多

2024-11-28 09:59:00模态,教会,文本,升级,数据,模态