模型,国产,模型,推理,能力,数学头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

中国多所高校接入Deep Seek大模型

...月21日电 (记者马芙蓉)武汉大学近日宣布上线Deep Seek系列模型，其中不仅有中型规模模型、大规模模型，还有足以胜任深度推理任务的“满血版”模型。“‘满血版’是参数规模为6710亿(671B)的Deep Seek版本，能够处理复杂数学题...……更多

2025-02-21 17:17:00中国,接入,模型,模型,大学,武汉

梁文锋杨植麟论文撞题，“注意力机制”对大模型意味着什么

2月18日，在大洋彼岸的马斯克秀出最新大模型Grok 3当天，国产AI公司深度求索（DeepSeek）最新一篇论文引发关注，创始人梁文锋在署名之列，并2月16日提交到预印本平台arxiv。这篇论文的核心关于NSA(Natively Sparse Attention，原生稀疏...……更多

2025-02-19 18:43:00文锋,对大,注意力,模型,意味,机制

中国科技创新“乘”数直上

...2023第二届全球数字贸易博览会上了解华为研发的盘古大模型的应用。龙巍摄（人民图片）当今时代，数据已成为重要的创新要素。人工智能大模型、新材料创制、生物育种、基础科学研究等都离不开数据的支撑。国家数据局...……更多

2024-02-09 06:29:00科技创新,中国,科技,数据,模型,讯飞

NeurIPS 2024 | 数学推理场景下，首个分布外检测

...上海交通大学计算机系的二年级博士生，研究方向为语言模型生成、推理，以及可解释、可信大模型。该工作由上海交通大学和阿里巴巴通义实验室共同完成。论文题目：Embedding Trajectory for Out-of-Distribution Detection in Mathematical R……更多

2024-12-03 13:33:00研究成果,推理,场景,成果,检测,数学

唯一全国产算力训练！讯飞星火深度推理模型X1正式发布：多项指

...讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1，这也是目前唯一一个全国产算力上训练的深度推理模型。据介绍，与通用大模型相比，X1的解题过程更接近人类的“慢思考”方式，并且用更少的算力，实现了业...……更多

2025-01-15 10:24:00讯飞,星火,推理,深度,模型,指标

让AI去高考，豆包等四款大模型考上文科“一本”

...网高考不仅仅是检测国内莘莘学子的一项重要考试，在大模型“百家争鸣”的今天，也是对国内AI大模型的一次考验。如果让大模型和国内学子同台竞技，做同一套高考真题试卷，结果会是怎样？大模型考上文科本科，豆包获国...……更多

2024-06-26 11:14:00豆包,一本,文科,模型,高考,模型

Transformer推理天花板被谷歌打破？DeepMind

...间推理token，跟o1的核心技术CoT非常相似。传统的Transformer模型的致命弱点，就是擅长并行计算，但不擅长串行推理。而CoT，恰恰解决了这个问题。在这项工作中，Denny Zhou等人发现：传统的Transformer模型，只能解决AC0电路能解决的...……更多

2024-09-21 09:43:00天花,天花板,推理,首席,科学家,科学

首个AI高考全卷评测结果发布：最高分303，数学全不及格

...设计的高难度综合性测试，目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后，上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日， OpenCompass发布了首个...……更多

2024-06-24 09:22:00评测结果,最高分,评测,数学,高考,结果

又慢又贵？OpenAI推理模型“草莓”来了，GPT-5还有多

...12日，人工智能（AI）巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列，包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍， o1会花更多时间思考问题，然后再做出反应，就像人一样。通过训练学会了完善自己的思考过程，尝...……更多

2024-09-13 15:28:00多远,推理,草莓,模型,模型,思维

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时，阿里云就已经预告，接下来还要再发更大规模的开源模型。12月1日，三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型，通义千问大模型也升级到...……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

百信助力DeepSeek系列模型高效适配

春节期间，国产人工智能大型语言模型DeepSeek火爆出圈，这其中也有山西转型综改示范区百信信息技术有限公司(简称“百信”)的科技贡献。据介绍，百信凭借自主研发的百信恒山326TA国产服务器，实现了昇腾算力与DeepSeek系列模...……更多

2025-02-10 07:04:00百信,适配,模型,百信,模型,技术

李开复AI公司首发大模型，阿里云领投 | 36氪独家

...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时，36氪获悉，零一万物已完成新一轮融资，由阿里云领投。目前，零一万物估值已超10亿美元，跻身独角兽行列。此前，“Yi”于11月2日已经在Hugging Fac...……更多

2023-11-06 12:13:00李开复,万物,模型,能力,训练,阿里

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

超越国际标准！中国电信AI大模型发布：解决九章算术难题

...25日消息，中国电信人工智能研究院发布了“复杂推理大模型”TeleAI-t1-preview，即将上线天翼AI开放平台。该模型采用强化学习训练方法，结合探索和反思范式，显著提升了逻辑推理和数学推导的准确性。在多项权威评测中，TeleAI...……更多

2025-01-25 19:05:00中国电信,算术,国际标准,中国,难题,模型

国家超算互联网平台接入阿里千问大模型

...10日消息，国家超算互联网平台接入阿里巴巴通义千问大模型，对外提供千问QwQ-32B API 服务，用户可免费获得100万tokens。据了解，千问QwQ-32B是阿里通义团队最新开源的推理模型，在数学、代码及通用能力的多项权威评测集中，表...……更多

2025-03-10 14:54:00阿里,接入,模型,互联网,互联,国家

科大讯飞2025年Q3净利润、现金流均实现转正，大模型相关中

...算法、算力、数据等要素自主可控的 AI 核心技术研究和模型训练体系领先性得到进一步验证，科大讯飞人工智能国家队的产业地位进一步增强：根据财报，“讯飞星火”在国产算力上夯实自主可控优势的同时，保持了人工智能...……更多

2025-10-21 11:27:00讯飞,净利,现金流,净利润,金额,现金

DeepSeek“朋友圈”不断扩围：10家国内外云厂商宣布接

...儿。1月20日，中国AI初创公司深度求索（DeepSeek）推出大模型DeepSeek-R1。作为一款开源模型，R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版，并采用MIT许可协议，支持免费商用、任意修改和衍生开发等...……更多

2025-02-06 07:23:00家国,接入,不断,厂商,朋友,用户

哪里不会扫哪里！全球最强数学大模型在线玩，阿里多模态模型加持

现在，最强数学大模型，人人都可上手玩了！一觉醒来，阿里千问大模型团队发布了Qwen2-Math的Demo，抱抱脸在线可玩。惊喜的是，如果嫌输入数学公式比较麻烦，可以把想问的题截图or扫描，上传即可解题。整得挺方便。试玩界...……更多

2024-08-21 09:42:00模型,模态,阿里,数学,全球,在线

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...力再次升级！今天，阿里国际AI团队发布了一款多模态大模型Ovis，在图像理解任务上不断突破极限，多种具体的子类任务中均达到了SOTA（最新技术）水平。多模态大模型能够处理和理解多种不同类型的数据输入，例如文本、图...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

DeepSeek/o3的弱点找到了！三心二意明明对了又改错

DeepSeek和o1/o3一类推理大模型持续带来震撼之际，有人开始研究他们的弱点了。最新研究揭示：在遇到高难度问题时，推理大模型可能像“三心二意的学生”一样频繁切换解题思路，却因缺乏深入探索而失败——这种现象被研究...……更多

2025-02-04 19:41:00弱点,模型,推理,答案,思路,准确率

0成本！摩尔线程GPU支持满血最新版Deepseek-V3-

3月24日，DeepSeek正式发布了其大语言模型的全新小版本迭代DeepSeek-V3-0324，在推理能力、代码生成、中文写作、搜索能力等方面都实现了显著提升。根据官方报告，DeepSeek-V3-0324不仅全面超越Claude-3.7-Sonnet、Qwen-Max等竞品，更在数学...……更多

2025-03-28 11:35:00摩尔,线程,最新版,成本,支持,摩尔

OpenAI发布最新技术研究，AI“黑盒”不再是难题！

...随着ChatGPT在法律、金融、营销等领域的广泛使用，确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性，我们根本无法验证其生成内容的准确性，这也就会出现输出“黑盒”的情况。为了...……更多

2024-07-18 09:47:00最新技术,难题,研究,技术,模型,小数

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

...The Information 在最新的报道中披露，两位测试过「草莓」模型的人士表示，OpenAI 可能将在接下来的两周内发布「草莓」模型，并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本，「草莓」的目标是再一次让大模型...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

微软连发3款Phi-3.5模型：128K上下文，首用MoE架

...东西8月21日消息，今天，微软一口气甩出3款超强轻量级模型！微软本次发布的轻量级模型系列名为Phi-3.5，适合在内存和算力受限的环境中运行，均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务，Phi-3.5-MoE-instru...……更多

2024-08-22 09:49:00上下文,微软,架构,模型,上下,性能

八年满勤，数字中国讯飞答卷：AI如何让城市更聪明、生活更便捷

...至，不仅带来了基于全国产化算力底座训练的讯飞星火大模型及最新升级的星火X1深度推理大模型，更携一系列在城市、教育、医疗、企业数字化、运营商及智能硬件领域的AI创新成果亮相，以全栈自主可控的AI技术，为数字中国...……更多

2025-04-30 12:36:00讯飞,答卷,中国,数字,城市,生活

科大讯飞：纯国产算力的星火X1新版本要来了能力超OpenA

...15日，科大讯飞推出首个使用全国产算力训练的深度推理模型星火X1。星火X1仅用1万张910B国产算力卡，就取得一系列研发成果，背后是科大讯飞在国产算力平台大量无人区适配和效率优化工作，真正将国产算力发挥到极致效率，...……更多

2025-02-14 00:21:00讯飞,星火,国产,能力,讯飞,星火

开源大模型杀疯了！Mistral新模型三分之一参数卷爆Lla

Llama 3.1 405B“最强模型”宝座还没捂热乎，就被砸场子了——Mistral AI发布最新模型Mistral Large 2，参数123B，用不到三分之一的参数量性能比肩Llama 3.1 405B，也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多

2024-07-26 09:39:00模型,参数,模型,基准,问题,推理