• 我的订阅
  • 头条热搜
中国多所高校接入Deep Seek大模型
...月21日电 (记者 马芙蓉)武汉大学近日宣布上线Deep Seek系列模型,其中不仅有中型规模模型、大规模模型,还有足以胜任深度推理任务的“满血版”模型。“‘满血版’是参数规模为6710亿(671B)的Deep Seek版本,能够处理复杂数学题...……更多
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
2月18日,在大洋彼岸的马斯克秀出最新大模型Grok 3当天,国产AI公司深度求索(DeepSeek)最新一篇论文引发关注,创始人梁文锋在署名之列,并2月16日提交到预印本平台arxiv。这篇论文的核心关于NSA(Natively Sparse Attention,原生稀疏...……更多
中国科技创新“乘”数直上
...2023第二届全球数字贸易博览会上了解华为研发的盘古大模型的应用。 龙 巍摄(人民图片)当今时代,数据已成为重要的创新要素。人工智能大模型、新材料创制、生物育种、基础科学研究等都离不开数据的支撑。国家数据局...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
...上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通大学和阿里巴巴通义实验室共同完成。论文题目:Embedding Trajectory for Out-of-Distribution Detection in Mathematical R……更多
唯一全国产算力训练!讯飞星火深度推理模型X1正式发布:多项指标国内第一
...讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1,这也是目前唯一一个全国产算力上训练的深度推理模型。据介绍,与通用大模型相比,X1的解题过程更接近人类的“慢思考”方式,并且用更少的算力,实现了业...……更多
...网高考不仅仅是检测国内莘莘学子的一项重要考试,在大模型“百家争鸣”的今天,也是对国内AI大模型的一次考验。如果让大模型和国内学子同台竞技,做同一套高考真题试卷,结果会是怎样?大模型考上文科本科,豆包获国...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...间推理token,跟o1的核心技术CoT非常相似。传统的Transformer模型的致命弱点,就是擅长并行计算,但不擅长串行推理。而CoT,恰恰解决了这个问题。在这项工作中,Denny Zhou等人发现:传统的Transformer模型,只能解决AC0电路能解决的...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程,尝...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到...……更多
春节期间,国产人工智能大型语言模型DeepSeek火爆出圈,这其中也有山西转型综改示范区百信信息技术有限公司(简称“百信”)的科技贡献。据介绍,百信凭借自主研发的百信恒山326TA国产服务器,实现了昇腾算力与DeepSeek系列模...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成...……更多
超越国际标准!中国电信AI大模型发布:解决九章算术难题
...25日消息,中国电信人工智能研究院发布了“复杂推理大模型”TeleAI-t1-preview,即将上线天翼AI开放平台。该模型采用强化学习训练方法,结合探索和反思范式,显著提升了逻辑推理和数学推导的准确性。在多项权威评测中,TeleAI...……更多
国家超算互联网平台接入阿里千问大模型
...10日消息,国家超算互联网平台接入阿里巴巴通义千问大模型,对外提供千问QwQ-32B API 服务,用户可免费获得100万tokens。据了解,千问QwQ-32B是阿里通义团队最新开源的推理模型,在数学、代码及通用能力的多项权威评测集中,表...……更多
科大讯飞2025年Q3净利润、现金流均实现转正,大模型相关中标金额5.45亿元
...算法、算力、数据等要素自主可控的 AI 核心技术研究和模型训练体系领先性得到进一步验证,科大讯飞人工智能国家队的产业地位进一步增强:根据财报,“讯飞星火”在国产算力上夯实自主可控优势的同时,保持了人工智能...……更多
DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入,供用户按需部署
...儿。1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
现在,最强数学大模型,人人都可上手玩了!一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。惊喜的是,如果嫌输入数学公式比较麻烦,可以把想问的题截图or扫描,上传即可解题。整得挺方便。试玩界...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性,我们根本无法验证其生成内容的准确性,这也就会出现输出“黑盒”的情况。为了...……更多
0成本!摩尔线程GPU支持满血最新版Deepseek-V3-0324
3月24日,DeepSeek正式发布了其大语言模型的全新小版本迭代DeepSeek-V3-0324,在推理能力、代码生成、中文写作、搜索能力等方面都实现了显著提升。根据官方报告,DeepSeek-V3-0324不仅全面超越Claude-3.7-Sonnet、Qwen-Max等竞品,更在数学...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...The Information 在最新的报道中披露,两位测试过「草莓」模型的人士表示,OpenAI 可能将在接下来的两周内发布「草莓」模型,并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本,「草莓」的目标是再一次让大模型...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
八年满勤,数字中国讯飞答卷:AI如何让城市更聪明、生活更便捷
...至,不仅带来了基于全国产化算力底座训练的讯飞星火大模型及最新升级的星火X1深度推理大模型,更携一系列在城市、教育、医疗、企业数字化、运营商及智能硬件领域的AI创新成果亮相,以全栈自主可控的AI技术,为数字中国...……更多
科大讯飞:纯国产算力的星火X1新版本要来了 能力超OpenAI o1
...15日,科大讯飞推出首个使用全国产算力训练的深度推理模型星火X1。星火X1仅用1万张910B国产算力卡,就取得一系列研发成果,背后是科大讯飞在国产算力平台大量无人区适配和效率优化工作,真正将国产算力发挥到极致效率,...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了——Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩Llama 3.1 405B,也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
鞭牛士 9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏...……更多
张云泉:集中力量,促进国产AI大模型发展
...第18期,总第915期),原题为《集中力量,促进国产AI大模型发展——专访十四届全国政协委员、中科院计算所研究员张云泉》。文丨《瞭望东方周刊》记者万宏蕾编辑顾佳贇算力建设能否及时跟上,成为AI大模型向各领域进一步...……更多
联想发布端侧AI新技术 PC本地推理能力媲美 OpenAI-mini
...台普通PC的本地推理能力,媲美OpenAI去年发布的o1-mini云端模型。“联想推理加速引擎”通过高性能并行解码、算子融合优化以及异构计算技术, 实现了多种应用场景下推理速度的大幅提升,以及功耗和内存占用的显著降低。与大...……更多
更多关于社会的资讯:
4岁女童在与奶奶玩“躲猫猫”时不慎走丢,家人紧急向属地天朗美域社区求助。网格员线上线下联动搜索,最后在一家商店门口将其安全寻回
2025-11-18 22:35:00
随着近期冷空气持续影响西安,气温显著下降,华商报新闻热线029-88880000也迎来供暖投诉高峰。自11月17日上午10时至11月18日下午17时
2025-11-19 07:46:00
酒后驾驶撞人后,他的第一反应不是救人,而是找来朋友“顶包”。这一番煞费苦心的操作,不仅没能逃脱法律制裁,反而让朋友一同站上了被告席
2025-11-19 07:46:00
我省2025年成人高考评卷工作圆满结束,成绩于11月19日公布,省招考中心公布了成绩查询方式。考生可登录山西招生考试网(http
2025-11-19 07:55:00
探秘“建筑的铠甲”:“抗震明星”小雁塔 被称为古建筑里的“不倒翁”
对于人类,地震意味着灾难。那么建筑如何“强身健体”?如何拥有抗震的智慧?西安建筑科技大学结构与抗震实验室里尽是答案。这家教育部重点实验室承担着全国许多项重要科研实验
2025-11-19 07:47:00
被罚224.05万元!遵化市千里行加油加气站骗取增值税留抵退税案件有结果
前期,国家税务总局唐山市税务局稽查局依法查处遵化市千里行加油加气站骗取增值税留抵退税案件。经查,2020年1月至2023年4月
2025-11-18 14:33:00
长白时评评论员 四岳近日,湖南汉寿县职业中专学校再度引爆舆论:40件崭新演出服被学生集体网购、统一穿着参加活动后,竟以“七天无理由退货”为由全数退回
2025-11-18 14:36:00
鲍磊小说集《等在雨季》出版
近日,内蒙古籍作家鲍磊全新中短篇小说集《等在雨季》,由太白文艺出版社出版发行。据悉,该书收录了作者2022年至2025年发表在文学期刊上的12篇中短篇小说
2025-11-18 15:08:00
知名学者鲍鹏山合肥勉励大学生:世界那么大,你得多看看
大皖新闻讯 鲍鹏山是安徽六安人,文学博士、作家、学者。中国孔子基金会学术委员会委员,上海文史馆馆员。2025中国黄山书会期间
2025-11-18 15:09:00
2025长三角非遗活化与当代设计对话论坛在芜湖举办 探索传统文化“在地重生”新路径
大皖新闻讯 11月16日,以“文化叙事·在地重生”为主题的2025长三角非遗活化与当代设计对话论坛在芜湖举办。本次论坛由中国包装联合会设计专业委员会指导
2025-11-18 15:43:00
全网牵挂的“詹胡涛号”驶向远方!父母将在自家面馆贴上“免费吃面”告示:温暖更多身处困境的人
大皖新闻讯 2025年初冬,安徽省太湖县詹家店村的一栋两层小楼里,一整面墙的奖状依然熠熠生辉,只是那个曾经让这个家充满希望的少年
2025-11-18 15:45:00
鲁网11月18日讯自2019年底搬迁至距临沂市人民医院新址后,农行临沂南京路支行便以1.6公里的“近邻”之姿,聚焦住院患者行动不便的痛点
2025-11-18 15:45:00
鲁网11月18日讯清晨的阳光刚透过建行海曲支行网点的玻璃窗,大堂经理已站在门口,整理好工牌,露出温和的微笑。作为客户踏入银行的第一道“风景线”
2025-11-18 15:48:00
鲁网11月18日讯根据科睿唯安(Clarivate Analytics)发布的最新统计数据,临沂大学计算机科学首次进入ESI全球前1%
2025-11-18 15:48:00
农行临沂市中文峰支行:守护“育苗钱”!反诈宣传走进幼儿园
鲁网11月18日讯为提升家长群体反诈意识,筑牢家庭财产安全防线,近日,农行临沂文峰支行抓住家长接送幼儿的关键时段,走进周边幼儿园开展反诈宣传活动
2025-11-18 15:48:00