• 我的订阅
  • 头条热搜
中国多所高校接入Deep Seek大模型
...月21日电 (记者 马芙蓉)武汉大学近日宣布上线Deep Seek系列模型,其中不仅有中型规模模型、大规模模型,还有足以胜任深度推理任务的“满血版”模型。“‘满血版’是参数规模为6710亿(671B)的Deep Seek版本,能够处理复杂数学题...……更多
梁文锋杨植麟论文撞题,“注意力机制”对大模型意味着什么
2月18日,在大洋彼岸的马斯克秀出最新大模型Grok 3当天,国产AI公司深度求索(DeepSeek)最新一篇论文引发关注,创始人梁文锋在署名之列,并2月16日提交到预印本平台arxiv。这篇论文的核心关于NSA(Natively Sparse Attention,原生稀疏...……更多
中国科技创新“乘”数直上
...2023第二届全球数字贸易博览会上了解华为研发的盘古大模型的应用。 龙 巍摄(人民图片)当今时代,数据已成为重要的创新要素。人工智能大模型、新材料创制、生物育种、基础科学研究等都离不开数据的支撑。国家数据局...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
...上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通大学和阿里巴巴通义实验室共同完成。论文题目:Embedding Trajectory for Out-of-Distribution Detection in Mathematical R……更多
唯一全国产算力训练!讯飞星火深度推理模型X1正式发布:多项指标国内第一
...讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1,这也是目前唯一一个全国产算力上训练的深度推理模型。据介绍,与通用大模型相比,X1的解题过程更接近人类的“慢思考”方式,并且用更少的算力,实现了业...……更多
...网高考不仅仅是检测国内莘莘学子的一项重要考试,在大模型“百家争鸣”的今天,也是对国内AI大模型的一次考验。如果让大模型和国内学子同台竞技,做同一套高考真题试卷,结果会是怎样?大模型考上文科本科,豆包获国...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...间推理token,跟o1的核心技术CoT非常相似。传统的Transformer模型的致命弱点,就是擅长并行计算,但不擅长串行推理。而CoT,恰恰解决了这个问题。在这项工作中,Denny Zhou等人发现:传统的Transformer模型,只能解决AC0电路能解决的...……更多
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日, OpenCompass发布了首个...……更多
又慢又贵?OpenAI推理模型“草莓”来了,GPT-5还有多远
...12日,人工智能(AI)巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列,包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍, o1会花更多时间思考问题,然后再做出反应,就像人一样。通过训练学会了完善自己的思考过程,尝...……更多
通义千问再放大招:720亿大模型开源,全尺寸赶上LLaMA-2,还有移动端可用的18亿模型
...包括编程、AI阅读、音视频转录、AI角色生成等八大产品模型。当时,阿里云就已经预告,接下来还要再发更大规模的开源模型。12月1日,三款新模型如约而至——包括Qwen-72B、Qwen-1.8B和Qwen-Audio大模型,通义千问大模型也升级到...……更多
春节期间,国产人工智能大型语言模型DeepSeek火爆出圈,这其中也有山西转型综改示范区百信信息技术有限公司(简称“百信”)的科技贡献。据介绍,百信凭借自主研发的百信恒山326TA国产服务器,实现了昇腾算力与DeepSeek系列模...……更多
李开复AI公司首发大模型,阿里云领投 | 36氪独家
...复成立的AI公司“零一万物”发布了首款开源中英双语大模型“Yi”。与此同时,36氪获悉,零一万物已完成新一轮融资,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。此前,“Yi”于11月2日已经在Hugging Fac...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成...……更多
超越国际标准!中国电信AI大模型发布:解决九章算术难题
...25日消息,中国电信人工智能研究院发布了“复杂推理大模型”TeleAI-t1-preview,即将上线天翼AI开放平台。该模型采用强化学习训练方法,结合探索和反思范式,显著提升了逻辑推理和数学推导的准确性。在多项权威评测中,TeleAI...……更多
国家超算互联网平台接入阿里千问大模型
...10日消息,国家超算互联网平台接入阿里巴巴通义千问大模型,对外提供千问QwQ-32B API 服务,用户可免费获得100万tokens。据了解,千问QwQ-32B是阿里通义团队最新开源的推理模型,在数学、代码及通用能力的多项权威评测集中,表...……更多
科大讯飞2025年Q3净利润、现金流均实现转正,大模型相关中标金额5.45亿元
...算法、算力、数据等要素自主可控的 AI 核心技术研究和模型训练体系领先性得到进一步验证,科大讯飞人工智能国家队的产业地位进一步增强:根据财报,“讯飞星火”在国产算力上夯实自主可控优势的同时,保持了人工智能...……更多
DeepSeek“朋友圈”不断扩围:10家国内外云厂商宣布接入,供用户按需部署
...儿。1月20日,中国AI初创公司深度求索(DeepSeek)推出大模型DeepSeek-R1。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等...……更多
哪里不会扫哪里!全球最强数学大模型在线玩,阿里多模态模型加持
现在,最强数学大模型,人人都可上手玩了!一觉醒来,阿里千问大模型团队发布了Qwen2-Math的Demo,抱抱脸在线可玩。惊喜的是,如果嫌输入数学公式比较麻烦,可以把想问的题截图or扫描,上传即可解题。整得挺方便。试玩界...……更多
阿里国际发布最新开源多模态模型Ovis,多模态能力再升级
...力再次升级!今天,阿里国际AI团队发布了一款多模态大模型Ovis,在图像理解任务上不断突破极限,多种具体的子类任务中均达到了SOTA(最新技术)水平。多模态大模型能够处理和理解多种不同类型的数据输入,例如文本、图...……更多
DeepSeek/o3的弱点找到了!三心二意 明明对了又改错了
DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。最新研究揭示:在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究...……更多
0成本!摩尔线程GPU支持满血最新版Deepseek-V3-0324
3月24日,DeepSeek正式发布了其大语言模型的全新小版本迭代DeepSeek-V3-0324,在推理能力、代码生成、中文写作、搜索能力等方面都实现了显著提升。根据官方报告,DeepSeek-V3-0324不仅全面超越Claude-3.7-Sonnet、Qwen-Max等竞品,更在数学...……更多
OpenAI发布最新技术研究,AI“黑盒”不再是难题!
...随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性,我们根本无法验证其生成内容的准确性,这也就会出现输出“黑盒”的情况。为了...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...The Information 在最新的报道中披露,两位测试过「草莓」模型的人士表示,OpenAI 可能将在接下来的两周内发布「草莓」模型,并上线 ChatGPT。但不同于 GPT-4o、GPT-4o mini 是在优化使用体验和成本,「草莓」的目标是再一次让大模型...……更多
微软连发3款Phi-3.5模型:128K上下文,首用MoE架构,部分性能超GPT-4o mini
...东西8月21日消息,今天,微软一口气甩出3款超强轻量级模型!微软本次发布的轻量级模型系列名为Phi-3.5,适合在内存和算力受限的环境中运行,均支持128k上下文长度。Phi-3.5-mini-instruct主要面向基础快速推理任务,Phi-3.5-MoE-instru...……更多
八年满勤,数字中国讯飞答卷:AI如何让城市更聪明、生活更便捷
...至,不仅带来了基于全国产化算力底座训练的讯飞星火大模型及最新升级的星火X1深度推理大模型,更携一系列在城市、教育、医疗、企业数字化、运营商及智能硬件领域的AI创新成果亮相,以全栈自主可控的AI技术,为数字中国...……更多
科大讯飞:纯国产算力的星火X1新版本要来了 能力超OpenAI o1
...15日,科大讯飞推出首个使用全国产算力训练的深度推理模型星火X1。星火X1仅用1万张910B国产算力卡,就取得一系列研发成果,背后是科大讯飞在国产算力平台大量无人区适配和效率优化工作,真正将国产算力发挥到极致效率,...……更多
开源大模型杀疯了!Mistral新模型三分之一参数卷爆Llama 3.1
Llama 3.1 405B“最强模型”宝座还没捂热乎,就被砸场子了——Mistral AI发布最新模型Mistral Large 2,参数123B,用不到三分之一的参数量性能比肩Llama 3.1 405B,也不逊于GPT-4o、Claude 3 Opus等闭源模型。主打的就是一个高性价比。用官……更多
腾讯推出新一代大模型「混元Turbo」,性能大幅提升,定价低50%
鞭牛士 9月5日消息,腾讯宣布推出新一代大模型“混元Turbo”。腾讯介绍,该模型采用MoE架构,比上一代产品推理效率提升100%,推理成本降低50%,解码速度提升20%。腾讯公司副总裁、云与智慧产业事业群COO兼腾讯云总裁邱跃鹏...……更多
张云泉:集中力量,促进国产AI大模型发展
...第18期,总第915期),原题为《集中力量,促进国产AI大模型发展——专访十四届全国政协委员、中科院计算所研究员张云泉》。文丨《瞭望东方周刊》记者万宏蕾编辑顾佳贇算力建设能否及时跟上,成为AI大模型向各领域进一步...……更多
联想发布端侧AI新技术 PC本地推理能力媲美 OpenAI-mini
...台普通PC的本地推理能力,媲美OpenAI去年发布的o1-mini云端模型。“联想推理加速引擎”通过高性能并行解码、算子融合优化以及异构计算技术, 实现了多种应用场景下推理速度的大幅提升,以及功耗和内存占用的显著降低。与大...……更多
更多关于社会的资讯:
穿越了!长春“这有书”里藏着延安新华书店的旧时光
吉林省新华书店集团倾力打造的万米级文化复合空间“这有书”,将于本周四盛大开业。这座吉林文化新地标,既是坐拥海量藏书的知识海洋
2025-12-10 19:38:00
农行临沂市中支行营业部成功拦截一起扶贫基金诈骗风险事件
鲁网12月10日讯近日,农行临沂市中支行营业部员工凭借高度的风险防范意识和专业服务素养,成功拦截一起扶贫基金诈骗风险事件
2025-12-10 16:22:00
【健康科普】肺磨玻璃结节:发现后别慌,精准定位是关键
鲁网12月10日讯“医生,我体检发现肺上有个磨玻璃结节,是不是得切掉一大片肺啊?”“手术以后会不会喘不上气?”在泰安市中医医院肿瘤科门诊
2025-12-10 11:28:00
岳峰小学2022级11班开展家长义教活动
鲁网12月10日讯从“cute as a kitten”(像小猫一样可爱)到“sly as a fox”(像狐狸一样狡猾)
2025-12-10 11:30:00
皖S出租车停靠烟台海边多日,网友担心安危!车主现身回应:“在这工作10天了”
大皖新闻讯 12月9日,山东烟台媒体发布视频称,“安徽‘的哥’,你在烟台还好吗?皖S出租车在海边泊车数日,引发热心市民关切
2025-12-10 11:33:00
为368家企业解“钱”题 “金融会客厅”425亿活水精准润豫企
大河网讯(记者 王怡潇 申华) 举办35场对接会,为368家企业协调融资,累计投放贷款425.6亿元......12月10日
2025-12-10 11:40:00
吉林文脉读者见面会①|在北书房·新华诗歌书店探寻老建筑“重生”的意义
“对话历史·感悟文脉”——“吉林文脉”读者见面会近日走进北书房·新华诗歌书店。活动由中共吉林省委宣传部、吉林省教育厅联合主办
2025-12-10 12:17:00
门诊楼安全出口防火门违法拆除,承德市中医院被行政处罚
据信用中国(河北承德)官网公开信息,近日,因门诊楼安全出口防火门违法拆除,承德市中医院被双桥区消防救援大队罚款1.5万元
2025-12-10 12:20:00
不开颅、无创口!烟台毓璜顶医院开启复杂颅内肿瘤微创治疗“新时代”
鲁网12月10日讯(记者 魏萱 通讯员 李成修)神经内镜精准“探路”,鼻腔变身微创“通道”,无需开颅,就能轻松“拿下”复杂颅内肿瘤手术
2025-12-10 13:55:00
盲母17年养育弃婴,引来众人爱心接力
大皖新闻讯 阜阳市颍东72岁的盲人任子英,17年前收养一名女婴,现在女孩已上高中,盲母与养女的故事感动无数人。12月8日
2025-12-10 13:17:00
万名医护进乡村:烟台毓璜顶医院专家基层破局 完成招远首例血管缝合手术
鲁网12月10日讯(记者 魏萱 通讯员 李成修 侯瑞)“血管修复成功,血压回升!”近日,在招远市人民医院手术室内,正在该院驻点帮扶的烟台毓璜顶医院血管外科主治医师王涛与招远市人民医院手术团队携手
2025-12-10 13:54:00
诗坛名家游西湖
昨天,《劳作与花开》卢文丽诗集分享会在杭州举行,众多浙江文学界名家齐聚,93岁著名评论家、金玉兰诗歌大奖得主谢冕也携夫人亲临现场点评
2025-12-10 12:19:00
市民赵先生向橙柿直通车反映:赵家花苑小区内所有的电动自行车充电桩损坏,无法充电,望相关单位帮助监督尽快修复。上城区赵家苑社区回复:小区正在改造,后期会在室外新车棚安装新的充电桩,
2025-12-10 09:46:00
相关部门提醒:严禁野外用火,违者承担法律责任!昨天凌晨,太子尖火了!不过,这次不是因为雾凇,也不是云海,更不是因为人多
2025-12-10 10:17:00
□陈宝云 李春辉“哈哈哈!”河北省木兰围场国有林场山湾子分场场部综合办公楼里,一听到这爽朗的笑声,职工们便知道“段大哥”来了
2025-12-10 10:21:00