• 我的订阅
  • 头条热搜
华硕推出Ascent GX10迷你机:GB10芯片 算力达1000 TOPS
...Arm核心,可增强数据预处理和编排,加速模型调整和实时推理。Ascent GX10配备了128GB LPDDR5X统一内存,为大型AI模型提供充足的内存支持。此外,得益于集成的NVIDIA ConnectX-7 NIC网口,用户可以将两台Ascent GX10连接在一起,进行本地...……更多
NeurIPS 2024 Oral | 小参数,大作为!揭秘非对称 LoRA 架构性能
...视为专家,自动将训练样本划分到对应的组件进行微调。推理阶段:HydraLoRA 通过训练完成的路由器,灵活且动态地合并多个 B 矩阵,以满足不同任务和数据的需求。这样的设计使得模型能够高效地适应多样化的应用场景,提升...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...训练。 故而,Step-2总参数量达到万亿级别,每次训练或推理所激活的参数量也超过了市面上的大部分Dense模型。此外,Step-2的训练过程中,阶跃的系统团队突破了6D并行、极致显存管理、完全自动化运维等关键技术,支撑起了整...……更多
阿里云发布通义千问2.5,性能赶超GPT-4 Turbo
...相比此前的通义千问2.1版,通义千问2.5的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%,中文能力更是持续领先业界。根据权威基准OpenCompass的测评结果,通义千问2.5得分追平GPT-4 Turbo,是该基准首次录得国...……更多
字节、阿里云、百度大模型价格混战:低价背后是数据竞争,爆款尚未出现
...要靠技术层面”。在字节“开启”大模型价格战后不久,腾讯云副总裁、腾讯云智能负责人吴运声在接受澎湃新闻记者采访时对此回应称,腾讯大模型的底层能力和构建工具链都在快速迭代过程中,未来会把核心精力放在产品和...……更多
...花顺目前的AI模型就配备有“深度思考模块”,而用户在腾讯元宝、抖音豆包等AI模型中都可以轻而易举地找到该模块。这一技术线路相比普通的计算路径更加消耗算力,推理模型通过多步骤分解问题并模拟人类思维过程(如尝...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...状就是 LLM 难以正确应对的领域。对这些模型来说,空间推理和解释抽象视觉描述并不自然,而且它们常常无法完成人类认为相当容易的任务。这里的选择是来自 Big-Bench Hard(BBH)基准的 geometric_shapes 数据集:给定一个完整的 SVG...……更多
OpenAI造芯计划曝光!拟自研AI芯片 英伟达强敌来了
...,多数微软员工至今都没有权限访问OpenAI的代码库和模型权重等内部技术。微软还曾有内部文件流出,表示Azure的销售人员在面对客户时要说明微软能比OpenAI提供更多服务。更何况OpenAI还早就留了一手,在付完微软和其他VC的利...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...精度,还显著降低了计算负担,完美解决了时序大模型在推理阶段的计算瓶颈。2. 灵活的预测范围:Time-MoE支持任意长度的输入和输出范围,能够处理从短期到长期的各种时序预测任务,实现了真正的全域时序预测。3. 全球最大...……更多
智源评测体系发布 国内外“百模”评估结果出炉
...评测结果显示,OpenAI Sora、Runway、爱诗科技PixVerse、Pika、腾讯VideoCrafter-V2位列前五。 文生图模型的客观评测指标与主观感受差异巨大,有失效的迹象,因此排名以主观评测为准;Mdjourney基本无法理解中文提示词,因此排名靠后...……更多
Pika爆火,但AI视频还没到「GPT时刻」;首个GPT-4驱动的人形机器人;微软小模型击败大模型丨AI新零售早报
...发布了一个仅有27亿参数的小型模型Phi-2,它在多数常识推理、语言理解、数学和编码任务上超越了其他大型模型。尽管Phi-2的参数数量较少,但它在复杂的基准测试中展示了出色的性能,甚至超越了参数数量是其25倍的模型。微...……更多
腾讯云公布多项大模型产品进展
本文转自:人民日报客户端施芳腾讯云生成式AI产业应用峰会日前在北京召开,公布大模型研发、应用产品的系列进展。以“产业实用”作为发展大模型的核心战略,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示...……更多
通义千问系列AI开源模型升至Qwen2:5个尺寸,最高 128K tokens
...有尺寸的模型都使用了 GQA,以便让大家体验到 GQA 带来的推理加速和显存占用降低的优势。 模型评测相比 Qwen1.5,Qwen2 在大规模模型实现了非常大幅度的效果提升。我们对 Qwen2-72B 进行了全方位的评测。在针对预训练语言模型的...……更多
国产GPU为底座,摩尔线程首个千卡智算中心落地
...型生态联盟,致力于夯实从智算基础设施到大模型训练与推理的国产大模型一体化生态。摩尔线程CEO张建中在主题演讲中带来新品发布,包括大模型智算加速卡MTT S4000,以及专为千亿参数大模型训练和推理提供强大支持的摩尔线...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大...……更多
刘庆峰谈科大讯飞与华为合作:任正非高度重视,双方共同看好,非干不可
...“心中有数”,也很清楚与GPT-4在小样本快速训练、复杂推理、多模态综合使用、长文本内容等方面还有差距。“国内大模型都有不小差距,那些说跟它差不多的,我觉得还是要更客观。要有科学精神,才能真正实现从追赶到超...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并行能...……更多
大模型落地竞赛打响:腾讯加速AI产业化,5分钟可开发一款AI应用
腾讯云生成式AI产业应用峰会现场,图片来源:时代财经记者摄自去年9月发布混元大模型后,腾讯大模型迎来最大一次升级。5月17日,在“腾讯云生成式AI产业应用峰会”上,腾讯披露混元大模型的一系列新的进展,包括智能体...……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...的 agent,是关键的一步。而这篇论文就重点研究了扩展「推理期计算」(inference-time computation)这个问题。研究团队分析了扩展测试时计算的两种主要机制:(1)针对密集的、基于过程的验证器奖励模型进行搜索;(2)根据测...……更多
...程,为大模型训练提供了高质量的学科专业数据集和逻辑推理数据集。除此之外,浪潮信息提出基于单元测试的数据清洗方法,可更高效地获取高质量数据集,提高训练效率。“有限的算力资源下,训练数据的质量直接决定了模...……更多
Nature新研究提出新型忆阻器,比Haswell CPU高效460倍
...精度不足的根源在于其物理性质不够理想,包括非线性的权重更新、不对称行为、噪声、电导漂移和设备间差异。这是神经形态计算的一个根本性挑战。为了解决这个问题,需要发明一种能嵌入到电路中的元件,并且嵌入数量要...……更多
努比亚/红魔将接入DeepSeek R1:6710亿参数满血嵌入系统
...语言理解和生成能力,在自然语言处理、代码生成、逻辑推理等多个关键领域均表现优异。DeepSeek R1的参数范围从15亿到6710亿个不等,性能上比肩OpenAI o1。其最大参数版本拥有6710亿参数,采用MoE(专家混合)架构,每个token激活3...……更多
阿里云支持一键部署DeepSeek-V3/R1!仅需3步、0代码
...写代码,即可通过阿里云平台实现从模型训练到部署再到推理的全过程,极大地简化了AI模型的开发流程。根据官方介绍,一键部署DeepSeek模型的操作流程非常简单,仅需以下3步:登陆PAI控制台,在左侧导航栏选择工作空间列表...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁蒋杰率先透露,腾讯混元大模型本身正在积极部署多模态甚至全模态技术。本月除了腾讯与智谱,快手视频生成大模型可灵AI也宣布基础模型再次升级,并...……更多
GPT-4劲敌,谷歌进入高能+高产模式
...参数划分为多个组别而实现的计算的稀疏化,即每次执行推理任务时,根据对输入类型的判断,MoE模型会通过门控网络选择性地激活神经网络中最契合指令的专家参与计算。这种专业化、模块化的划分可以在提升预训练计算效率...……更多
智算领航,移动云携手伙伴共筑大国智能基座!
...大的机遇和挑战,通用大模型训练以及基于成熟大模型的推理业务场景算力需求旺盛,成为智算服务发展重点赛道。在5月24日举办的数字中国建设峰会中国移动人工智能生态大会主旨论坛上,中国移动宣布开放大模型训练基地。...……更多
商汤久违爆发
...司推出6000亿参数大模型(日日新5.0),在知识、数学、推理和代码能力方面大幅提升,综合性能全面对标GPT-4Turbo。同时,公司推出行业大模型一体机版本以及移动端侧大模型SDK版本。二级市场上,今年以来,商汤股价接连走低...……更多
百度云升级模型服务,百度版GPTs即日开放 | 最前线
...在侯震宇看来,是AI生态发展的关键一年。一方面,算力推理层和模型训练工具链的优化,将是2024年的重点。他表示:“2024年我觉得算力的整体供应不确定性或紧张程度较大,所以如何能够更有效使用算力资源,是一个大家都...……更多
360智脑成全国首个原生安全的大模型产品之一
...360全家桶,正式面向公众开放。今天早些时候,阿里云、腾讯云陆续官宣通过“大模型标准符合性测试”的评测。首批通过官方测试的大模型共4家,分别为阿里通义千问、腾讯混元大模型、360智脑和百度文心一言。 ……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...k-1正式对外开源开放,用户可直接通过磁链下载基本模型权重和网络架构信息。(图/钛媒体)xAI表示,Grok-1是一个由xAI 2023年10月使用基于JAX和Rust的自定义训练堆栈、从头开始训练的3140亿参数的混合专家(MOE)模型,远超OpenAI...……更多
更多关于科技的资讯:
坚定信心 勇挑大梁·产业新亮点丨河北特色产业集群共享智造故事(五):关键设备共享为宁晋线缆带来什么
关键设备共享为宁晋线缆带来什么——河北特色产业集群共享智造故事(五)11月26日,位于宁晋县的缆芯高导(河北)科技有限公司共享车间
2025-12-10 08:07:00
厦门网讯(厦门日报记者 吴晓菁 通讯员 许佳琦 杨怡婷)昨日,厦门空港元翔货站跨境电商出口区一片忙碌景象,一辆辆满载货物的叉车来回穿梭
2025-12-10 08:38:00
警惕伪装成办公文件的木马病毒窃密 国家安全机关提示
中国网12月10日讯 据国家安全部微信公众号消息,国家安全部发布安全提示文章,“本月考勤公示”“年度放假安排”“高温补贴发放声明”等办公类文件
2025-12-10 08:41:00
清华、维信诺联合开发的pTSF技术破解OLED“不可能三角”,中国显示掌握关键材料主导权
屏幕,作为用户感知数字世界的核心窗口,其进化正迈向关键阶段。随着AMOLED技术加速向笔记本电脑、车载等中大尺寸应用渗透
2025-12-10 11:13:00
智能机器人大赛昌平收官 73支队伍四大赛道沉浸竞技 机器人实战化任务催生真实行业解决方案
本报讯(记者 张月朦)12月8日至9日,2025智能机器人大赛决赛在昌平举办。大赛设制造业类、康复养老类、安全应急类和创新类四大赛道
2025-12-10 14:14:00
研究揭示:人生黄金期在55-60岁,整体能力达顶峰
鲁网12月10日讯人们普遍认为,“年轻即巅峰”。然而,一项发表于国际权威心理学期刊《智力》的最新研究,彻底颠覆了这一传统认知
2025-12-10 16:21:00
鲁网12月10日讯山东移动临沂分公司坚决落实“以人民为中心”发展理念,强化“全心全意为人民服务”的宗旨意识,筑牢高质量发展生命线的服务方针
2025-12-10 16:24:00
潮评丨从独角兽榜单看浙江创新之势
全球独角兽企业数据库(Unicorn500)潮新闻讯 据央视新闻报道,近日,2025全球独角兽企业500强榜单发布,我国共有150家企业上榜
2025-12-10 16:24:00
大河网讯 (记者 李彤)大家好,我是水银体温计。我的时间,已经进入了倒计时。一直以来,我是每个家庭药箱里不可少的存在。我见证过无数滚烫的额头
2025-12-10 17:16:00
公益广告H5丨安全快门 快乐连拍
扫描二维码进入H5
2025-12-10 17:28:00
福州新闻网12月10日讯(记者 吴桦真)记者10日获悉,福州企业米多多集团股份有限公司正式向香港联交所递交招股说明书,拟主板上市
2025-12-10 18:02:00
大数据产业从“单点布局”迈向“生态闭环” 张家口数字经济拔节向上河北日报讯(郭晓通、王雯)“十四五”时期,张家口市把数字经济作为高质量发展的重要增长极
2025-12-10 18:34:00
QuestMobile报告:00后月活用户达1.79亿,闲鱼增速领跑移动购物行业
12月9日,第三方数据机构QuestMobile发布《2025“00后”用户消费洞察报告》,显示闲鱼00后月活跃用户规模达到4361万
2025-12-10 19:13:00
AI如何走进职教课堂?阿里公益联合北大教育学院探索新路径
12月9日,阿里巴巴公益联合北京大学教育学院联合主办AI+职业教育学术研讨会,分享双方在职业教育与人工智能融合领域的研究成果
2025-12-10 20:12:00
中国科大构建高性能圆偏振光电逻辑门
大皖新闻讯 12月10日,大皖新闻记者从中国科学技术大学获悉,该校庄涛涛教授团队设计了基于手性选择性光电转换的圆偏振光电逻辑门
2025-12-10 20:13:00