• 我的订阅
  • 头条热搜
大模型“遍地”都是,谁能真正解放生产力?
...各自发挥了不同的价值。通用大模型解决基础性问题统一架构、统一模态、统一任务,而专用大模型解决专业领域知识问题,通过结合行业数据的预训练实现业务场景应用。而迫切寻求数字化转型的客户们需要的是,更精准、更...……更多
OpenAI发布文生视频模型Sora,奥尔特曼选取网友提示词
...用扩散模型(diffusionprobabilisticmodels)技术,基于Transformer架构,但为了解决Transformer架构核心组件注意力机制的长文本、高分辨率图像处理等问题,扩散模型用可扩展性更强的状态空间模型(SSM)主干替代了传统架构中的注意力...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...出得更早,方法更前瞻,落地应用也更快。他们所采用的架构,已经可以和o1匹敌,如果更新到下一代大模型,甚至还有可能实现领先。没错,这次周鸿祎和OpenAI所采用的路线殊途同归,不谋而合了。360首创的CoE架构,已经可以...……更多
MiniMax进化论:一群「偏执者」的破浪前行
...Hailuo 02还采用了创新的NCR(Noise-aware Compute Redistribution)架构。这一架构通过噪声感知机制,将计算资源按照需求分配给不同的区域。高噪声区域的信息密度较低,进行压缩处理;低噪声区域则分配更多的计算资源,重点捕捉关...……更多
...自主研发,有三大特点:安全可靠,采用全栈国产化技术架构,确保数据安全与技术自主可控;精准高效,针对出版场景深度优化,形成区别于通用大模型的专用智能体系;内容纯净,创新半封闭运行模式,既可通过接口调用外...……更多
新一轮ai算力调度平台的重要性
...中,客户对于算力的需求、对应用的要求,以及对于底层架构都在发生变化。”青云科技总裁林源在接受记者采访时表示,新一轮的变化就是新一轮的机会。AI算力开启“数智化”时代,带来新机遇当前,自动驾驶、人脸识别、...……更多
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...它们可能有助于更有效地执行下游任务。图 2. ProMaC 整体架构 实现方法如图 2 所示,该研究提出了一个循环优化的 ProMaC 框架,它包括两部分:利用幻觉来从任务通用提示中推理出样本特有提示的 multi-scale chain of thought prompting ...……更多
国产模型指令跟随全球第一!来自LeCun亲推的最难作弊LLM新榜单
...韵、意境等方面,都能有精准的把控。完全自主研发,MoE架构,万亿参数在这次因为LiveBench又出来炸场一波之前,Step-2留给外界的最深刻印象,一定有一个是“国内首个由初创公司推出的万亿参数大模型”。这有点像阶跃风格的...……更多
自研芯片三国杀,头部智驾新战场,蔚小理谁强?
...模型,理想为了解决端到端大模型可解释性差的问题,将架构升级为「端到端+VLM」,而小鹏则和特斯拉一样坚信纯视觉才是智能驾驶的终局,发布了下一代AI鹰眼纯视觉方案。但是要最大限度的发挥算法的能力,必须要有和软件...……更多
0提示词就能续写小说!彩云科技首创DCFormer架构大模型,AI秒变网文产粮神器
...沟通会上,AI技术公司彩云科技正式推出首款基于DCFormer架构开发的通用大模型“云锦天章”,旗下AI RPG平台“彩云小梦”也成为首款基于DCFormer架构开发的AI产品。与此同时,彩云科技CEO袁行远就AI大模型落地应用难、大模型未...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...成数据使任意语言模型具备语音交互能力。Mini-Omni 模型架构Mini-Omni 整体模型框架如下图所示,模型输入端可以是语音或文本,输出端同时包含文本和语音。为复用语言模型「预测下一个 token」的学习范式,输出侧语音采用离散...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...科学家林达华。过去一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验...……更多
光芯片再次突破!清华大学研制出“太极-II”光训练芯片:首创全前向智能光计算训练架构【附光芯片行业现状分析】
...琼海院士课题组另辟蹊径,首创了全前向智能光计算训练架构,研制了“太极-II”光训练芯片,实现了光计算系统大规模神经网络的高效精准训练。该研究成果以“光神经网络全前向训练”为题,于北京时间8月7日晚在线发表于...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...工智能基础模型迫在眉睫。智谱AI于2020年底研发GLM预训练架构,三年多来始终坚持全自研路线,新一代基座大模型GLM-4是智谱 AI专注于大模型创新的最新成果。智谱 AI愿与人工智能行业所有的参与者、产业链上下游合作伙伴、开...……更多
AI大模型有望再扩1000倍!剑桥耶鲁康奈尔:PNN是变革关键
...处理。 计算模拟训练可以快速探索、验证和测试各种PNN架构,有助于在进行实际的物理建构之前提高PNN的准确性和功能性。这种方法不仅速度更快,成本效益更高,无需为每次设计迭代建立和优化昂贵而耗时的物理系统,还具...……更多
腾讯推出新一代快思考模型混元 Turbo S,将在腾讯元宝逐步灰度上线
...同时在知识、数理、创作等方面也有突出表现。通过模型架构创新,Turbo S部署成本也大幅下降,持续推动大模型应用门槛降低。来源:腾讯云官网腾讯表示,“吐字快、秒回你的大模型,即将装进元宝。”针对为何要实现“秒...……更多
DeepSeek-VL2 开源:AI视觉模型迈入 MoE 时代
...数据,引入梗图理解、视觉定位、视觉故事生成等新能力架构:视觉部分使用切图策略支持动态分辨率图像,语言部分采用 MoE 架构低成本高性能训练:继承 DeepSeek-VL 的三阶段训练流程,同时通过负载均衡适配图像切片数量不定...……更多
京东云:智能体大规模“上岗”,企业深度应用正当时
...础设施走向标准化随着大模型应用的深入,以CPU为中心的架构在支持AI原生应用上面临挑战,需要以GPU为中心重塑基础设施;此外,面对激增的推理需求,计算资源持续增加,企业需要思考资源投入产出的问题,都指向需要一套A...……更多
围绕算力+数据,矩阵起源建设开源 AI 原生软件平台
...语言交互能力撼动了整个世界。之后十几个月,Transformer架构和大语言模型LLM成为划时代的技术,激发了整个AGI领域的创业和创新。OpenAI和Google相继推出了GPT-4o、ProjectAstra等「AI全家桶」、字节跳动发布「豆包」大模型家族、腾...……更多
利润暴涨628%,AI霸主英伟达全产业链投资图鉴|智氪
...,要关注哪些产品?根据英伟达官网披露,在每一代的GPU架构下,公司会将旗下的GPU按品牌分类进入GeForce、NVIDIA RTX/Quadro、数据中心三个品类。其中,GeForce系列主要应用于游戏行业,属于消费级GPU;NVIDIA RTX/Quadro主要应用于工业...……更多
比AI更热的行业,跑出了头部选手
...技术也正在迎来技术变革。那么首先要变革的,就是底层架构。在车辆的电子电气架构方面,特斯拉是早期变革者,在2012年 Model S有较为明显的功能域划分,包括动力域、底盘域、车身域, ADAS模块,到2017 年特斯拉又在Model3 突...……更多
腾讯自研大模型助力长三角打造世界级产业集群
...中文能力已追平GPT-4。多模态能力层面,混元文生图基础架构全面升级至Sora同款DiT架构,成为国内首个中文开源文生图Dit架构的大模型。为服务大模型产业发展,腾讯云推出大模型训练“黄金三件套”。新一代HCC高性能计算集群...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...a这样的大型Transformer提炼成了Mamba模型, 并且成功在Mamba架构上应用了带有硬件感知的推测解码算法,提高了整个模型的推理速度。为什么要把Llama变成Mamba?因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了,相关...……更多
谷歌「诚意之作」,开源9B、27B版Gemma2,主打高效、经济!
...现,从而大大降低了部署成本。 谷歌团队在重新设计的架构上构建了Gemma 2,使得这位Gemma家族的新成员既能提供卓越的性能,又具有高效的推理能力。简要概括一下,性能、成本、推理是它的突出特点:性能卓越:Gemma 2 27B模...……更多
不是RNN的锅!清华团队深入分析长上下文建模中的状态崩溃,Mamba作者点赞
... token 对应 B 字节的循环状态)。这个 B 值可能是由模型架构决定的? 「反过来说,过分担心循环模型的长度泛化问题可能是一个误区。我们无需设计新机制或特殊的缓解措施:只需要在更长的序列上训练(因为是线性时间复杂...……更多
独家对话岩芯数智CEO刘凡平:“百模大战”下,AIGC新玩家如何杀出重围?|钛媒体焦点
...其他大模型产品,目前岩芯数智不仅拥有自研的Transformer架构大模型,而且其拥有的非transformer的记忆逻辑架构大模型,在训练效率、推理效率、模型幻觉、应用效果等方面都得到很大提升,已开始应用于金融、政务、互联网等...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...来学习分子交互规律的短板。同时,凭借显式的、统一的架构,MolTC 可以在少样本、甚至零样本的交互任务中,仍能保持精准高效的输出。另一方面,当前大多数的分子交互模型,不管是基于传统的深度学习模型,还是基于经典...……更多
国云注智 聚力向新 第七届数字中国建设峰会·电信生态成果体验馆盛大开馆
...等多种异构算力的统一接入,具备跨服务商、跨地域、跨架构的统一算力管理调度能力,实现国资央企算力一张网。服务国资央企业务体验和成本最优匹配,降低上云成本;推进国资央企范围的优质算力资源利用最大化。 在“A...……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...尺度物体,大到建筑,小到工具花草。 Hunyuan3D-1.0采用DiT架构,与混元DiT生图联合,支持原生中文,支持风格定制。其技术架构引入多视图扩散,借助二维数据优势提升3D泛化性,改进点包括:1、持续扩展数据规模、类目、质量...……更多
采用MoE大模型,清华创业团队医者AI构建健康管理Agent
...者等组成。公司聚焦于亚健康管理领域,基于最前沿的MoE架构大模型,结合软硬件,为用户提供7*24小时的健康管理服务,让每个家庭都有自己的健康管家AI及Healthy Care Agents。医者AI产品界面据世界卫生组织统计70%以上,总计约9.5...……更多
更多关于科技的资讯:
20日,国家人工智能应用中试基地(医疗)·浙江正式开园并发布系列重大成果。其中,浙江省推出的全国首个数实融合的“安诊儿”医疗智能体升级至3
2025-12-21 07:20:00
河北日报讯(见习记者康晓博)12月19日,中国气象局在雄安新区发布气象人工智能科学模型“风源”(以下简称“风源”)。该模型将通过提供开源开放科创平台底座
2025-12-20 08:21:00
2025年,港交所成为中国机器人企业的上市“热土”。据不完全统计,年初至今,超30家机器人相关企业向港交所递交申请表,业务范围覆盖核心零部件
2025-12-20 08:23:00
鲁网12月19日讯为加快数字人民币业务拓展,提升数字钱包渗透率,抢占支付市场与同业市场,工商银行泰安分行精心组织、强力推进数字人民币单位钱包拓展工作
2025-12-20 09:07:00
中国科大提出视觉与波动特征融合的异常检测框架
大皖新闻讯 城市地面下的空洞、裂缝和其他隐蔽灾害如若未被及时发现,会存在一定的安全隐患。12月20日,大皖新闻记者从中国科学技术大学获悉
2025-12-20 11:05:00
12月15日,工信部正式公布我国首批L3级有条件自动驾驶车型准入许可,两款分别面向城市拥堵场景和高速公路场景的车型将在北京
2025-12-20 12:13:00
鲁网12月20日讯为进一步提高服务水平,提升业务竞争力,莱芜农商银行高新区公司业务营销中心优化办贷流程,坚持“我们多跑趟
2025-12-20 15:11:00
这支年轻团队在合肥逐梦星辰 致力打造国内首款电循环液体运载火箭
大皖新闻讯 几天前,关于合肥要造火箭的消息引发外界广泛关注,背后则是合肥星火空间科技有限公司(以下简称星火空间)落户合肥新站高新区
2025-12-20 15:13:00
莱芜农商银行钢城区公司业务营销中心:提升厅堂质效 强化精准赋能
鲁网12月20日讯为进一步深化“以客户为中心”的服务理念,提升金融产品渗透率与客户满意度,近日,莱芜农商银行钢城区公司业务营销中心精心策划并开展了一场主题为“金融惠民进厅堂
2025-12-20 15:13:00
鲁网12月20日讯为强化基础营销工作,深入推进“做小做散”战略,莱芜农商银行公司金融部全面开展“千企万户大营销”基础工作专项活动
2025-12-20 15:13:00
鲁网12月20日讯小微企业是区域经济发展的“毛细血管”,是稳就业、保民生的重要支撑。作为扎根本土的金融机构,莱芜农商银行营业部始终坚持以优质信贷服务支持辖内小微企业发展
2025-12-20 15:14:00
日前,晋塔塔式起重机远程智能辅助驾驶系统正式在太原“锦绣汾东”落地应用,这是太原首次投入使用的塔式起重机智能辅助驾驶系统
2025-12-20 17:48:00
“众星・长白岐黄” 中医药大模型正式发布
由吉林省委命题,长春中医药大学校长冷向阳教授牵头制定并实施《落实“AI+中医”具体行动方案》,吉林工商学院副院长赵佳教授领衔
2025-12-20 19:52:00
厦门网讯 (厦门日报记者 林露虹)来自厦门的光通信电芯片“单项冠军”登陆科创板。昨日,厦门优迅芯片股份有限公司在上交所科创板上市
2025-12-20 08:51:00
摘要:随着企业业务复杂度的提升与项目制运营的普及,多项目并行管理成为企业提升效率与竞争力的重要模式。然而,项目间的资源冲突
2025-12-20 05:18:00