• 我的订阅
  • 头条热搜
昆仑万维:“天工大模型3.0”将于4月17日正式发布 同步开源4000亿参数MoE超级模型
...了全面的性能升级,其采用4000亿级参数MoE混合专家模型架构,是目前全球模型参数最大、性能最强的MoE模型之一。“天工3.0”的模型能力提升体现在以下四大方面:1、逻辑推理能力更强:更聪明逻辑推理能力的提升对于大模型...……更多
世界上第一项针对人工智能“大脑”的研究,剖析并编辑它的思想
...前的大多数软件非常不同。它们的人类创造者已经建立了架构,基础设施和方法,通过这些人工智能可以开发他们的智能版本,他们已经给它们提供了大量的文本,视频,音频和其他数据,但从这一点开始,人工智能已经向前发...……更多
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...AGI元年(2024)。自2017年谷歌提出Transformer机器学习模型架构后,该架构迅速席卷了整个人工智能领域,成为自然语言处理等相关研究的主要方法。2018至2020年是算法创新年,先后出现了基于Transformer的BERT、GPT/GPT-2/GPT-3、T5等基于...……更多
AI产业化拐点前夕,百丽时尚解构「智能化」
...科技,自身也在迭代企业数据智能管理产品。在Data Fabric架构理念下,滴普科技开发了湖仓一体的智能化数据平台,让新的数据管理模式能够更敏捷高效地被融入大模型驱动的数据分析、智能执行。滴普科技的技术路径,亦可观...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...科学家林达华。过去一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验...……更多
创新,是从积累到突破的过程
...行业大模型和算法“双备案”。自主设计了“1+3+N”技术架构,建设了领先基础模型+多参数组合的模型矩阵,不断探索实践Pre-instruction-tuning混合预训练策略、self-instruct问答对生成、知识蒸馏新知识注入、long-CoT思维链数据增强...……更多
rockaiyan架构大模型通过备案
...,上海岩芯数智人工智能科技有限公司(以下简称RockAI)的Yan架构大模型成功通过《生成式人工智能服务管理暂行办法》备案,这是国内首个非Transformer架构大模型通过备案。Yan模型简介Yan架构大模型是国内首个非Transformer架构、非Atte...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...。目前人们有一个普遍的看法:在这种曲线拟合范式中,架构并不重要,关键的因素是数据集。但到了阶段 3,架构就会变得和数据一样重要。核心的难题是如何在统计模型的基础上有效表达少数个体的数据。该研究关注的核心...……更多
顶流大模型应用!天工AI不炫技,实测真正的生产力工具
...第一次在AIGC领域领跑全球。并在发布之初就公开了技术架构,要知道目前全球还没有公开可用的开源音乐模型可用,suno到现在也未公开技术架构。「天工SkyMusic」自研AI音乐大模型技术架构AI音乐的出现,让普通人的音乐创作成...……更多
...的自动驾驶系统开发进入了全新模式,新开发模式和技术架构将加速汽车智能化的进化进程。中国工程院外籍院士、清华大学智能产业研究院(AIR)院长张亚勤表示,AI大模型带来了从判别式AI到生成式AI的新技术范式变革,清华...……更多
夸克上线“AI解题大师” 用深度思考帮用户讲透难题、拓展思维
...AI旗舰应用,夸克发布了“AI超级框”,以超级Agent的产品架构,帮助用户去完成各类任务。其中,夸克持续迭代AI学习产品的能力边界,为用户提供多场景、多能力、多形态的学习服务。此前,夸克“灵知”学习大模型在考研数...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...来学习分子交互规律的短板。同时,凭借显式的、统一的架构,MolTC 可以在少样本、甚至零样本的交互任务中,仍能保持精准高效的输出。另一方面,当前大多数的分子交互模型,不管是基于传统的深度学习模型,还是基于经典...……更多
4000亿参数,国产大模型硬刚Llama 3?|钛媒体AGI
...的成功案例。具体来说,天工SkyMusic采用与Sora类似的模型架构,包含三大核心模块——Encoder、DiT(Diffusion Transformer)和Decoder。其中,Large-scale Transformer负责谱曲,学习Music Patches的上下文依赖关系,同时完……更多
GPT-4劲敌,谷歌进入高能+高产模式
...模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日,Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后,谷歌在……更多
vivo开发者大会,带来了哪些惊喜?
...还可以实现兼容开源鸿蒙的应用,vivo也直接公布了系统架构。同时vivo宣布vivoWatch3首款搭载蓝河操作系统。 安全方面,OriginOS4升级了“千镜可信引擎+”,在人文方面,推出了vivo看见功能,支持环境描述、拍摄辅助和物品查找...……更多
数字员工、超级个体、具身智能,AI Agent未来发展十大研究方向
...提出。 为了创建生成式智能体,研究者构建了一个系统架构,此架构扩展了大型语言模型的功能,使其能够存储智能体使用自然语言的经验记录。随着时间的推移,这些记忆会被整合为更高级别的思考,并被动态检索以规划智...……更多
吉林银行:深耕数字金融 科技赋能 打造高质量发展的“吉林样板”
...念,创新数字金融发展模式,通过构建“XMART”金融科技架构体系,利用科技力量打造和完善数字化应用能力,全力书写数字金融大文章,为地方经济高质量发展注入强劲动能。 战略引领:顶层设计驱动全面转型吉林银行以《...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...”赵东岩强调,DeepSeek等大模型的幻觉来自于本身的技术架构和基于统计的机器学习范式,是大模型的内生性缺陷。因此,可以说大模型的创造力与幻觉是相伴相生的。他认为,要从根本上减少大模型幻觉,可以从让大模型学习...……更多
什么是AGI?人工智能的未来
...人员手工制作。这包括专业系统、复杂逻辑和搜索算法、架构规划和调度系统等。其最显著的成功案例包括IBM在1997年的国际象棋冠军Deep Blue以及Jeopardy智力问答游戏冠军Watson。第二波浪潮——神经网络:在2012年左右如海啸般来...……更多
大模型降价背后,国产大模型的竞争逻辑变了
...型全面升级,并对外开源。这也是首个中文原生的类 Sora架构开源模型,支持中英文双语输入及理解,参数量15亿。放眼市场,当下的文生图开源生态,比如Stable Diffusion基本围绕英文语义理解,要先把中文翻译成英文才能生成图...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...现跨设备、跨域、跨品牌算力融合管理 6、支持各类模型架构:多种模型种类的支持,如大语言模型、多模态模型等;多种模型架构支持,如单体模型架构、MoE模型架构 7、平台提供多种模型微调方式:支持RLHF、LORA、P-turning等多...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...学的研究团队进行了一项全面的研究,系统地探讨了模型架构、训练方法和数据整理策略之间的相互作用,并提出了一种名为 STIV 的简单、可扩展的文本、图像条件视频生成方法。他们的框架通过帧置换将图像条件整合到扩散 Tr...……更多
黄仁勋:我从不在乎市场份额、英伟达唯一目标是创造新市场
...CPU上效率不高的工作转移到GPU上发明新的数值精度开发新架构(如张量核心)采用高速内存(HBM)通过MVLink和InfiniBand实现系统扩展这种快速发展使我们从人工编程转向了机器学习,整个技术栈都在快速创新和进步。Q:模型规模扩展方...……更多
百度世界2023剧透丨百度将发布国内首个生成式商业智能产品
...百度智能云技术委员会主席、百度智能云应用产品中心总架构师孙珂表示,即将在10月17日发布的百度GBI可以把数据分析,从以天为单位,缩短到以分钟为单位。首先,传统BI只有专业人士才能操作,而GBI能直接听懂总裁问题,实...……更多
腾讯混元上线文生视频并开源,120秒内成片!还有提示词建议
...态ScalingLaw,增强时空建模与动态表现;4、采用自研3D VAE架构,提升图像和视频的重建能力。与此同时,腾讯宣布将这款拥有130亿参数规模的视频生成模型开源。目前,该模型已在APP与Web端发布,其标准模式下的视频生成大约需...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...究团队提出了轨迹基础模型的构建范式,旨在通过其模型架构设计和数据集支撑的流程,克服现有方法的局限性,实现跨任务、跨区域的泛化能力,并在不同数据质量下保持鲁棒性。具体来说,研究团队首先收集了一个全球范围...……更多
致敬浪潮“她”力量丨成功秘诀?不过是把“我能行”,用代码写了千万遍
...模态关键技术时,薛娇将自己的主要精力投入在核心技术架构设计以及研发资源统筹上,通过每周固定时间召开例会的方式深入了解团队当前研发痛点,并给予专业指导意见,借助这种精细化、系统化的工作模式,薛娇带领团队...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比如官...……更多
...网页,打开对话框,输入指令,数秒之内,便可获得文章架构……这样的应用场景近期出现在多所高校中。今年新学期开学,中国人民大学在自主研发的教学科研行政平台中接入了“满血版”DeepSeek,在学校算力的支持下,老师...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...题,研究团队新的基础模型OpenCity。OpenCity结合了Transformer架构和图神经网络,用以模拟交通数据中复杂的时空依赖关系。通过在大规模、异质性交通数据集上进行预训练,OpenCity能够学习丰富、具有泛化性的表征,这些表征可有...……更多
更多关于科技的资讯:
能源革命与数据革命深度融合,电鸿生态加速电力系统数智化转型
初冬的广州南沙温暖如春、花团锦簇,大涌新春居民贺泽庶开着他心爱的电动车,开进了绿树与鲜花簇拥的广州南沙环市西路超充站,当车头对准充电桩时
2025-11-30 12:06:00
促进民营经济高质量发展·超能量的“中小微”(十九)|乡村小厂造出“搬运神器”
11月12日,智捷智能科技香河有限公司工作人员在室外场地对智能搬运叉车进行调试。 河北日报记者 刘英摄11月12日,天津滨海新区一处海滩上
2025-11-29 07:31:00
厦门网讯(厦门日报记者 许舒昕)在注意力被算法切割的当下,一张纸质报纸竟在粉丝圈掀起抢购潮——从常规售价2元到二手平台单份22
2025-11-29 09:13:00
一、大数据视域下高校学生资助精准识别与分配的核心概念界定大数据技术是对数据进行加工、整理与计算的技术。其核心在于通过信息存储
2025-11-29 12:02:00
大数据技术在高校学生资助工作中发挥了重要保障作用。相对于传统资助模式存在的问题。大数据通过整合多源数据、构建评估模型,能够实现从被动申请到主动发现的转变
2025-11-29 12:20:00
从迷失到笃行:一位古贝春经销商的二十载商海沉浮与顿悟
鲁网11月27日讯(记者 赵洪斌)在鲁北商业版图上,王文俊的名字与古贝春酒业紧紧相连。然而,这段长达二十余年的合作关系
2025-11-28 08:45:00
近日,广东宇太能源与河北某工业玻璃龙头企业签约,合作利用空微子发电技术降低企业电耗。该项目由玻璃企业投资,宇太能源提供技术及设备支持
2025-11-28 08:57:00
罗振宇、张夕勇、杨慧林、罗军民四位大咖重磅推荐,杨钧博士《未来竞速》即将出版发行
百年汽车产业大变局的必读之作。近日,由国内汽车行业资深媒体人与研究观察者杨钧博士撰写的新书《竞速未来-全球新能源汽车的崛起与挑战》一书已由中国出版集团中译出版社正式出版发行
2025-11-28 09:27:00
近日,鹏华基金发布公告,旗下科创创业人工智能ETF鹏华 (认购代码:588413)于11月28日正式发行。作为首批双创人工智能ETF中的一员
2025-11-28 10:11:00
入选概率不及万分之二,阿里千问斩获顶级AI会议最佳论文
11月28日消息,人工智能领域顶级会议NeurIPS 2025公布了论文奖,阿里通义千问团队最新研究成果从全球2万多篇投稿论文中脱颖而出
2025-11-28 11:01:00
11月24日,位于启东市南阳镇的朗峰新材料启东有限公司生产车间内,自动化生产线高速运转,一条薄如蝉翼的银色金属带材从特制喷嘴中“飞”出
2025-11-28 11:05:00
济南轨道交通集团举办财务资本培训,实战专家孙春浩解析财务精英三级跃迁路径
近日,济南轨道交通集团全资子公司莱芜交通发展集团成功举办财务管理及融资业务培训。本次培训由集团财务管理部部长刘文芹主持
2025-11-28 11:09:00
锚定本土、驱动创新的金融实践!青岛银行荣膺CFV“最佳品牌竞争力城商行”奖项
11月21日,在上海举办的“2025第一财经金融价值年会”上,青岛银行凭借在科技金融、绿色金融、地方经济服务及创新能力方面的突出表现
2025-11-28 11:18:00
挂号缴费不用跑!微信医保移动支付在北京140家公立医院全面上线
近日,北京市参保市民就医迎来“智慧升级”——微信医保移动支付功能已在中国医学科学院、北京协和医院、北京大学人民医院等140家公立医院全面上线
2025-11-28 11:28:00
河北省煤田地质局物测队引入新装备提升探测能力
河北新闻网讯(吕若汐、齐彦红)11月18日,地球物理勘探设备供应商法国塞赛尔公司正式向河北省煤田地质局物测队交付了两套数字地震仪(激发系统)诺玛德65尼奥
2025-11-28 11:53:00