• 我的订阅
  • 头条热搜
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
就在刚刚,Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍,Llama 3 在 24K GPU 集群上训练,使用了 15T 的数据,提供了 8B 和 70B 的预训练和指令微调版本,可以支持广泛的应用。同时,Llama 3 在广泛的行业...……更多
全球首个亿级参数量的地震波大模型在蓉正式发布,年底公测
...国地震局地球物理研究所以及清华大学联合开发的谛听大模型发布会”在国家超算成都中心举行。现场,全球首个亿级参数量的专业地震数据处理大模型——“谛听”地震波大模型正式发布,标志着中国在地震监测、预警和前兆...……更多
全球首个!中国电信完成千卡、千亿参数模型500公里联合训练试商用
...、北京电信成功了 完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。通过天津市武清区到北京市大兴区瀛海镇之间的真实光路环回,实现了500公里长距互联分布式训练,而且训练性能达到单数据中心...……更多
全球首次!时序大模型突破十亿参数,华人团队发布Time-MoE,预训练数据达3000亿个时间点
...而,构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外,高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日,由来自普林斯顿大学、格里菲斯大学等全球多地的华人国际科...……更多
阿里Qwen3登顶全球最强开源模型,用8款模型夺回中国AI话语权
出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型,阿里通义又上新!4月29日一大早,阿里开源发布Qwen3,包括两款MoE(混合专家架构)模型,其中具备2350亿参数规模的Qwen3-235B-A22B,在对比测试中成为目前最强大的开...……更多
小模型正在成为AI界的新宠
大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼(Mustafa Suleyman)预测, 仅在未来三年内,大模型规模以惊人的速度继续扩张,将增长 1000 倍。一方面,模型的参数量与其能够处理和学习的复杂性...……更多
马斯克打脸OpenAI!全球最大模型Grok-1开源
...:林志佳马斯克(Elon Musk)真的实现了他的承诺——把大模型Grok-1开源了。钛媒体App获悉,北京时间3月18日早上,“硅谷钢铁侠”、亿万富翁马斯克旗下AI初创公司xAI宣布,其研发的大模型Grok-1正式对外开源开放,用户可直接通...……更多
大模型新趋势之MoE:现状、挑战及研究方向
2024年,全球主流企业加快推出MoE大模型,1-5月发布千亿以上大模型均采用MoE优化架构,且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势,更适合处理大规模数据和复杂任务,已成谷歌、OpenAI、...……更多
李彦宏称开源赶不上闭源?Meta发布最强开源模型,马斯克评价“还不错”
...家坚持开源的社交巨头,又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日,Meta在官网上发布了两款开源大模型,参数分别达到80亿和700亿,是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多
训练一次ChatGPT,“折寿”3000辆特斯拉
...聊天应用ChatGPT风靡全球后,立即在全球范围内掀起了大模型开发的热潮。但准备参战的玩家们很快便认清现实,这不过是一场由巨头主宰的游戏,其中的关键,就是能耗。知名计算机专家吴军的形容并不夸张——ChatGPT每训练一...……更多
天垓100率先完成百亿级参数大模型训练,天数智芯迎来新的里程碑
...院(以下简称“智源研究院”)70亿参数的Aquila语言基础模型,使用代码数据进行继续训练,稳定运行19天,模型收敛效果符合预期,证明天数智芯有支持百亿级参数大模型训练的能力。图 天数智芯产品线总监宋煜在北京市海淀...……更多
垂直大模型竞争,能突破数据“卡点”吗?
AI大模型火遍全球,中国产业也激发了对人工智能应用的新热情。随着各大厂商参与竞逐,市场正在分化为通用与垂直两大路径,两者在参数级别、应用场景、商业模式等方面差异已逐步显现。01 企业涌入垂直大模型赛道通用AI...……更多
中国最大开源MoE模型,255B参数无条件免费商用,元象发布
元象XVERSE发布中国最大MoE开源模型:XVERSE-MoE-A36B,该模型总参数255B,激活参数36B,达到100B模型性能的「跨级」跃升。同时训练时间减少30%,推理性能提升100%,使每token成本大幅下降。在多个权威评测中,元象MoE效果大幅超越多...……更多
AI重塑千行百业 华为云发布盘古大模型3.0和昇腾AI云服务
...演讲中,华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。其中,盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向,持续打造核心竞争力,为行业客户、伙伴及开发者提供更好的服...……更多
“言出必行”马斯克,全球最大开源模型Grok真的来了
刚刚开源的 Grok,一举拿下迄今为止“全球最大开源模型”称号。马斯克又搞了个全球第一。Grok开源美东时间3月17日,xAI 正式宣布开源大模型Grok-1的权重和网络架构。xAI 表示,开源版大模型Grok-1是一个由 xAI 从头开始训练的 314...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
大模型的上下文长度快速增长,超长上下文解锁新应用,但推理计算代价高昂,上下文本身对于信息不会进行压缩,不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年,人工智能领域风起...……更多
百川智能、阿里云等进入开源大模型领域,开启商业化前奏
闭源商业化的“百模大战”暂告段落,开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后,基于该模型微调的大模型不断涌现。此外,阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B,国内8、9月份...……更多
...外版美国斯坦福大学等机构研究团队近日宣布,在基座大模型基础上,仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心(OpenAI)开发的o1、中国深度求索公司的DeepSeek-R1等,...……更多
...人 、新加坡国立大学校长青年教授尤洋发表了题为《大模型训练的关键技术》的主题演讲。尤洋指出,庞大的AI模型规模对模型训练提出了挑战,现有的硬件设备已无法满足训练所需的大量计算资源和储存空间需求。为解决上述...……更多
ChatGPT走红背后:苦熬五年,三次AI路线迭代|行业观察
...(吟游诗人)。就在同天,百度官宣将基于自家的文心大模型,推出类ChatGPT的产品"文心一言"。当日下午,国内搜索引擎市场的第二名360紧随其后,披露自家已在内部使用这类产品,同样计划尽快推出类ChatGPT的Demo版产品。消息...……更多
大模型深挖数据要素价值:算法、算力之后,存储载体价值凸显
...市场预计2030年AI推动智能经济可产生的价值总和,其中大模型带来的AI能力质变无疑成为重要的推动力量。大模型浪潮下,业界对AI发展的三驾马车——算力、算法、数据任何一个维度的关注都到了全新的高度,避免“木桶效应...……更多
...合鹏城实验室,正式发布自主研制的百亿级遥感解译基础模型——“空天·灵眸”3.0版,这是迄今为止全球首个百亿参数级空天一体遥感解译基础模型。近年来,我国遥感数据获取能力不断增强,已进入遥感大数据时代,人工智...……更多
高文院士:鹏城实验室已训练3个大模型,今年底将拥有两万多块卡
...城实验室主任高文发表演讲,分享了鹏城实验室在打造大模型平台上的进展。他表示,大模型训练首先需要一个平台。“现在要想训练一个大模型,需要有几千块卡,甚至上万块卡。”他介绍到,鹏城实验室在2020年就搭建了这...……更多
AI大模型行业报告:大模型发展迈入爆发期,开启AI新纪元(附下载)
技术:大模型发展呈现“规模定律”,Transformer为技术基座1.1 大模型“大力出奇迹”的背后:Scaling Law大规模语言模型(Large Language Models,LLM)泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模...……更多
大模型观察|从训练到落地金融业,大模型“升级之路”面临哪些挑战?
迎着技术风口,2024年将是AI大模型应用的浪潮年。业界认为,大模型将对金融业产生长远的、深刻的影响。1月28日,针对大模型在各业务场景的应用成效、对大模型算力的开发和提升,多机构向北京商报记者透露了自研大模型...……更多
权威AI开源标准1.0版发布:Llama也不算开源
大模型开源的口号,不是随便说说的。该来的终于来了。本周,人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会(Open Source Initiative,OSI)发布了「开源 AI 定义」的 1.0 正式版。此举旨在澄清 Open Source 这一术语...……更多
最前线 | APUS发布千亿级天燕大模型AiLMe,toC应用发力,toB服务蓄力
...移动互联网公司麒麟合盛APUS推出了自研的千亿级参数大模型“天燕大模型AiLMe”,以及针对垂直应用场景的四个模型文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”、音频模型“异雀六”。作为一家成立近九年...……更多
苹果300亿参数大模型首亮相,还买了家AI公司|焦点分析
...武静静编辑|邓咏仪放弃造车后的苹果,正在加速入局大模型战争。当地时间3月15日,苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称,苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多
美欧亚三洲开发者联手,全球首个组团训练的大模型,全流程开源
...,Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。30 号,他们开源了一切,包括基础模型、检查点、后训练模型、数据、PRIME 训练框架和技术报告。据了解,这应该是有史以来首个以去中心化形式训练得到的 10B 大...……更多
...ng Face 平台中的 NVIDIA DGX Cloud AI 超级计算来训练和调整 AI 模型;与 BOXX、戴尔科技、惠普和联想等工作站制造商合作,打造了一系列全新的高性能 RTX 工作站。IBM开源地理空间AI基础模型已在Hugging Face平台发布8月8日消息,IBM与开...……更多
更多关于科技的资讯:
聚焦心理服务新生态:灵动生活集团旗下幸福研习社亮相第十九届中国心理学家大会
2025年8月8-10日,第十九届中国心理学家大会于深圳盛大启幕。本届大会紧扣“此心安处是吾乡—中国社会心理服务的文化归根与范式突围”主题
2025-08-13 15:45:00
校企联动,智绘未来:哈尔滨工程大学深圳校友企业联盟探访博大数据前海智算中心
近日,哈尔滨工程大学深圳校友企业联盟代表团探访博大数据深圳前海智算中心,近20家来自同行业以及相关领域的校友企业代表齐聚于此
2025-08-13 13:51:00
(摘要:守护权益,“链”动责任)供应链不仅是一种资源配置关系,更是企业责任延伸的重要载体,员工的权益保障与企业可持续发展紧密相连
2025-08-13 13:52:00
平度:国内外市场齐发力 泡菜产业蓬勃发展
大众网记者 尚超 尹璐瑶 青岛报道近日,在平度经开区青岛农一食品有限公司的生产车间,工人们熟练地操作着各类设备,从蔬菜清洗
2025-08-13 09:27:00
近期,我国在海南商业航天发射场使用长征十二号运载火箭,成功将卫星互联网低轨07组卫星发射升空。7月30日,我国在海南商业航天发射场使用长征八号甲运载火箭
2025-08-13 10:12:00
9月10日至14日,2025年服贸会将在首钢园举办,电信、计算机和信息服务专题展(服贸会ICT展)作为科技领域“排头兵”
2025-08-13 10:42:00
中国网8月13日讯据国家安全部,“旧手机、旧电脑换菜刀、换不锈钢盆喽!”这与时俱进又略带夸张的吆喝,您是否也曾听过?一些闲置的“电子家当”留着无用
2025-08-13 10:02:00
下一款全民级AI应用,可能是个老熟人
这是技术革命时刻,也是超车巨头的机遇。2025年年中,两个看似无关的消息,形成了有趣的对照。首先是8月8日,OpenAI夏季发布会举行
2025-08-13 07:01:00
何以中国·和合共生 撰稿:杨春文拍摄:刘岩、阎金勇制作:李辉监制:李华楠协助单位:天津杨柳青画社
2025-08-13 08:06:00
我市两项目入选省级首批实践案例点数成“金”,公共数据“跑”起来南报网讯(通讯员玄数轩建数萱记者邓露洁卫凌云)近日,省数据局在全国率先组织开展江苏省公共数据“跑起来”场景县(市
2025-08-13 07:45:00
东北雨姐账号将于10月解封,解封后可继续直播带货,名下关联5家公司3家已注销
近日,曾因虚假宣传被处罚的网红“东北雨姐”在社交平台更新动态,引发公众对其复出的猜测。8月11日,本溪满族自治县互联网信息办公室工作人员回应称
2025-08-12 12:08:00
当全球经济寒风凛冽,消费者的钱包愈发收紧,一个来自中国的新名字,却在海外电商版图上掀起了一场低价风暴——TEMU。它像一把利刃
2025-08-12 13:00:00
倍益康理疗机器人亮相2025世界机器人大会,探索理疗机器人新发展
8月8日,2025世界机器人大会在北京经济技术开发区北人亦创国际会展中心隆重举行。大会以“让机器人更智慧,让具身体更智能”为主题
2025-08-12 13:06:00
红松APP正式上线行业首个适老化艺术能力认证服务
近日,红松APP官宣正式启动银发艺术培训认证服务,上线行业首个面向银发人群的“艺术能力水平认证系统”。该服务由中国艺术职业教育学会培训中心(下称“培训中心”)联合红松集团共同打造
2025-08-12 13:08:00
开业未满五年 永辉超市池州远东国际店即将停业
大皖新闻讯 近日,永辉超市池州远东国际店发布停业公告,宣布该门店9月2日起正式停止营业,8月22日至9月1日期间将开展商品出清活动
2025-08-12 13:10:00