模型,训练,参数,数据,全球,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

全球最强开源大模型Llama 3发布：使用15T数据预训练，最大模型参数将超4000亿

就在刚刚，Meta 发布了其最先进开源大型语言模型的下一代产品——Llama 3。据介绍，Llama 3 在 24K GPU 集群上训练，使用了 15T 的数据，提供了 8B 和 70B 的预训练和指令微调版本，可以支持广泛的应用。同时，Llama 3 在广泛的行业...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

全球首个亿级参数量的地震波大模型在蓉正式发布，年底公测

...国地震局地球物理研究所以及清华大学联合开发的谛听大模型发布会”在国家超算成都中心举行。现场，全球首个亿级参数量的专业地震数据处理大模型——“谛听”地震波大模型正式发布，标志着中国在地震监测、预警和前兆...……更多

2024-07-29 09:29:00公测,地震波,地震,模型,参数,全球

全球首个！中国电信完成千卡、千亿参数模型500公里联合训练试

...、北京电信成功了完成业内首个1024卡、千亿参数商用大模型的分布式联合训练真实用户试商用。通过天津市武清区到北京市大兴区瀛海镇之间的真实光路环回，实现了500公里长距互联分布式训练，而且训练性能达到单数据中心...……更多

2025-01-23 13:32:00中国电信,中国,商用,模型,训练,参数

全球首次！时序大模型突破十亿参数，华人团队发布Time-Mo

...而，构建一个兼具强大性能与高效运算的大规模时序预测模型始终是一个巨大的挑战。此外，高质量的大型公共时间序列数据库的匮乏进一步加剧了这一难题。近日，由来自普林斯顿大学、格里菲斯大学等全球多地的华人国际科...……更多

2024-10-23 09:55:00时序,模型,团队,训练,参数,突破

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话

出品 | 搜狐科技作者 | 梁昌均编辑 | 杨锦一口气开源8款模型，阿里通义又上新！4月29日一大早，阿里开源发布Qwen3，包括两款MoE（混合专家架构）模型，其中具备2350亿参数规模的Qwen3-235B-A22B，在对比测试中成为目前最强大的开...……更多

2025-04-29 16:17:00模型,阿里,话语权,中国,话语,全球

小模型正在成为AI界的新宠

大模型的发展已经进入了万亿级参数时代。DeepMind 联合创始人穆斯塔法・苏莱曼（Mustafa Suleyman）预测，仅在未来三年内，大模型规模以惊人的速度继续扩张，将增长 1000 倍。一方面，模型的参数量与其能够处理和学习的复杂性...……更多

2024-06-24 09:42:00新宠,模型,正在,模型,参数,训练

马斯克打脸OpenAI！全球最大模型Grok-1开源

...：林志佳马斯克（Elon Musk）真的实现了他的承诺——把大模型Grok-1开源了。钛媒体App获悉，北京时间3月18日早上，“硅谷钢铁侠”、亿万富翁马斯克旗下AI初创公司xAI宣布，其研发的大模型Grok-1正式对外开源开放，用户可直接通...……更多

2024-03-20 13:44:00马斯,马斯克,模型,全球,马斯,马斯克

大模型新趋势之MoE：现状、挑战及研究方向

2024年，全球主流企业加快推出MoE大模型，1-5月发布千亿以上大模型均采用MoE优化架构，且数量超过近三年总和。MoE大模型架构凭借平衡大模型训推成本和计算效率等优势，更适合处理大规模数据和复杂任务，已成谷歌、OpenAI、...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

李彦宏称开源赶不上闭源？Meta发布最强开源模型，马斯克评价

...家坚持开源的社交巨头，又默默放出了最新一代的开源大模型Llama3。美当地时间4月18日，Meta在官网上发布了两款开源大模型，参数分别达到80亿和700亿，是目前同体量下性能最好的开源模型。马斯克对此评价称“还不错”。Meta...……更多

2024-04-20 11:00:00马斯,马斯克,李彦,模型,评价,模型

训练一次ChatGPT，“折寿”3000辆特斯拉

...聊天应用ChatGPT风靡全球后，立即在全球范围内掀起了大模型开发的热潮。但准备参战的玩家们很快便认清现实，这不过是一场由巨头主宰的游戏，其中的关键，就是能耗。知名计算机专家吴军的形容并不夸张——ChatGPT每训练一...……更多

2023-04-17 19:00:00特斯,特斯拉,训练,模型,能耗,训练

天垓100率先完成百亿级参数大模型训练，天数智芯迎来新的里程

...院（以下简称“智源研究院”）70亿参数的Aquila语言基础模型，使用代码数据进行继续训练，稳定运行19天，模型收敛效果符合预期，证明天数智芯有支持百亿级参数大模型训练的能力。图天数智芯产品线总监宋煜在北京市海淀...……更多

2023-06-13 12:00:00里程,成百,天数,里程碑,模型,训练

垂直大模型竞争，能突破数据“卡点”吗？

AI大模型火遍全球，中国产业也激发了对人工智能应用的新热情。随着各大厂商参与竞逐，市场正在分化为通用与垂直两大路径，两者在参数级别、应用场景、商业模式等方面差异已逐步显现。01 企业涌入垂直大模型赛道通用AI...……更多

2023-05-19 14:01:00模型,突破,竞争,数据,模型,数据

中国最大开源MoE模型，255B参数无条件免费商用，元象发布

元象XVERSE发布中国最大MoE开源模型：XVERSE-MoE-A36B，该模型总参数255B，激活参数36B，达到100B模型性能的「跨级」跃升。同时训练时间减少30%，推理性能提升100%，使每token成本大幅下降。在多个权威评测中，元象MoE效果大幅超越多...……更多

2024-09-18 13:36:00中国,商用,模型,参数,模型,专家

AI重塑千行百业华为云发布盘古大模型3.0和昇腾AI云服务

...演讲中，华为常务董事、华为云CEO张平安重磅发布盘古大模型3.0和昇腾AI云服务。其中，盘古大模型3.0围绕“行业重塑”“技术扎根”“开放同飞”三大创新方向，持续打造核心竞争力，为行业客户、伙伴及开发者提供更好的服...……更多

2023-07-10 18:01:00盘古,华为,百业,模型,服务,盘古

“言出必行”马斯克，全球最大开源模型Grok真的来了

刚刚开源的 Grok，一举拿下迄今为止“全球最大开源模型”称号。马斯克又搞了个全球第一。Grok开源美东时间3月17日，xAI 正式宣布开源大模型Grok-1的权重和网络架构。xAI 表示，开源版大模型Grok-1是一个由 xAI 从头开始训练的 314...……更多

2024-03-18 11:50:00马斯,马斯克,模型,全球,马斯,马斯克

林达华谈大模型发展之路：未来会有更高效的模型结构出现

大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

百川智能、阿里云等进入开源大模型领域，开启商业化前奏

闭源商业化的“百模大战”暂告段落，开源大模型仍旧热闹。今年7月Meta推出开源且免费的大型语言模型LLama2后，基于该模型微调的大模型不断涌现。此外，阿联酋阿布扎比技术创新研究所推出大参数模型Falcon180B，国内8、9月份...……更多

2023-10-14 00:21:00百川,阿里,前奏,模型,领域,智能

全球科研团队竞逐低成本AI模型研发新范式

...外版美国斯坦福大学等机构研究团队近日宣布，在基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

潞晨科技创始人尤洋：大模型训练的关键技术｜WISE2023颠

...人、新加坡国立大学校长青年教授尤洋发表了题为《大模型训练的关键技术》的主题演讲。尤洋指出，庞大的AI模型规模对模型训练提出了挑战，现有的硬件设备已无法满足训练所需的大量计算资源和储存空间需求。为解决上述...……更多

2023-05-28 18:37:00峰会,产业发展,创始人,颠覆,模型,训练

ChatGPT走红背后：苦熬五年，三次AI路线迭代｜行业观察

...（吟游诗人）。就在同天，百度官宣将基于自家的文心大模型，推出类ChatGPT的产品"文心一言"。当日下午，国内搜索引擎市场的第二名360紧随其后，披露自家已在内部使用这类产品，同样计划尽快推出类ChatGPT的Demo版产品。消息...……更多

2023-02-08 19:19:00迭代,路线,背后,观察,行业,模型

大模型深挖数据要素价值：算法、算力之后，存储载体价值凸显

...市场预计2030年AI推动智能经济可产生的价值总和，其中大模型带来的AI能力质变无疑成为重要的推动力量。大模型浪潮下，业界对AI发展的三驾马车——算力、算法、数据任何一个维度的关注都到了全新的高度，避免“木桶效应...……更多

2023-09-27 16:16:00价值,算法,载体,要素,模型,存储

首届空天信息技术大会开幕，发布全球首个百亿级遥感解译基础模型

...合鹏城实验室，正式发布自主研制的百亿级遥感解译基础模型——“空天·灵眸”3.0版，这是迄今为止全球首个百亿参数级空天一体遥感解译基础模型。近年来，我国遥感数据获取能力不断增强，已进入遥感大数据时代，人工智...……更多

2024-09-23 11:53:00空天,遥感,首届,模型,大会,基础

高文院士：鹏城实验室已训练3个大模型，今年底将拥有两万多块卡

...城实验室主任高文发表演讲，分享了鹏城实验室在打造大模型平台上的进展。他表示，大模型训练首先需要一个平台。“现在要想训练一个大模型，需要有几千块卡，甚至上万块卡。”他介绍到，鹏城实验室在2020年就搭建了这...……更多

2024-06-05 13:00:00高文,院士,实验室,模型,训练,实验

AI大模型行业报告：大模型发展迈入爆发期，开启AI新纪元（附

技术：大模型发展呈现“规模定律”，Transformer为技术基座1.1 大模型“大力出奇迹”的背后：Scaling Law大规模语言模型（Large Language Models，LLM）泛指具有超大规模参数或者经过超大规模数据训练所得到的语言模型。与传统语言模...……更多

2024-10-21 10:03:00模型,行业报告,新纪元,报告,发展,行业

大模型观察｜从训练到落地金融业，大模型“升级之路”面临哪些挑

迎着技术风口，2024年将是AI大模型应用的浪潮年。业界认为，大模型将对金融业产生长远的、深刻的影响。1月28日，针对大模型在各业务场景的应用成效、对大模型算力的开发和提升，多机构向北京商报记者透露了自研大模型...……更多

2024-01-29 21:36:00模型,之路,金融业,落地,观察,训练

权威AI开源标准1.0版发布：Llama也不算开源

大模型开源的口号，不是随便说说的。该来的终于来了。本周，人工智能领域迎来了对于「开源」的官方定义。开放源代码促进会（Open Source Initiative，OSI）发布了「开源 AI 定义」的 1.0 正式版。此举旨在澄清 Open Source 这一术语...……更多

2024-10-30 09:52:00权威,标准,数据,模型,系统,训练

最前线 | APUS发布千亿级天燕大模型AiLMe，toC应

...移动互联网公司麒麟合盛APUS推出了自研的千亿级参数大模型“天燕大模型AiLMe”，以及针对垂直应用场景的四个模型文本模型“异雀八”、图像模型“异雀三”、视频模型“异雀四”、音频模型“异雀六”。作为一家成立近九年...……更多

2023-04-20 12:47:00燕大,模型,应用,服务,模型,李涛

苹果300亿参数大模型首亮相，还买了家AI公司｜焦点分析

...武静静编辑｜邓咏仪放弃造车后的苹果，正在加速入局大模型战争。当地时间3月15日，苹果就披露了两个关键大模型动作。其中一个值得关注的是苹果的收购事件。彭博社报道称，苹果已经收购了一家加拿大AI初创公司DarwinAI。...……更多

2024-03-16 18:14:00模型,苹果,参数,焦点,分析,公司

美欧亚三洲开发者联手,全球首个组团训练的大模型,全流程开源

...，Prime Intellect 宣布通过去中心化方式训练完成了一个 10B 模型。30 号，他们开源了一切，包括基础模型、检查点、后训练模型、数据、PRIME 训练框架和技术报告。据了解，这应该是有史以来首个以去中心化形式训练得到的 10B 大...……更多

2024-12-03 13:34:00三洲,欧亚,开发者,模型,流程,训练

英伟达发布超级芯片、OpenAI在中国申请注册“GPT-5”

...ng Face 平台中的 NVIDIA DGX Cloud AI 超级计算来训练和调整 AI 模型；与 BOXX、戴尔科技、惠普和联想等工作站制造商合作，打造了一系列全新的高性能 RTX 工作站。IBM开源地理空间AI基础模型已在Hugging Face平台发布8月8日消息，IBM与开...……更多

2023-08-15 01:10:00英伟,小米,周报,中国,芯片,模型

page 1/23334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：