模型,参数,模型,伯格,参数,扎克头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...浪潮电子信息产业股份有限公司在京发布“源2.0”基础大模型，并宣布全面开源。“源2.0”包括102B（1026亿）、51B（518亿）、2B（21亿）三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。基础大模型的关键能...……更多

2023-11-28 07:46:00浪潮信息,浪潮,模型,参数,基础,信息

英伟达发布80亿参数的ai模型

...伟达（NVIDIA）宣布，其已成功研发并发布了一款全新的AI模型，该模型拥有高达80亿的参数规模，具备精度高、计算效率高等优点，可在GPU加速的数据中心、云和工作站上运行。据介绍，这款新发布的AI模型是基于英伟达在深度学...……更多

2024-08-24 05:15:00英伟,模型,参数,模型,英伟,应用

中国最大开源MoE模型，255B参数无条件免费商用，元象发布

元象XVERSE发布中国最大MoE开源模型：XVERSE-MoE-A36B，该模型总参数255B，激活参数36B，达到100B模型性能的「跨级」跃升。同时训练时间减少30%，推理性能提升100%，使每token成本大幅下降。在多个权威评测中，元象MoE效果大幅超越多...……更多

2024-09-18 13:36:00中国,商用,模型,参数,模型,专家

微调大模型，AMD MI300X就够了！跟着这篇博客微调Ll

随着 AI 模型的参数量越来越大，对算力的需求也水涨船高。比如最近，Llama-3.1 登上了最强开源大模型的宝座，但超大杯 405B 版本的内存就高达 900 多 GB，这对算力构成了更加苛刻的挑战。如何降低算力的使用成本和使用门槛，...……更多

2024-10-09 09:52:00模型,跟着,博客,模型,参数,训练

中国石油发布700亿参数昆仑大模型建设成果

...月28日，以“AI领航·智绘能源”为主题的700亿参数昆仑大模型建设成果发布会在京举办，标志着中国石油在人工智能领域又迈出坚实一步。发布会上，中国石油介绍了与中国移动、华为、科大讯飞联手打造的700亿参数昆仑大模型...……更多

2024-11-29 09:25:00昆仑,中国,模型,成果,参数,石油

中国移动助力中国石油发布3000亿参数昆仑大模型

...晓莉）日前，中国移动助力中国石油的3000亿参数昆仑大模型建设成果发布。中国移动总经理何飚表示，中国移动作为中国石油昆仑大模型项目的总集成方，组建了14个专项工作组，全力保障项目高质量交付。在算力供给上，建成...……更多

2025-05-29 18:35:00中国,昆仑,中国移动,模型,参数,石油

人均年薪100万，手机厂商数百亿开卷大模型

端侧大模型正在成为手机行业创新的新增量。文｜《中国企业家》记者赵东山编辑｜李薇头图来源｜视觉中国人均年薪100万，什么样的行业具备如此优渥的待遇？答案是AI大模型。这是vivo副总裁周围接受《中国企业家》等媒体...……更多

2023-12-06 11:40:00年薪,模型,厂商,手机,模型,手机

不同量级参数模型性能同样优秀夸克大模型再登行业评测榜首

【CNMO新闻】“大模型时代，夸克有巨大机会创造出革新性搜索产品。”11月22日，夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示，夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单，...……更多

2023-11-24 13:53:00夸克,模型,量级,榜首,评测,性能

amd推出10亿参数语言模型系列amdolmo

...10月31日发布博文，宣布推出首个完全开放的10亿参数语言模型系列AMDOLMo，为开发者和研究人员提供强大的AI研究工具。AMDOLMo模型使用从零开始训练的10亿参数语言模型系列（LMs），在AMDInstinct™MI250GPU集群上训练，使用了超过1.3...……更多

2024-11-09 00:21:00模型,参数,语言,模型,开发者,训练

金融大模型应用需量力而行

随着人工智能技术的飞速发展，大模型已经成为全球关注的焦点。尤其在金融领域，大模型的发展呈现迅猛增长趋势，短短两年时间，从百亿级别参数已经成长到了千亿级别参数，引发人们的高度关注。金融业因其具有大规模...……更多

2024-12-24 15:39:00而行,模型,金融,应用,模型,金融

扎克伯格筹建海底通信网络计划“绕地球一圈”

...直接在印度建设数据中心，专门用来训练和处理人工智能模型，而海底电缆可能在这一努力中发挥作用。Tagare指出，印度的计算带宽成本，仅仅只是美国的一小部分，同时近期英伟达CEO黄仁勋访问印度，也引发了市场的高度关注...……更多

2024-12-01 15:05:00伯格,扎克,通信网络,海底,地球,通信

chatgpt低成本复现流程开源

首个开源的ChatGPT低成本复现流程来了！预训练、奖励模型训练、强化学习训练，一次性打通。最小demo训练流程仅需1.62GB显存，随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch，单机训练速度最高...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

GenAI如何颠覆大学？哈佛90%学生用LLM，教授追捧引发

【新智元导读】哈佛大学的一项最新研究表明，大语言模型已经深入学生的日常生活。为何学生们对AI的兴趣如此浓厚，背后的原因恐怕是这所大学的教授们。ChatGPT等生成式人工智能技术正在彻底改变世界，教育也不例外。由...……更多

2024-08-26 09:51:00哈佛,浪潮,颠覆,教授,学术,学生

阿里巴巴即将开源目前国内参数规模最大的大模型

阿里巴巴即将开源目前国内参数规模最大的大模型【阿里巴巴即将开源目前国内参数规模最大的大模型】《科创板日报》9日讯，阿里巴巴集团CEO吴泳铭今日在2023年世界互联网大会乌镇峰会上透露，阿里巴巴即将开源720亿参数...……更多

2023-11-09 10:53:00阿里巴巴,阿里,模型,参数,规模,阿里巴巴

huggingface公布“smollm”小语言模型家族

7月20日消息，如今小语言模型开始升温，许多厂商开始推出适用于手机等轻量级设备的“小模型”，本周HuggingFace便公布了“SmolLM”小语言模型家族，其中包含1.35亿、3.6亿及17亿参数模型。据介绍，这些模型号称是以精心策划的...……更多

2024-07-21 01:19:00小语,模型,家族,模型,小语,参数

中国电信何忠江发布千亿参数大模型

...能科技总经理何忠江正式发布了"星辰语义"千亿参数的大模型。据介绍，星辰语义大模型是中国电信自研大模型的升级，由此前的百万参数量级升至千亿，并且各项能力均有显著提升。何忠江表示，星辰语义拥有超12亿风格数据...……更多

2023-11-11 16:50:00中国电信,中国,模型,参数,电信,模型

杨仝团队发布FairyR1模型：5%参数量数学和代码能力超越

北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座，通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下，模型在特...……更多

2025-05-28 14:17:00模型,团队,参数,能力,数学,代码

阿里巴巴智能信息事业群发布千亿级参数夸克大模型

阿里巴巴智能信息事业群发布千亿级参数夸克大模型【阿里巴巴智能信息事业群发布千亿级参数夸克大模型】财联社11月14日电，记者今日获悉，阿里巴巴智能信息事业群正式发布全栈自研、千亿级参数夸克大模型，将应用于通...……更多

2023-11-14 15:05:00夸克,阿里巴巴,阿里,模型,参数,事业

全球首个亿级参数量的地震波大模型在蓉正式发布，年底公测

...国地震局地球物理研究所以及清华大学联合开发的谛听大模型发布会”在国家超算成都中心举行。现场，全球首个亿级参数量的专业地震数据处理大模型——“谛听”地震波大模型正式发布，标志着中国在地震监测、预警和前兆...……更多

2024-07-29 09:29:00公测,地震波,地震,模型,参数,全球

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿

?Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏快科技6月7日消息，Intel官方宣布，旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2（Qwen2）的全球发布提供支持，已取得ModelScope、阿里云PAI、OpenVINO等...……更多

2024-07-18 14:57:00三条,通义,阿里,模型,参数,通义

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现，开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数（如FP16或BF16）形...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型

微软被曝正自研AI大模型：5000亿个参数，与谷歌和Open

...巨头微软或正在研发参数达5000亿的全新AI（人工智能）大模型，将正面叫板谷歌和OpenAI。当地时间5月6日，据外媒报道，微软正在研发一款名为MAI-1的最新AI大模型，其规模远超出微软此前推出的一些开源模型，在性能上或能与谷...……更多

2024-05-07 14:33:00微软,模型,参数,竞争,微软,模型

界面财联社入局AI，国内首个千亿参数多模态金融大模型面市

...：人民日报客户端曹玲娟国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”3月23日在2024全球开发者先锋大会（GDC）上首发。该大模型由财跃星辰自研推出，上海报业集团旗下界面财联社与通用大模型公司阶跃星辰共...……更多

2024-03-24 00:30:00模态,联社,模型,界面,参数,金融

国产大模型 DeepSeek-V3 开源：6710 亿参数自

...（12 月 26 日）发布博文，宣布上线并同步开源 DeepSeek-V3 模型，用户可以登录官网 chat.deepseek.com，与最新版 V3 模型对话。IT之家援引博文介绍，DeepSeek-V3 是一个 6710 亿参数的专家混合（MoE，使用多个专家网络将问题空间划分为同...……更多

2024-12-27 09:20:00模型,国产,参数,模型,缓存,价格