模型,参数,模型,伯格,参数,扎克头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

微调大模型，AMD MI300X就够了！跟着这篇博客微调Llama 3.1 405B

随着 AI 模型的参数量越来越大，对算力的需求也水涨船高。比如最近，Llama-3.1 登上了最强开源大模型的宝座，但超大杯 405B 版本的内存就高达 900 多 GB，这对算力构成了更加苛刻的挑战。如何降低算力的使用成本和使用门槛，...……更多

2024-10-09 09:52:00模型,跟着,博客,模型,参数,训练

中国石油发布700亿参数昆仑大模型建设成果

...月28日，以“AI领航·智绘能源”为主题的700亿参数昆仑大模型建设成果发布会在京举办，标志着中国石油在人工智能领域又迈出坚实一步。发布会上，中国石油介绍了与中国移动、华为、科大讯飞联手打造的700亿参数昆仑大模型...……更多

2024-11-29 09:25:00昆仑,中国,模型,成果,参数,石油

中国移动助力中国石油发布3000亿参数昆仑大模型

...晓莉）日前，中国移动助力中国石油的3000亿参数昆仑大模型建设成果发布。中国移动总经理何飚表示，中国移动作为中国石油昆仑大模型项目的总集成方，组建了14个专项工作组，全力保障项目高质量交付。在算力供给上，建成...……更多

2025-05-29 18:35:00中国,昆仑,中国移动,模型,参数,石油

人均年薪100万，手机厂商数百亿开卷大模型

端侧大模型正在成为手机行业创新的新增量。文｜《中国企业家》记者赵东山编辑｜李薇头图来源｜视觉中国人均年薪100万，什么样的行业具备如此优渥的待遇？答案是AI大模型。这是vivo副总裁周围接受《中国企业家》等媒体...……更多

2023-12-06 11:40:00年薪,模型,厂商,手机,模型,手机

不同量级参数模型性能同样优秀夸克大模型再登行业评测榜首

【CNMO新闻】“大模型时代，夸克有巨大机会创造出革新性搜索产品。”11月22日，夸克大模型公布了其面向搜索、生产力工具和资产管理助手的大模型技术布局。数据显示，夸克千亿级参数大模型登顶C-Eval和CMMLU两大权威榜单，...……更多

2023-11-24 13:53:00夸克,模型,量级,榜首,评测,性能

amd推出10亿参数语言模型系列amdolmo

...10月31日发布博文，宣布推出首个完全开放的10亿参数语言模型系列AMDOLMo，为开发者和研究人员提供强大的AI研究工具。AMDOLMo模型使用从零开始训练的10亿参数语言模型系列（LMs），在AMDInstinct™MI250GPU集群上训练，使用了超过1.3...……更多

2024-11-09 00:21:00模型,参数,语言,模型,开发者,训练

金融大模型应用需量力而行

随着人工智能技术的飞速发展，大模型已经成为全球关注的焦点。尤其在金融领域，大模型的发展呈现迅猛增长趋势，短短两年时间，从百亿级别参数已经成长到了千亿级别参数，引发人们的高度关注。金融业因其具有大规模...……更多

2024-12-24 15:39:00而行,模型,金融,应用,模型,金融

chatgpt低成本复现流程开源

首个开源的ChatGPT低成本复现流程来了！预训练、奖励模型训练、强化学习训练，一次性打通。最小demo训练流程仅需1.62GB显存，随便一张消费级显卡都能满足了。单卡模型容量最多提升10.3倍。相比原生PyTorch，单机训练速度最高...……更多

2023-02-15 15:47:00流程,成本,模型,训练,内存,参数

130亿参数大模型免费商用

7月11日，百川智能发布了其最新的大模型Baichuan-13B，这是一款拥有130亿参数的开源可商用大规模语言模型。据官方介绍，Baichuan-13B在中英文基准测试中取得了同尺寸模型中最好的效果。此次发布的模型包含预训练（Baichuan-13B-Base...……更多

2023-07-12 16:58:00商用,模型,参数,模型,百川,训练

ai公司mosaicml推出300亿参数模型

6月25日消息，AI创业公司MosaicML近日发布了其语言模型MPT-30B，该模型具有300亿参数，训练成本“仅有其他同类竞品模型的零头”，有望促进行业逐步降低此类模型训练成本，扩大AI模型在更广泛领域的运用。▲图源MosaicMLMosaicML公...……更多

2023-06-25 22:45:00模型,参数,公司,模型,训练,成本

英伟达发布新AI芯片，马斯克小扎“笼中格斗”或在意大利上演

...表示，“你几乎可以在GH200上运行任何你想要的大型语言模型，它会疯狂地进行推理。大型语言模型的推理成本将大幅下降。”新的芯片将于明年第二季度起供货，并在今年年底前提供样品。目前这款芯片的价格仍未公布。点评...……更多

2023-08-13 13:14:00马斯,大利,马斯克,英伟,芯片,芯片

美国科技大佬齐聚国会闭门商讨AI，「对文明的未来非常重要」

...Meta首席执行官马克·扎克伯格谈到了封闭与开源人工智能模型。他称Meta的开源人工智能是确保广泛使用该技术的一种方式，不过Meta“对此并不狂热”。“我们并不开源一切。我们认为封闭的模式也很好，但我们也认为更开放的...……更多

2023-09-16 21:33:00美国科技,大佬,美国,国会,文明,科技

阿里巴巴即将开源目前国内参数规模最大的大模型

阿里巴巴即将开源目前国内参数规模最大的大模型【阿里巴巴即将开源目前国内参数规模最大的大模型】《科创板日报》9日讯，阿里巴巴集团CEO吴泳铭今日在2023年世界互联网大会乌镇峰会上透露，阿里巴巴即将开源720亿参数...……更多

2023-11-09 10:53:00阿里巴巴,阿里,模型,参数,规模,阿里巴巴

GenAI如何颠覆大学？哈佛90%学生用LLM，教授追捧引发

【新智元导读】哈佛大学的一项最新研究表明，大语言模型已经深入学生的日常生活。为何学生们对AI的兴趣如此浓厚，背后的原因恐怕是这所大学的教授们。ChatGPT等生成式人工智能技术正在彻底改变世界，教育也不例外。由...……更多

2024-08-26 09:51:00哈佛,浪潮,颠覆,教授,学术,学生

huggingface公布“smollm”小语言模型家族

7月20日消息，如今小语言模型开始升温，许多厂商开始推出适用于手机等轻量级设备的“小模型”，本周HuggingFace便公布了“SmolLM”小语言模型家族，其中包含1.35亿、3.6亿及17亿参数模型。据介绍，这些模型号称是以精心策划的...……更多

2024-07-21 01:19:00小语,模型,家族,模型,小语,参数

中国电信何忠江发布千亿参数大模型

...能科技总经理何忠江正式发布了"星辰语义"千亿参数的大模型。据介绍，星辰语义大模型是中国电信自研大模型的升级，由此前的百万参数量级升至千亿，并且各项能力均有显著提升。何忠江表示，星辰语义拥有超12亿风格数据...……更多

2023-11-11 16:50:00中国电信,中国,模型,参数,电信,模型

OpenAI推出新开源模型：对抗微软700亿个参数

据悉，OpenAI正在开发一款新的开源模型，以对抗微软和Meta合作开发的开源模型Llama2。这款新模型的内部代号为“G3PO”，目前尚未确定发布日期。值得注意的是，Llama2模型拥有700亿个参数，不仅开源，还支持商业许可证，允许任...……更多

2023-07-27 18:38:00微软,对抗,模型,参数,模型,微软

扎克伯格筹建海底通信网络计划“绕地球一圈”

...直接在印度建设数据中心，专门用来训练和处理人工智能模型，而海底电缆可能在这一努力中发挥作用。Tagare指出，印度的计算带宽成本，仅仅只是美国的一小部分，同时近期英伟达CEO黄仁勋访问印度，也引发了市场的高度关注...……更多

2024-12-01 15:05:00伯格,扎克,通信网络,海底,地球,通信

阿里云通义千问开源！70亿参数模型上线魔搭社区

【CNMO新闻】8月3日，AI模型社区魔搭ModelScope上架两款开源模型Qwen-7B和Qwen-7B-Chat，阿里云确认其为通义千问70亿参数通用模型和对话模型，两款模型均开源、免费、可商用。在多个权威测评中，通义千问7B模型取得了远超国内外同...……更多

2023-08-03 17:00:00通义,阿里,模型,参数,社区,模型

深度学习在AI教育中的应用及其关键技术探究

...标准化和归一化以及特征选择和降维技术。最后，介绍了模型构建和训练的关键步骤，包括深度学习模型的选择和设计、模型初始化和参数调整、批量梯度下降和优化算法以及学习率调整和模型评估。通过这些步骤，可以提高深...……更多

2023-09-12 11:30:00深度,关键,应用,学习,教育,技术

OpenAI CEO宣布转向，“大模型时代”即将结束？

...然在这个月几乎每周都至少有一家科技大公司入局训练大模型，但OpenAI 却突然改变了方向声称，大模型时代已经要结束了。上周末在麻省理工学院，OpenAI 的 CEO 在演讲中警告称：我们已经处在大模型时代的尾声，并表示如今的 A...……更多

2023-04-20 10:33:00模型,时代,模型,参数,马斯,发展

阿里云开源通义千问 70 亿参数模型，免费、可商用

据36氪报道，今日阿里云开源通义千问70亿参数模型，包括通用模型Qwen-7B和对话模型Qwen-7B-Chat，两款模型均已上线魔搭社区，开源、免费、可商用。此举让阿里云成为国内首个加入大模型开源行列的大型科技企业。今年4月，阿...……更多

2023-08-03 17:18:00通义,阿里,商用,模型,参数,通义

杨仝团队发布FairyR1模型：5%参数量数学和代码能力超越

北京大学杨仝教授团队近期发布了其在高效大型语言模型研究方向的一项新成果——FairyR1-32B模型。该模型基于DeepSeek-R1-Distill-Qwen-32B基座，通过结合微调与模型合并技术构建。研究探索了在参数量大幅减少的情况下，模型在特...……更多

2025-05-28 14:17:00模型,团队,参数,能力,数学,代码

阿里巴巴智能信息事业群发布千亿级参数夸克大模型

阿里巴巴智能信息事业群发布千亿级参数夸克大模型【阿里巴巴智能信息事业群发布千亿级参数夸克大模型】财联社11月14日电，记者今日获悉，阿里巴巴智能信息事业群正式发布全栈自研、千亿级参数夸克大模型，将应用于通...……更多

2023-11-14 15:05:00夸克,阿里巴巴,阿里,模型,参数,事业

全球首个亿级参数量的地震波大模型在蓉正式发布，年底公测

...国地震局地球物理研究所以及清华大学联合开发的谛听大模型发布会”在国家超算成都中心举行。现场，全球首个亿级参数量的专业地震数据处理大模型——“谛听”地震波大模型正式发布，标志着中国在地震监测、预警和前兆...……更多

2024-07-29 09:29:00公测,地震波,地震,模型,参数,全球

Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿

?Intel三条线优化阿里云通义千问2模型：720亿参数轻松拿捏快科技6月7日消息，Intel官方宣布，旗下数据中心、客户端、边缘AI解决方案均已经为阿里云通义千问2（Qwen2）的全球发布提供支持，已取得ModelScope、阿里云PAI、OpenVINO等...……更多

2024-07-18 14:57:00三条,通义,阿里,模型,参数,通义

微软开源爆火1bit大模型推理框架！千亿参数模型量化后单CP

微软开源1bit大模型推理框架！现在1000亿参数大模型量化后单CPU可跑，速度可达每秒5-7个token。就是今年爆火论文The Era of 1-bit LLMs的官方代码实现，开源不到一周GitHub已揽获7.9k Star。传统大模型参数以16位浮点数（如FP16或BF16）形...……更多

2024-10-23 12:05:00模型,微软,推理,框架,参数,模型