模型,跟着,博客,模型,参数,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

腾讯推出 Hunyuan-Large 开源大模型

IT之家11月5日消息，腾讯今日宣布推出Hunyuan-Large大模型，官方表示这是目前业界已经开源的基于Transformer的最大MoE模型，拥有3890亿总参数（389B）和520亿激活参数（52B）。腾讯今日在HuggingFace开源了Hunyuan-A52B-Pretrain、Hun……更多

2024-11-05 18:56:00腾讯,模型,模型,长上,腾讯,训练

文生图参数量升至240亿！Playground v3发布：深

【新智元导读】Playground Research推出了新一代文本到图像模型PGv3，具备240亿参数量，采用深度融合的大型语言模型，实现了在图形设计和遵循文本提示指令上甚至超越了人类设计师，同时支持精确的RGB颜色控制和多语言识别。自...……更多

2024-10-08 09:48:00文生,图形设计,深度,图形,人类,参数

佳都科技：公司自建研发算力中心满足目前主流训练参数量研发训练

...略合作关系，华为云以及昇腾算力产品线同样能为公司大模型的研发提供算力支持，公司目前正在积极与华为对接，展开大模型产品与应用的软硬件解决方案的研发。公司大模型相关产品的研发从规划之初一直采用自主可控的路...……更多

2023-10-18 15:02:00佳都,华为,训练,主流,参数,科技

清华郑纬民院士：AI for Science的出现，让高性能

...准设计四大目标以及如何通过并行方法加速大规模预训练模型。为了完整体现郑纬民院士的分享及思考，在不改变原意的基础上，量子位对他的演讲内容进行了编辑整理。关于MEET 智能未来大会：MEET大会是由量子位主办的智能科...……更多

2023-01-11 05:00:00清华,院士,高性能,人工智能,模型,智能

GPU训Llama 3.1疯狂崩溃，竟有大厂用CPU服务器跑

【新智元导读】是时候用CPU通用服务器跑千亿参数大模型了！马斯克19天建成由10万块H100串联的世界最大超算，已全力投入Grok 3的训练中。与此同时，外媒爆料称，OpenAI和微软联手打造的下一个超算集群，将由10万块GB200组成。...……更多

2024-08-02 09:47:00大厂,模型,参数,疯狂,服务器,服务

林达华谈大模型发展之路：未来会有更高效的模型结构出现

大模型的上下文长度快速增长，超长上下文解锁新应用，但推理计算代价高昂，上下文本身对于信息不会进行压缩，不能直接捕捉其中的深层知识和规律。上海人工智能实验室领军科学家林达华。过去一年，人工智能领域风起...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

我国发布首个亿级参数量地震波大模型：名为“谛听”

...，据成都科技局官方公众号介绍，日前“谛听”地震波大模型在四川成都发布。“谛听”由国家超级计算成都中心、中国地震局地球物理研究所以及清华大学联合开发，是首个亿级参数量的地震波大模型。同时，“谛听”也是目...……更多

2024-07-29 19:01:00地震波,地震,模型,参数,我国,地震

还在人工炼丹？自动提示工程指南来了，还带从头实现

...APE）是指自动生成和优化 LLM 提示词的技术，目标是提升模型在特定任务上的性能。其基于提示词工程的思路，即编写多个不同的提示词并对其进行测试，只不过是让整个过程自动化。后面我们会看到，这个过程非常类似于传统...……更多

2024-09-10 13:39:00从头,人工,提示,指南,工程,提示

昆仑万维发布开源13B高质量商用大模型领先Llama2和B

10月30日，昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列，并配套开源了600GB、150B Tokens的超大高质量开源中文数据集。昆仑万维「天工」Skywork-13B系列目前包括130亿参数的两大模型：Skywork-13B-Base模型、Skywork-13B-Mat……更多

2023-10-30 15:35:00万维,昆仑,商用,高质量,模型,领先

揭示Transformer「周期建模」缺陷！北大提出新型神经

【新智元导读】北京大学研究团队开发的FAN模型能有效捕捉数据中的周期性模式，相比传统模型在多项任务中表现出色，同时降低了参数量和计算量，增强了对周期性特征的建模能力，应用潜力广泛。周期性现象广泛存在，深...……更多

2024-11-27 13:34:00周期,缺陷,神经网络,周期性,北大,特征

浪潮信息推出as13000g7-n系列

...步伐，于近日推出分布式全闪存储AS13000G7-N系列，专为大模型优化而设，为数据存储带来革命性的突破。该系列依托浪潮信息自研分布式文件系统，搭载新一代数据加速引擎DataTurbo，通过盘控协同、GPU直访存储、全局一致性缓存...……更多

2024-06-16 10:27:00浪潮信息,浪潮,信息,模型,数据,训练

1-bit大模型还能再突破！新一代BitNet架构启用4位激

...et系列的原班人马推出了新一代架构：BitNet a4.8，为1 bit大模型启用了4位激活值，支持3 bit KV cache，效率再突破。量化到1 bit的LLM还能再突破？这次，他们对激活值下手了！近日，BitNet系列的原班人马推出了新一代架构：BitNet a4.8...……更多

2024-12-06 09:55:00架构,激活,新一代,模型,突破,激活

芯片战场丨瞄准大模型摩尔线程首个千卡智算中心落地

为满足大模型的“暴力”计算需求，国内GPU企业正加码算力基础设施建设。12月19日，摩尔线程首个全国产千卡千亿模型训练平台——摩尔线程KUAE智算中心落地。据其介绍，这是国内首个以国产全功能GPU为底座的大规模算力集群...……更多

2023-12-20 10:52:00摩尔,线程,落地,战场,芯片,模型

小米大模型：不搞军备竞赛

轻量级的模型亦有其存在的市场空间。2022年11月底，基于GPT-3.5的ChatGPT刚出来的时候，小米集团AI实验室主任、自然语言处理（NLP）首席科学家王斌给ChatGPT抛出一个问题：证明一下勾股定理。最终，ChatGPT给出了一个基于数学归...……更多

2023-11-08 18:13:00军备,小米,竞赛,模型,模型,小米

中国石油发布700亿参数昆仑大模型建设成果

...月28日，以“AI领航·智绘能源”为主题的700亿参数昆仑大模型建设成果发布会在京举办，标志着中国石油在人工智能领域又迈出坚实一步。发布会上，中国石油介绍了与中国移动、华为、科大讯飞联手打造的700亿参数昆仑大模型...……更多

2024-11-29 09:25:00昆仑,中国,模型,成果,参数,石油

面壁智能发布2B模型：适配主流手机，推理成本仅为GPT-4的

文 | 周鑫雨编辑 | 邓咏仪当大模型加速应用落地，运行成本就成为各厂商的现实考量。将模型做小，成为现实市场需求下的趋势。但模型的Scaling Law（规模定律）已指出，参数规模是决定模型性能的最关键因素。如何用更小的参...……更多

2024-02-03 16:03:00适配,推理,模型,主流,成本,智能

AI探索宇宙结构新突破！超精准场级模拟，半秒完成冷暗物质仿真

...进行编码的样式参数。研究人员在六维N-body相空间上训练模型，将粒子速度预测为模型位移输出的时间导数，显著提高了训练效率和模型准确性。最终，模拟器在测试数据（训练期间未见过的各种宇宙学和红移）上实现了良好的...……更多

2024-09-20 13:34:00暗物质,仿真,宇宙,突破,结构,粒子

AIGC音乐的中场战事：从技术、产品到商业规则

...”。11月16日，谷歌旗下 DeepMind发布了最新的AIGC音乐生成模型Lyria，并与YouTube合作打造了两个重要应用场景：Dream Track和Music AI tools。同时，谷歌和YouTube还将AI识别工具SynthID扩展到音乐领域，为Lyria生成的AI作品打上水印……更多

2023-11-22 13:47:00战事,规则,商业,产品,技术,音乐