架构,模型,优势,模型,训练,模块头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

快手「可灵」爆火：海外AI圈巨震，中国版Sora一号难求

...披露了更具参考意义的信息，主要包括从数据准备、模型架构、训练方案及优化策略几个方面。数据准备依托快手在视频技术领域的多年积累，可灵大模型团队已经构建了完备的标签体系，包括从视频基础质量、美学、自然度等...……更多

2024-06-14 09:10:00快手,中国,生成,视频,模型,文生

Bengio团队提出多模态新基准，直指Claude 3.5和

...想要达成通用人工智能 AGI 的终极目标，首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点，大模型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

阿里Qwen3登顶全球最强开源模型，用8款模型夺回中国AI话

...29日一大早，阿里开源发布Qwen3，包括两款MoE（混合专家架构）模型，其中具备2350亿参数规模的Qwen3-235B-A22B，在对比测试中成为目前最强大的开源模型。此外，Qwen3还包括六款稠密模型，涵盖6亿、17亿、40亿、80亿、140亿和320亿等...……更多

2025-04-29 16:17:00模型,阿里,话语权,中国,话语,全球

黄仁勋：我从不在乎市场份额、英伟达唯一目标是创造新市场

...CPU上效率不高的工作转移到GPU上发明新的数值精度开发新架构(如张量核心)采用高速内存(HBM)通过MVLink和InfiniBand实现系统扩展这种快速发展使我们从人工编程转向了机器学习，整个技术栈都在快速创新和进步。Q：模型规模扩展方...……更多

2024-10-23 12:25:00新市,英伟,份额,从不,目标,市场

腾讯、京东的机器人战略：不造硬件，搭平台

...客服、数字人、导购的数据。据介绍，京东JoyInside平台的架构是——在底层，通过京东云构建了智算基础设施，整合了RAG、TTS、ASR、LLM等多模态能力，让企业能够开箱即用。在支持系统层，JoyInside平台支持主动对话、情绪检测...……更多

2025-08-01 19:02:00京东,腾讯,机器人,机器,战略,硬件

2024中国AI大模型产业发展报告发布展望五大产业趋势

...大模型产业发展受到算力层面的一些制约。主流大模型架构仍存在诸多局限。首先，Transformer架构消耗的算力资源普遍较大；其次，基于Transformer架构的大模型对存储设备的要求也更高。高质量的训练数据集仍需扩展。国内的AI...……更多

2024-03-26 21:35:00产业,中国,产业发展,模型,趋势,报告

阿里妈妈首提AIGB并实现大规模商业化落地，将正式开源Ben

...23 年，阿里妈妈首次提出了 AIGB（AI-Generated Bidding）Bidding 模型训练新范式（参阅：阿里妈妈生成式出价模型（AIGB）详解）。AIGB 是一种全新的迭代范式，把自动出价问题建模为生成式序列决策问题，这是生成式 AI 在该领域的首...……更多

2024-12-05 09:49:00大规,阿里,落地,大规模,妈妈,商业

中国农业大学发布首个国际奶业领域垂直大模型

...业数据。曹志军介绍，孺子牛大模型依托GLM-4大语言模型架构，配备百亿级参数，实现了对中文语境的深度适配。大模型通过利用大规模语料库进行预训练基础模型，针对特定模型参数不断优化，以提升产业效率，优化资源配置...……更多

2025-01-26 15:54:00中国农业大学,奶业,中国,模型,领域,农业

算力浪费超50%！百度AI计算部负责人拆解大模型时代的算力成

智东西9月13日消息，百度系统架构师、百度智能云AI计算部负责人王雁鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支，他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异...……更多

2024-09-14 09:55:00拆解,模型,负责人,成本,时代,万卡

自研神玑芯片，让蔚来ET9感知范围大2倍，决策快1倍？

...片能否在后年继续保持领先，是大家比较关注的点。芯片架构大更新，单芯片解决多芯带宽限制在近日的蔚来NIODay活动中，蔚来发布了代号为神玑NX9031的自研智驾芯片，这款芯片被李斌评价为“用1颗实现4颗旗舰智驾芯片性能”...……更多

2024-01-05 00:17:00芯片,决策,范围,芯片,性能,英伟

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

...而合，而且360更早就提出了“慢思考”的理念，并在技术架构和产品中都付诸了应用。同时，360还在其AI产品中强调多模合作，让来自不同厂商的大模型“抱团取暖”，为国内模型追赶OpenAI，找到了一条可行的道路。从o1看大模...……更多

2024-09-21 09:45:00模型,实测,协作,三个,提示,工程

整合长期记忆，AI实现自我进化，探索大模型这一可能性

...。目前人们有一个普遍的看法：在这种曲线拟合范式中，架构并不重要，关键的因素是数据集。但到了阶段 3，架构就会变得和数据一样重要。核心的难题是如何在统计模型的基础上有效表达少数个体的数据。该研究关注的核心...……更多

2024-10-29 09:55:00进化,可能性,模型,整合,记忆,模型

AI黑科技齐亮相这个展，看科创产业力量如何撑高质量发展？

...，是一套从信息化到数字化再到智能化渐次递进的数字化架构，致力于让机器像人一样思考和工作。除了这些，还有一款桥梁检修机器人颇受欢迎。“我们今年带来展会的是桥梁斜拉索检修机器人，它是为了代替人工从事桥梁高...……更多

2024-02-19 09:23:00科创,高质量,力量,产业,发展,科技

国产GPU万卡集群终于来了！摩尔线程CEO张建中：做难而正确

...大规模算力集群来做训练。二是算法持续迭代，Transformer架构不能实现大一统，从稠密到稀疏模型，再到多模态模型的融合，多元架构持续演进并共存，面向特定领域设计的专用芯片难以适应未来算法，通用型算力才具备更强的...……更多

2024-07-09 09:47:00摩尔,张建中,万卡,张建,集群,线程

自然语言处理：大模型理论与实践

...sformer模型及预训练语言模型的基本知识。2. 大模型理论- 架构：讲解基于Transformer的编码、解码、编解码大语言模型架构，非Transformer架构如FAT、AFT、RWKV模型，以及大模型架构配置的归一化、激活函数、位置编码、注意力与偏置...……更多

2024-10-23 20:38:00自然语言,模型,实践,理论,自然,语言

小模型正在成为AI界的新宠

...）的发展，使得训练更大规模的模型成为可能；新的模型架构和训练技术的出现，如 Transformer 架构和预训练技术，使得模型能够更有效地扩展到更大的规模。此外，模型的大小往往被视为技术创新和研发实力的一种体现。因此...……更多

2024-06-24 09:42:00新宠,模型,正在,模型,参数,训练

图森未来发布图生视频开源大模型“Ruyi”：RTX 4090

...以从 huggingface 上下载使用。据介绍，Ruyi 是一个基于 DiT 架构的图生视频模型，它由两部分构成：一个 Casual VAE 模块负责视频数据的压缩和解压一个 Diffusion Transformer 负责压缩后的视频生成模型的总参数量约为 7.1B，使用了约 200M .……更多

2024-12-18 09:27:00图森,模型,运行,视频,图森,生成