力大,架构,模型,模型,架构,训练头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...远不如使用具有特征预测损失和崩溃预防机制的联合嵌入架构。这篇来自纽约大学 @sainingxie 的论文表明，即使你只对生成像素感兴趣（例如使用扩散 Transformer 生成漂亮图片），也应该包含特征预测损失，以便解码器的内部表征...……更多

2024-10-15 09:57:00模型,训练,方法,模型,训练,视觉

算力浪费超50%！百度AI计算部负责人拆解大模型时代的算力成

智东西9月13日消息，百度系统架构师、百度智能云AI计算部负责人王雁鹏向媒体解读了大模型时代的算力成本。为了有效降低AI万卡集群的算力开支，他提出搭载RDMA网络、自动并行策略、保证训练稳定性、动态分配算力、多芯异...……更多

2024-09-14 09:55:00拆解,模型,负责人,成本,时代,万卡

混合架构赋予AI人类推理能力

本文转自：参考消息参考消息网6月12日报道据美国趣味科学网站5月13日报道，麻省理工学院研究人员开发了一种新的方式，帮助人工智能(AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

语音克隆达到人类水平，微软全新VALL-E 2模型让Deep

...序来缓解，但会增加计算成本。 2）效率：VALL-E的自回归架构绑定了与现成的音频编解码器模型相同的高帧率，且无法调整，导致推理速度较慢。虽然已经有多项研究用于改进VALL-E的这些问题，但往往会使模型的整体架构复杂化...……更多

2024-07-25 09:34:00堪比,微软,配音,语音,模型,人类

英伟达超快stylegan回归

...024×1024高分辨率的图像，并借鉴了StyleGAN2和StyleGAN3的部分架构设计。它的整体架构如下：具体到细节上，作者们对生成器、判别器和文本对齐权衡机制进行了重新设计，用FID对样本质量进行量化评估，并采用CLIP来对文本进行对...……更多

2023-02-01 14:22:00英伟,生成,图像,模型,作者,英伟

苹果公司公布“mm1”多模态大模型

...模型的性能有不同的影响。据介绍，研究团队首先在模型架构决策和预训练数据上进行小规模消融实验。之后利用混合专家（MixtureofExperts）架构及一种名为Top-2Gating的方法构建了MM1模型，号称不仅在预训练指标中实现了最好的性...……更多

2024-03-16 18:48:00苹果公司,模态,模型,苹果,公司,模型

LLM训练通信量减少10000倍！全新分布式优化器，整合世间

...读】近日，Nous Research宣布了一项重大突破，通过使用与架构和网络无关的分布式优化器，研究人员成功将训练LLM时GPU间的通信量降低了1000到10000倍！如果可以使用世界上所有的算力来训练AI模型，会怎么样？近日，凭借发布了开...……更多

2024-09-10 13:39:00训练,分布式,世间,整合,全新,通信

16家头部大模型公司上海神秘碰头，现场人挤人人人

...亚马逊云科技无疑是在Scaling Law为主旋律的当下妥妥的算力大玩家。其次，在模型层面上的战略，亚马逊云科技走的是一条“集大成者”的路线——当下每个大模型都各自擅长的能力，将它们集成到一起，方便客户选用。也正如...……更多

2024-05-30 17:18:00上海,头部,模型,人人,公司,亚马

Meta 公司发布 Imagine Yourself AI

...个文本编码器和一个可训练视觉编码器的完全并行注意力架构；以及一个从粗到细的多阶段微调过程这些创新技术使该模型能够生成高质量、多样化的图像，同时保持强大的身份保护和文本对齐功能。Imagine Yourself 使用可训练...……更多

2024-08-24 09:44:00模型,公司,模型,生成,图像,身份

手机市场深陷泥沼，厂商如何破冰？

...颈不断，手机厂商该如何破冰，进入下一个增长期？潮汐架构，一份关键答案性能不再是手机的瓶颈，前几年手机厂商都选择了新的影像赛道，通过与传统相机企业的携手同行，让高端手机市场迎来了新的增长机会。如今市面上...……更多

2024-01-09 10:18:00泥沼,厂商,手机,市场,手机,模型

打造全新智算架构，神州鲲泰亮相深圳人工智能生态大会

...区。神州鲲泰全新智算产品亮相活动，并带来“全新智算架构”，以应对多云异构时代的智能算力挑战，神州鲲泰带来的智算产品和创新架构将为人工智能智算中心的打造提供强大助力。尽精微，神州鲲泰“全新智算架构”...……更多

2024-06-05 14:45:00人工智能,深圳,神州,架构,人工,生态

这一代AI追随者的窘境

...扬清说，他的一个朋友告诉他，某国产大模型不过是LLaMA架构，只是更换了几个变量名而已。很快有好事者发现，在大模型、数据集开源社区Hugging Face上，就有一位开发者发出了类似质疑：“该模型使用了Meta LLaMA 的架构，只修...……更多

2023-11-27 15:12:00追随者,窘境,一代,模型,扬清,创业者

苹果发布mm1.5-ui模型

...了300亿参数的多模态AI大模型MM1.5，该版本是在前代MM1的架构基础上发展而来的。该模型继续遵循数据驱动的训练原则，着重探究在不同训练周期中混合各类数据对模型性能产生的影响，相关模型文档已在HuggingFace上发布。MM1.5提...……更多

2024-10-13 10:57:00模型,苹果,模型,苹果公司,数据,苹果

GPT-4劲敌，谷歌进入高能+高产模式

...模型的标准提到了一个新高度。一、极致性能背后的模型架构当地时间2月15日，Alphabet与Google公司首席执行官Sundar Pichai携首席科学家Jeff Dean等众高管在X平台发布了多模态模型Gemini 1.5 Pro。这是继2月7日的Gemini 1.0 Ultra后，谷歌在……更多

2024-02-21 14:05:00劲敌,高产,模式,模型,上下文,处理