易用,架构,生成,模型,图像,高度头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...远不如使用具有特征预测损失和崩溃预防机制的联合嵌入架构。这篇来自纽约大学 @sainingxie 的论文表明，即使你只对生成像素感兴趣（例如使用扩散 Transformer 生成漂亮图片），也应该包含特征预测损失，以便解码器的内部表征...……更多

2024-10-15 09:57:00模型,训练,方法,模型,训练,视觉

AI视频生成器Sora引发安全忧虑

...。另一种是将顺序数据根据上下文拼接在一起的“转换器架构”技术，例如，大型语言模型就是使用转换器架构将单词组装成可理解的句子。不过，Sora生成的视频中仍然有很多错误，比如一个行走的人的左右腿交换位置、一把...……更多

2024-02-19 07:41:00生成器,忧虑,生成,安全,视频,视频

AI落地千行百业，存储痛点凸显，浪潮信息如何助力AI向实？

...即存储和计算的平衡及两者的有效利用。然而测试中存储架构的多样与存算节点的非标准化，导致性能数据本身的参考价值有所下降。在性能数据之外，有无另一指标可以更为准确地反映存储系统在AI场景的表现呢？MLPerf存储基...……更多

2024-11-08 09:46:00浪潮信息,痛点,浪潮,百业,落地,存储

2022生成模型进展有多快，新论文盘点9类生成模型代表作

...有Phenaki、Soundify。Phenaki 由谷歌打造，基于新的编解码器架构C-ViViT将视频压缩为离散嵌入，能够在时空两个维度上压缩视频，在时间上保持自回归的同时，还能自回归生成任意长度的视频。Soundify 是Runway开发的一个系统，目的是...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

信号表征指数级强、内存节省35%，量子隐式表征网络

... MLP 拟合的图像的不同频率分量（底部）模型图 3. 模型架构模型整体架构QIREN 的总体架构如图 3 所示，由 N 个混合层和末端的线性层组成。该模型以坐标作为输入并输出信号值。数据最初进入混合层，从 Linear 层和 BatchNorm 层开...……更多

2024-06-27 09:24:00量子,信号,内存,指数,网络,量子

GPT-4就是冲着赚钱来的！

...家，千芯科技董事长陈巍博士认为，OpenAI不公布参数量和架构是一种商业化技术保护策略，增加其竞争对手的产品试错成本。不过目前也没法排除GPT-4参数量小于GPT-3的可能性。迅速落地商业应用，保密参数量，增加图片识别能...……更多

2023-03-16 09:00:00就是,模型,阿拉贡,能力,训练,模态

stablediffusion3：文字渲染能力大升级

...的是，它和Sora一样当起了维新派，摒弃了业内常用的U-NET架构，加入Transformer和Diffusion结合的大家族。而具体的原理和进步啥的，看不懂没关系，咱们过会儿再聊。直接先来一波全新的高清无码大图，让大伙们见识下StableDiffusion3...……更多

2024-02-25 03:03:00力大,文字,升级,文生,一波,架构

智谱AI“中国版Sora”实测：6秒视频排队2分钟，猫猫很可

...三个维度融合起来。该模型参考Sora算法设计，采用了DiT架构，相比前代CogVideo模型推理速度提升了6倍。智谱AI成立于2019年6月，起源于清华大学计算机系知识工程实验室，专注于开发新一代认知智能大模型。一直以来，智谱AI以...……更多

2024-07-27 09:18:00实测,人手,中国,视频,清影,视频

抽卡效率提升4.8倍！东北大学等开源优化版Stable-Di

...配到不同的计算线程与核心上，充分利用多线程和多核心架构，动态分配计算任务，充分发挥硬件性能，减少图像生成延迟。尤其是在M系列Mac设备上，优化了性能核心（P-core）和效率核心（E-core）的分工，使推理速度得到了显...……更多

2024-12-21 09:14:00东北大学,生成,分辨率,效率,质量,大学

腾讯云公布多项大模型产品进展

...模型也持续迭代升级。在生图领域，腾讯混元文生图基础架构已全面升级至Sora同款的DiT架构，支持中英文双语输入及理解，具备多轮绘图能力，测评结果国内领先；在生视频领域，腾讯混元支持文生视频、图生视频、图文生视...……更多

2024-05-22 04:24:00腾讯,进展,模型,产品,模型,腾讯

比Stable Diffusion便宜118倍！1890美元

...幸存的patch中，从而显著减少高mask带来的性能下降。在本架构中，patch-mixer是通过注意力层和前馈层的组合来实现的，使用二进制掩码进行mask，整个模型的损失函数为：与MaskDiT相比，这里不需要额外的损失函数，整体设计和训...……更多

2024-08-13 09:42:00文生,高质量,模型,参数,模型,训练

全球首个端侧应用 70 亿参数大语言模型手机OPPO Fin

...的5G通讯、AI等高含金量领域。Find X7 搭载 OPPO 自研的潮汐架构，通过将性能研究深入到芯片底层，实现异构计算单元的超动态调度，让旗舰手机可以兼具极致的性能释放、极致的能效表现。OPPO芯片技术负责人姜波表示：“想做...……更多

2024-01-09 13:54:00模型,参数,语言,应用,全球,手机

LeCun最新万字演讲：纯语言模型到不了人类水平，我们基本已

...此之外，他还谈到当前大模型的局限性、以目标驱动的AI架构，包括利用世界模型进行推理和规划，最后强调了开源AI的重要性。对于未来发展，他提到，最终机器将超越人类智能，但它们将受到控制，因为它们是目标驱动的。...……更多

2024-10-18 09:42:00模型,人类,水平,语言,系统,模型

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...觉任务的Llama模型，Meta为11B和90B型打造了一个全新的模型架构。在图像输入方面，训练了一组适配器权重，将预训练的图像编码器集成到预训练的大语言模型中。具体来说，该适配器：由一系列交叉注意力层组成，负责将图像编...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

智谱AI发布视频生成大模型，B站参与研发，亦庄提供算力｜甲子

...空间。从模型本身角度看，需要更具突破式创新的新模型架构，它应该更高效压缩视频信息，更充分融合文本和视频内容，贴合用户指令的同时，让生成内容真实感更高。2.自研DiT架构清影底座的视频生成模型是CogVideoX，它将文...……更多

2024-07-27 09:30:00亦庄,甲子,生成,模型,视频,模型

大模型的未来，快手在自己身上找答案

...上来说已经远优于同类数字人产品效果。这是因为在工程架构方面，「AI 关小芳」实现了端云结合的技术架构设计，通过搭建分布式流媒体计算调度框架、自研大模型能力算子化适配和专有网络协议加速，支持用户双工和 AI 智...……更多

2024-07-11 14:20:00快手,模型,答案,快手,模型,小芳

阿里多模态检索智能体，自带o1式思考过程！复杂问题逐步拆解

...，OmniSearch引入了一种动态检索规划框架。OmniSearch的核心架构包括：规划智能体（Planning Agent）：负责对原始问题进行逐步拆解，根据每个检索步骤的反馈决定下一步的子问题及检索策略。检索器（Retriever）：执行实际的检索任...……更多

2024-12-05 09:45:00模态,拆解,阿里,检索,过程,智能

天玑9300 苏黎世AI跑分超2000，AI性能第一

...！在科技日新月异的今天，天玑9300旗舰芯片以全大核CPU架构引领潮流，打破了固有模式。为用户带来了“高智能、高性能、高能效、低功耗”的使用体验，轻松拿下综合性能第一、CPU多核性能第一、GPU性能第一、AI性能第一等响...……更多

2023-11-07 20:43:00苏黎世,天玑,性能,天玑,联发,性能

Sora背后团队：成立不到1年，站在谷歌肩头，应届博士带队

...空Patch）技术和DiffusionTransformer（DiT，或扩散型Transformer）架构。Sora官网截图记者查询这两项技术的原作论文发现，时空Patch的技术论文实际上是由谷歌DeepMind的科学家们于2023年7月发表的。DiT架构技术论文的一作则是Sora团队领导..……更多

2024-02-19 15:59:00肩头,背后,团队,博士,团队,架构

轻量化模型架构catvton的优势在哪里

...下。来自中山大学、Pixocial等机构联合发布轻量化模型架构CatVTON。他们是以StableDiffusionv1.5inpainitng为基础模型。来看看更多效果。用扩散模型进行虚拟试衣CatVTON可以实现传统平铺服装图到人物的换装。不管是上衣、裤子、裙子...……更多

2024-08-01 08:52:00架构,模型,优势,模型,训练,模块

华人团队爆火instructblip抢跑看图聊天

...的信息转移。InstructBLIP通过充分利用BLIP-2模型中的Q-Former架构，提出了一种指令感知的视觉特征提取方法。如上图所示，Q-Former被设计用来从一个冻结的图像编码器的输出中提取视觉特征。根据BLIP-2的论文，Q-Former已经分成两个阶...……更多

2023-05-15 20:17:00团队,华人,指令,数据,模型,研究

较传统采标方法降本80%，合成数据服务商「卓印智能」获天使轮

...据来源：卓印智能创始人俞开文博士有多年AI算法、技术架构经验，曾经历任蚂蚁、百度等大厂中的资深AI架构师，有丰富的大型To B项目落地经验。他告诉36氪，从数据角度，优质数据的短缺一直是困扰AI赛道的难题。“在各式...……更多

2024-05-31 13:59:00采标,服务商,融资,传统,天使,智能

生成式AI在金融行业的应用及思考

...引发了广泛关注和热议。在这场由亚马逊云科技金融行业架构师团队负责人张呈刚先生主讲的演讲中,他全面深入地探讨了生成式人工智能在金融行业的应用现状、挑战和机遇,并分享了亚马逊云科技为企业提供的全方位支持和解...……更多

2024-04-22 13:21:00生成,金融,应用,行业,生成,人工智能

OpenAI发布首个文生视频模型Sora，网友：工作要丢了！

...初的随机像素转化为清晰的图像场景。Sora使用了Transformer架构，有极强的扩展性。视频和图像是被称为“补丁”的较小数据单位集合，每个“补丁”都类似于GPT中的一个标记（Token），通过统一的数据表达方式，可以在更广泛的...……更多

2024-02-16 18:20:00文生,模型,网友,工作,视频,模型

黄仁勋对话Transformer七子：我们被困在原始模型里，

...术，还无法触及每个人。而它有如此多的用途，如此简单易用。我们的最终目标是帮助全世界每个人。所以我必须离职创业，让这些发生。Jakob Uszkoreit（Inceptive）：我更多意识到，这项技术能比以前更广泛地改善人们的生活质量...……更多

2024-03-22 00:03:00架构,模型,对话,模型,数据,资源

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

...型的使用，让模型得以具备生成音乐的能力。在完成模型架构设计的基础上，他们搜集了目前市场上可以找到的所有开放版权音乐，并利用 MU-LLaMA 和一些视觉基础模型来生成文本/图像/视频到音乐的多模态数据集，从而助力 M2Uge...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

国产AI可以拍微电影了！4K、60帧高清画质，自带音效

...将自然语言描述转化为动态视觉内容的复杂系统。在模型架构设计中，CogVideoX特别采用了因果3D卷积（Causal 3D Convolution），以高效捕捉时空维度上的复杂变化，使得模型能够更加精确地理解和生成富有细节的场景。同时，该模型...……更多

2024-11-09 09:54:00画质,音效,高清,国产,电影,生成

全新一代天玑9300全大核架构，到底有何玄机？

...动芯片天玑9300。全新一代天玑9300芯片凭借创新的全大核架构设计，提供了远超以往的高智能、高性能、高能效、低功耗等热特性，通过极具突破性的先进科技创新，在端侧生成式AI、游戏、影像等方面重新定义了旗舰移动体验...……更多

2023-11-07 19:59:00天玑,玄机,架构,一代,全新,天玑

一文读懂黄仁勋CES重磅发布：最新5090芯片、世界最大AI

...仁勋发布了一系列重磅技术产品，包括新一代基于Blackwell架构的RTX 50系列显卡、世界上最大最快的巨型芯片Grace Blackwell NVLink72、首个世界基础模型Cosmos等，并公布了在AI代理、物理AI等方面的布局和进展。新一代GeForce RTX 50系列芯...……更多

2025-01-07 19:00:00一文,世界,重磅,芯片,模型,计算机