易用,架构,生成,模型,图像,高度头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...一图像生成模型 OmniGen。OmniGen 模型具有良好的简洁性和易用性，集成了多种基础图像生成任务，包括但不限于：文生图、图像编辑、角色一致性生成、基于视觉条件的生成等。OmniGen 支持基于任意多模态的文图指令完成任务，而...……更多

2024-10-30 09:53:00易用,架构,生成,模型,图像,高度

财经观察：提升人机交互效率多模态大模型易用性进一步推进

...频聊天等能力。米拉·穆拉蒂表示，“这是我们第一次在易用性方面真正向前迈出了一大步。”此前，大模型在各个领域的应用主要集中在文生文、文生图之上，今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示，...……更多

2024-05-14 13:59:00进一,模态,易用,易用性,人机,模型

百度文心一格总架构师肖欣延：历程坎坷但未来已至，大模型赋能智

...长视频生成等，将得到大幅改善；最后，随着AIGC效果和易用性的提升，内容生成流程将极度简化、便捷。在演讲的最后，肖欣延也表示，AI目前面临的事实一致性、不可控等问题，将来整个技术范式需要加上知识维度，通过精准...……更多

2023-05-26 15:52:00一格,文心,峰会,产业发展,颠覆,坎坷

浪潮科技扭住科技创新“牛鼻子” 开年上线四款新产品

...储、提炼、共享至智慧化和模型化生成的全过程，以简便易用的组织知识管理业务系统融合大模型能力的形式，帮助客户更有效地管理和利用知识资源，简化工作流程，显著提高服务质量和效率。该系统基于Transformer架构的大语...……更多

2024-02-27 17:41:00开年,新产,科技,科技创新,浪潮,新产品

iPad可用AI绘画交互编辑神器火了，网友：颤抖吧PS

...显著优于基线系统，包括复杂性和效率、一致性和集成、易用性以及总体满意度4个方面。看来体验过的用户反馈都不错呢！未来工作团队还表示，这将是一个长期的工作，未来他们的目标是扩展系统功能，纳入更多的编辑类型...……更多

2024-11-21 09:43:00神器,绘画,网友,用户,收集器,图像

OpenAI发布文生视频模型Sora，奥尔特曼选取网友提示词

...用扩散模型（diffusionprobabilisticmodels）技术，基于Transformer架构，但为了解决Transformer架构核心组件注意力机制的长文本、高分辨率图像处理等问题，扩散模型用可扩展性更强的状态空间模型（SSM）主干替代了传统架构中的注意力...……更多

2024-02-16 18:44:00文生,奥尔,奥尔特曼,特曼,模型,提示

送技术支持送资源！联发科携手产业伙伴启动天玑AI先锋计划

...的生成速度，功能包所占用的存储空间也可以大幅减少。易用的Neuron Studio 集成开发环境，跳出传统的代码开发环境，可为开发者提供高度集成的，一站式、可视化开发环境，带来“所见即所得”般更易用的开发体验，让开发过...……更多

2024-05-08 10:06:00联发,天玑,先锋,技术支持,伙伴,支持

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...多方的细节期望。如何实现这一点？这离不开智谱全自研架构的底色——从创立之初，智谱就“自研以明志”，从数据到训练集群运维再到核心算法，都实现了全方位的自研。在视频生成领域，智谱自研的视频理解模型用于为视...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

Find X7正式发布！天玑9300带来极致性能

...，这需要芯片有很高的性能和能效。天玑9300搭载第7代APU架构，最高可支持330亿参数的AI大语言模型，同时还有极低的功耗。 OPPO的FindX7就是利用了天玑9300芯片的生成式AI能力，为用户带来了许多创新的功能。比如通话摘要、文...……更多

2024-01-09 09:51:00天玑,极致,性能,天玑,联发,生成

Sora这就落伍了？Meta“最强视频模型”不用DiT，用L

...最基础的介绍，而最最重要的信息就是，它不再是一个DiT架构的模型，也就是和现在几乎所有最知名的文生视频模型架构都不一样。用Meta视频生成团队的研究科学家Andrew Brown的话说，在这个项目里最大的发现就是：数据，算力...……更多

2024-10-08 09:51:00模型,不用,奇迹,视频,视频,模型

Meta版Sora深夜横空出世，小扎放出16秒高清大片！92

...传图像生成个性化视频。甚至Meta还放出了92页论文，模型架构、训练细节一并公开，干货满满！毫无预兆地，Meta版Sora——Movie Gen，就在刚刚抢先上线了！Meta将其称为「迄今最先进的媒体基础模型」。全新上线的大杀器Movie Gen Vi...……更多

2024-10-08 09:52:00高清,架构,大片,细节,论文,技术

英伟达超快stylegan回归

...024×1024高分辨率的图像，并借鉴了StyleGAN2和StyleGAN3的部分架构设计。它的整体架构如下：具体到细节上，作者们对生成器、判别器和文本对齐权衡机制进行了重新设计，用FID对样本质量进行量化评估，并采用CLIP来对文本进行对...……更多

2023-02-01 14:22:00英伟,生成,图像,模型,作者,英伟

从未见过现实世界数据，MIT在虚拟环境中训练出机器狗，能跑酷

...人出色表现的主要原因。一个简单的 transformer 控制模型架构。研究者提出了一个简单的 transformer 架构，与之前extreme parkour，使用 transformer 大大减少了处理多模态输入时控制模型架构的复杂度，如下图 8 所示。以往四足跑酷的...……更多

2024-11-19 09:50:00从未,现实,机器,训练,环境,数据

1890美元，就能从头训练一个还不错的12亿参数扩散模型

...型大小）实现了更好的性能。最后，作者结合 Transformer 架构的最新进展，例如逐层缩放、使用 MoE 的稀疏 Transformer，以提高大规模训练的性能。作者提出的低成本训练 pipeline 减少了实验开销。除了使用真实图像，作者还考虑在...……更多

2024-07-30 09:37:00从头,模型,训练,参数,掩蔽,训练

Meta 公司发布 Imagine Yourself AI

...个文本编码器和一个可训练视觉编码器的完全并行注意力架构；以及一个从粗到细的多阶段微调过程这些创新技术使该模型能够生成高质量、多样化的图像，同时保持强大的身份保护和文本对齐功能。Imagine Yourself 使用可训练...……更多

2024-08-24 09:44:00模型,公司,模型,生成,图像,身份

oppo首个端侧应用70亿参数大模型findx7系列

...星通话，首个端侧应用70亿参数大模型，首次亮相的潮汐架构等诸多前沿技术。此次宣布的全新技术组合将全面落地下一代旗舰产品FindX7系列，为2024年旗舰手机树立全新的技术标杆，并为消费者带来刷新标准的创新旗舰体验发布...……更多

2023-12-28 10:13:00模型,参数,应用,技术,模型,芯片

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

文 | 周鑫雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司，近期完成了新一轮融资。投资名单中，也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...时离开视野也保持不变。与GPT模型类似，Sora使用Transformer架构。Sora建立在过去对DALL·E和GPT模型的研究之上。它使用DALL·E 3的重述技术，该技术涉及为视觉训练数据生成高度描述性的标题。因此，该模型能够更精准遵循生成用户...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

英伟达推出全新文生图ai模型

...达GettyImages表示全新文生图AI模型部分基于英伟达Edify模型架构，该架构隶属于英伟达Picasso，主要为视觉设计搭建和部署生成式AI模型。英伟达Edify模型架构不仅能够带来更快的生成速度、更高的质量、更符合用户输入的提示词，...……更多

2024-07-31 02:34:00文生,英伟,模型,全新,英伟,生成

4090笔记本0.37秒直出大片！英伟达联手MIT清华祭出S

...本，秒生1K质量高清图。英伟达联合MIT清华团队提出的Sana架构，得益于核心架构创新，具备了惊人的图像生成速度，而且最高能实现4k分辨率。一台16GB的4090笔记本，仅需0.37秒，直接吐出1024×1024像素图片。如此神速AI生图工具，...……更多

2024-10-18 09:49:00英伟,清华,架构,大片,性能,笔记本

stability邀请用户测试文本到图像生成模型

...StabilityDiffusion3还结合了扩散型变换器（diffusiontransformer）架构，这种架构结合了深度学习和扩散模型的优势，能够将随机噪声逐步转化为有意义的图像或视频内容。 ……更多

2024-02-23 16:10:00生成,模型,图像,文本,测试,用户

AI出图更快、更懂你心意，高美感文生图模型修炼了哪些技术秘籍

...》就邀请到了豆包文生图技术专家李亮、NVIDIA 解决方案架构师赵一嘉，为我们深入剖析了文生图模型出图更美、更快、更懂用户心意背后的技术链路。直播开始，李亮首先详细拆解了近期国产大模型「顶流」—— 字节跳动豆包...……更多

2024-08-13 09:39:00文生,出图,美感,秘籍,心意,更快

腾讯混元上线文生视频并开源，120秒内成片！还有提示词建议

...态ScalingLaw，增强时空建模与动态表现；4、采用自研3D VAE架构，提升图像和视频的重建能力。与此同时，腾讯宣布将这款拥有130亿参数规模的视频生成模型开源。目前，该模型已在APP与Web端发布，其标准模式下的视频生成大约需...……更多

2024-12-04 09:49:00文生,腾讯,提示,建议,视频,生成

英特尔AI PC半年“答卷”：三大AI引擎驱动

...的生产力、安全性、稳定性、可管理性、可持续性，以及易用性等方面，都更胜一筹。锚定6大AI商用场景，全面赋能千行百业当AI浪潮以无可阻挡的趋势到来时，更能看到产业链顶端厂商的底蕴所在。在AI PC的发展当中，英特尔...……更多

2024-04-04 15:01:00英特,英特尔,答卷,半年,驱动,三大

Sora刷屏标贝科技AI配音为音视频内容创作插上翅膀

... 生成式AI新里程碑据介绍，Sora采用了扩散模型和Transformer架构的结合(Diffusion Transformers, DiTs)。扩散模型通过逐渐添加噪声来破坏图像，然后学习逆向过程来恢复图像。Transformer架构则可以捕捉图像中的全局依赖关系。Sora的生成过...……更多

2024-02-29 12:00:00音视,配音,翅膀,创作,内容,科技