模型,公司,模型,生成,图像,身份头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

Meta 公司发布 Imagine Yourself AI

...可扩展性，为此 Meta 公司创新提出了“Imagine Yourself” AI 模型。传统个性化图像生成方法挑战目前的个性化图像生成方法通常依赖于为每个用户调整模型，这种方法效率低下，而且缺乏通用性。虽然较新的方法试图在不进行调整...……更多

2024-08-24 09:44:00模型,公司,模型,生成,图像,身份

Google推出全新人工智能模型Gemini 2.0 用途更

Google的下一个主要人工智能模型已经到来，以对抗来自 OpenAI 的新产品的夹击。本周三，Google 发布了 Gemini 2.0 Flash，该公司称其除文本外，还能原生生成图像和音频。 2.0 Flash 还可以调用第三方应用程序和服务，使其能够接入 Goo...……更多

2024-12-12 09:54:00人工智能,人工,模型,用途,全新,智能

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

...e Information 的一篇文章。这篇文章透露，OpenAI 下一代旗舰模型的质量提升幅度不及前两款旗舰模型之间的质量提升，因为高质量文本和其他数据的供应量正在减少，原本的 Scaling Law（用更多的数据训练更大的模型）可能无以为继...……更多

2024-11-27 13:32:00潜力,模型,图像,起点,领域,还是

腾讯3D大模型全面开源，文本图像10秒转3D资产

3D生成开源界首个同时支持文字、图像转3D的模型来了，效果还是SOTA级别。就在刚刚，腾讯宣布推出Hunyuan3D-1.0，一口气开源轻量版和标准版两个模型。最快10秒就能端到端生成。先生成6个多视角图像，再进行多视角重建，“啪...……更多

2024-11-06 09:43:00腾讯,模型,图像,文本,资产,生成

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...智能（AI）巨头OpenAI又出王炸，其最新推出的文生视频大模型Sora因其“逼真”和“富有想象力”被广泛赞誉，其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍，Sora是一种扩散模型，它...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

谷歌CEO反思大模型生成错误图像：不可接受，初期没有完美AI

...，跌1.91%，总市值1.70万亿美元。就在本月初，谷歌为其AI模型Gemini推出了图像生成器工具，允许用户通过输入提示来创建图像。但在过去一周中，网友们发现，该工具似乎在有意避免生成包含白人的图像，并在图像中加入了过量...……更多

2024-02-29 15:37:00初期,生成,模型,图像,错误,生成

最强开源文生图模型一夜易主！SD原班人马打造，要发SOTA视

最强开源文生图模型一夜易主！智东西8月2日报道，昨日晚间，开源文生图模型霸主Stable Diffusion原班人马，宣布推出全新的图像生成模型FLUX.1。FLUX.1包含专业版、开发者版、快速版三种模型，其中前两款模型击败SD3-Ultra等主流...……更多

2024-08-05 09:39:00文生,人马,模型,生成,视频,模型

谷歌人工智能模型gemini生成人物图像存在问题

2月25日，据报道，谷歌公司的人工智能（AI）模型Gemini在生成人物图像时存在一些问题，用户反馈该模型无法准确地生成白人形象。尽管Gemini能够根据文字快速生成各种各样的人物形象，并且输入关键词“高兴的黑人”时也没有...……更多

2024-02-26 02:06:00人工智能,人工,生成,模型,图像,人物

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

今日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal：通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D：无需训练的「...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

ai绘画侵权实锤，扩散模型可能记住你的照片

AI绘画侵权，实锤了！最新研究表明，扩散模型会牢牢记住训练集中的样本，并在生成时“依葫芦画瓢”。也就是说，像StableDiffusion生成的AI画作里，每一笔背后都可能隐藏着一次侵权事件。不仅如此，经过研究对比，扩散模型...……更多

2023-02-03 22:00:00绘画,侵权,模型,照片,模型,训练

谷歌发布基础世界模型Genie

...维”公司重磅发布了一个根据互联网视频训练的基础世界模型——Genie（精灵）。其可从合成图像、照片、草图生成多种动作可控的环境。过去几年，生成式人工智能（AI）模型能通过语言、图像甚至视频生成内容。谷歌此次引...……更多

2024-02-29 07:19:00模型,基础,世界,生成,图像,环境

英伟达推出全新文生图ai模型

...昨日（7月29日）发布声明，联合推出安全的商业文生图AI模型，能够在6秒时间内生成4张照片，比以前的模型性能提高了一倍，速度处于行业领先水平。图源：英伟达GettyImages表示全新文生图AI模型部分基于英伟达Edify模型架构，...……更多

2024-07-31 02:34:00文生,英伟,模型,全新,英伟,生成

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 |

...模态不可学习样本，以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器，MEM方法有效地误导模型，降低其对隐私数据的学习能力，并在不同模型间展现出强大的可迁移性。多模态对比学习（如CLIP）...……更多

2024-08-02 09:55:00误差,中科院,隐私,方法,数据,学习

StableDiffusion原班人马新公司官宣！连发新模型

...森林实验室。一亮相就kuku发了一个系列、共3款图片生成模型，其中有2个开源。而且支持中文输入。效果怎么样？看过的网友称很狂野（wild）！输入提示词，一次测试出了画面效果和人脸数据等安全措施：一名十多岁戴着滑雪...……更多

2024-08-05 09:38:00人马,绘画,格局,模型,公司,黑森林

本周硅谷发生了什么？| 高通第三代骁龙8；谷歌20亿美元追投

...on CPU、骁龙8 Gen3等在内的王炸产品，后有联系拿出能跑大模型的个人PC。还有谷歌20亿追投Anthropic，并曝光多模态模型Gemini和工具Stubbs，将为用户更多便捷和创新的应用开发方式。Meta公布第三季度财报，实现23%的营收增长，是公...……更多

2023-10-30 15:31:00高通,三代,硅谷,模型,个人,模型

meta推出全新ai图像生成器，可创建高分辨率图像

...。据介绍，新的人工图像生成器由Meta现有的Emu图像生成模型提供支持，可根据文本提示创建高分辨率图像。它目前对美国的英语用户免费使用（后续是否收费未知），并且每个提示都会生成四个图像。此前，Meta图像生成模型因...……更多

2023-12-07 13:34:00建高,图像,生成器,生成,分辨率,全新

深度剖析：谷歌、微软等AI巨头承诺的“自愿监管”做到了吗？

...达到最泡沫”之际做出的，各家公司都在竞相推出自己的模型，并使其比竞争对手的模型更大、更好。与此同时，我们也开始看到围绕版权和深度伪造等问题的争论。Geoffrey Hinton 等有影响力的科技人士组成的游说团也提出了人...……更多

2024-07-25 14:30:00微软,巨头,剖析,监管,深度,人工智能

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...雨编辑 | 邓咏仪全球首家发布Sora同款底层架构的清华系模型公司，近期完成了新一轮融资。投资名单中，也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

ECCV 2024 | 南洋理工三维数字人生成新范式：结构扩

...自新加坡南洋理工大学 S-Lab 团队提出结构化隐空间扩散模型（Structured Latent Diffusion Model）的三维数字人生成新范式 StructLDM。该范式包括三个关键设计：结构化的高维人体表征、结构化的自动解码器以及结构化的隐空间扩散模型...……更多

2024-08-13 09:36:00南洋,三维,范式,理工,生成,模型

这家川企如何出海抢市场

...智能新赛道，很多初创公司“拿着锤子找钉子”，先做大模型，再去找应用场景，但实际上很难落地。对于成都恒图来说，则是先找到行业需求，瞄准图像处理这个场景，再去用技术为行业赋能。竞逐文生视频新赛道，这家川企...……更多

2024-03-28 06:40:00市场,视频,成都,模型,场景,行业

苹果发布新型开源人工智能模型：可根据自然语言指令编辑图像

...。苹果公司近日发布了名为“MGIE”的新型开源人工智能模型，它可以根据自然语言指令编辑图像。图源：VentureBeat与Midjourney合作制作MGIE的全称是MLLM-GuidedImageEditing，利用多模态大型语言模型（MLLM）解释用户指令并执行像素级操...……更多

2024-02-09 03:32:00自然语言,人工智能,指令,人工,模型,图像

下载次数破39万！CMU、Meta联合发布VQAScore文

【新智元导读】VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法；GenAI-Bench是一个包含复杂文本提示的基准测试集，用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的...……更多

2024-11-07 09:53:00文生,次数,联合,方案,模型,文生

新扩散模型OmniGen一统图像生成，架构还高度简化、易用

大型语言模型（LLM）的出现统一了语言生成任务，并彻底改变了人机交互。然而，在图像生成领域，能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日，智源推出了新的扩散模型架构 OmniGen，一种新的...……更多

2024-10-30 09:53:00易用,架构,生成,模型,图像,高度

让人工智能模型训练提速10倍以上

本文转自：中国科学报南开大学等让人工智能模型训练提速10倍以上本报讯（通讯员高雨桐记者陈彬）南开大学、南开国际先进研究院（深圳福田）教授程明明团队发布了一项国际联合研究成果MDT，与人工智能文字生成视频大...……更多

2024-04-03 07:20:00人工智能,提速,人工,模型,训练,智能

2023 的人工智能之年

...风格或纹理应用于文字和短语。Midjourney：Midjourney 的 V.5 模型在图像生成领域是一个重要的里程碑，它展示了在效率、连贯性和高分辨率方面的显著改进。最新的 alpha 版本，Midjourney V.6，引入了额外的增强功能，如更精准的提示...……更多

2023-12-29 05:02:00之年,人工智能,人工,智能,生成,人工智能

AI 已死？不，AIGC 给我们带来了新的希望 | 氪记 2

...上了一步台阶，可以向公众发布以供广泛使用。以大语言模型（large language models，以下简称“LLM”）为基础的 text-to-X（文本到任意）技术再在2022年有了突破性进展，分别在 text- to-image（文本到图片）、AI-generated-text（AI 生成……更多

2023-01-05 09:26:00模型,生成,用户,技术,应用,图像

OpenAI发布文生视频模型Sora，奥尔特曼选取网友提示词

...凌晨，OpenAI再次扔出一枚深水炸弹，发布了首个文生视频模型Sora。据介绍，Sora可以直接输出长达60秒的视频，并且包含高度细致的背景、复杂的多角度镜头，以及富有情感的多个角色。目前官网上已经更新了48个视频demo，在这...……更多

2024-02-16 18:44:00文生,奥尔,奥尔特曼,特曼,模型,提示

“平替版Midjourney”，上线1年超700万用户，生成

...Leonardo.ai官网功能方面，Leonardo.ai是基于Stable Diffusion开源模型建立，集成插件支持AI生图、改图、扩图和3D素材生成。因操作简单，界面友好，用户评价它是“简单版Stable Diffusion”，具有较高的性价比。Leonardo.ai精选模型（Fine……更多

2024-02-21 13:46:00生成,用户,图片,用户,生成,模型