生成,模型,图像,文本,测试,用户头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal：通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D：无需训练的「图...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

Bengio团队提出多模态新基准，直指Claude 3.5和

...阅读原文即可直达，包含评用于模型评测和预训练的数据生成代码） Hugging Face 链接：huggingface.co/vcr-org VCR 数据集简介为了开发 VCR 任务，研究人员构建了一个由图像 - 文字生成 VCR 合成图像的流程。在该流程中可以通过控制遮...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

Meta 公司发布 Imagine Yourself AI

...家 8 月 23 日消息，从社交媒体到虚拟现实，个性化图像生成因其在各种应用中的潜力而日益受到关注。传统方法通常需要针对每位用户进行大量调整，从而限制了效率和可扩展性，为此 Meta 公司创新提出了“Imagine Yourself” AI 模...……更多

2024-08-24 09:44:00模型,公司,模型,生成,图像,身份

快手发布大模型产品“可图” 20多种创新AI图像玩法限免上线

...通过人像保持技术，可轻松保留人像的自然特征，并一键生成各种风格的人像作品，满足不同社交及营销场景的个性化形象需求。例如，用户只需上传一张面部轮廓清晰的照片，并选择偏好的风格，调节保留面部特征的程度，便...……更多

2024-05-31 17:41:00可图,快手,玩法,模型,图像,多种

全模态对齐框架align-anything来啦：实现跨模态指

...型进行模态扩展，得到不仅能够处理语言，还可以理解并生成图像、音频、视频等多种信息的全模态模型，如 GPT-4o、Chameleon 等。也包含目前最为流行的开源视觉语言模型，Llama-3.2-Vision。以 Llama-3.2-Vision 为代表的大语言模型多模...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

谷歌发布 AI 图像生成新工具 Whisk，支持上传多张图片

... 17 日消息，谷歌今日发布了一款名为 Whisk 的全新 AI 图像生成工具，该工具允许用户使用其他图像作为提示来生成图像，而不需要冗长的文本提示。用户只需提供图像，即可指定 AI 生成图像的主题、场景和风格。使用 Whisk 时，...……更多

2024-12-18 09:29:00多张,生成,图像,支持,工具,图片

腾讯3D大模型全面开源，文本图像10秒转3D资产

3D生成开源界首个同时支持文字、图像转3D的模型来了，效果还是SOTA级别。就在刚刚，腾讯宣布推出Hunyuan3D-1.0，一口气开源轻量版和标准版两个模型。最快10秒就能端到端生成。先生成6个多视角图像，再进行多视角重建，“啪...……更多

2024-11-06 09:43:00腾讯,模型,图像,文本,资产,生成

shutterstock新增“创意编辑”功能

...利用了公司对OpenAI最新技术的优先访问权，用户可使用AI生成新内容，或者对Shutterstock图库中的任何图片进行简单编辑、转换。这套“创意编辑”功能拥有6大类别，以及AI设计助手等辅助功能和号称是行业内“最先进”的滤镜等...……更多

2023-10-27 14:53:00创意,功能,图片,生成,图像,功能

AIGC工具测评：生成式AI的产品表现如何

过去这一年，全球涌现出了众多生成式AI产品。在这篇文章中，我们将探讨这些工具的表现，通过实际体验和评估，为读者提供一个关于当前AI工具的全面视角。2023年，AI技术迎来了其发展史上的一次重大飞跃。随着技术突破和...……更多

2024-03-25 13:00:00生成,工具,产品,用户,界面,通义

苹果智能为iPhone、iPad和Mac引入强大的生成式模型

...d和Mac的个人智能化系统AppleIntelligence，基于个人场景发挥生成式模型的强大功用，结合用户情况提供有助益且相关的智能化功能。AppleIntelligence深度集成于iOS18、iPadOS18和macOSSequoia中，充分运用Apple芯片对语言和图像的理解与创作..……更多

2024-06-16 12:24:00生成,模型,苹果,智能,用户,功能

英伟达超快stylegan回归

扩散模型的图像生成统治地位，终于要被GAN夺回了？就在大伙儿喜迎新年之际，英伟达一群科学家悄悄给StyleGAN系列做了个升级，变出个PLUS版的 StyleGAN-T，一下子在网上火了。无论是在星云爆炸中生成一只柯基：还是基于虚幻引...……更多

2023-02-01 14:22:00英伟,生成,图像,模型,作者,英伟

苹果将在ios18中推出一系列新功能

...能回应框架及在苹果设备上运行的LLM技术，以此提升响应生成能力。未来，Siri生成回复和摘要时，能综合考虑人名、公司信息、日历事件、地点、时间等多重因素，使互动更加贴合实际情境。此前，有外媒报道了Safari18、AjaxLLM...……更多

2024-06-04 09:02:00新功能,苹果,苹果,人工智能,应用,智能

本周硅谷发生了什么？｜OpenAI推出5项更新；微软组建新的

...项模型更新，同时发布了GPT-4 Turbo预览模型，提升了代码生成能力。Google发布文本生成视频模型Lumiere，生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量，组建新的GenAI团队研发小模型，减少对OpenAI...……更多

2024-01-29 09:34:00文生,硅谷,微软,模型,团队,更新

本周硅谷发生了什么？| 高通第三代骁龙8；谷歌20亿美元追投

...开发商Moreh完成2200万美元B轮融资Zero123++：从单一图片，生成多张从不同角度看这个物体或场景的图像Anthropic AI发布论文，表示大模型存在“拍马屁”问题大事件高通骁龙峰会，新品碾压英特尔苹果10月25日，高通骁龙峰会推出了...……更多

2023-10-30 15:31:00高通,三代,硅谷,模型,个人,模型

AI拜年火了，通义千问上线一张照片生成拜年视频

...多项免费新应用，涵盖全家福、拜新年、万物成龙等图像生成的新玩法，共提供超300套照片模板，用户上传照片即可生成全家福、团圆照、拜年照、千里江山主题照；此外，一个月前火爆全网的全民舞王应用也迎来上新，用户可...……更多

2024-02-05 13:37:00通义,生成,照片,视频,生成,通义

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...反馈的开源检索增强框架SearchLVLMs。该框架主要包括查询生成、搜索引擎调用、分层过滤三个部分。以视觉问答为例，该框架会基于问题和图片生成查询关键词，并调用搜索引擎查找相关信息，再由粗到细地对检索结果进行过...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

MWC联发科展台速览：端侧AI和移动通信黑科技有突破

...题的展厅，吸引了众多行业专家和媒体关注。特别是现场生成式AI技术演示，令众多与会者纷纷争相体验。实时AI视频生成展示人气爆棚来到展会现场，今年联发科不仅重点展出了很多端侧生成式AI技术的创新应用，包括SDXLTurbo...……更多

2024-02-27 21:30:00联发,展台,移动通信,突破,通信,移动

Sora未开放课先火选课当心被割韭菜

输入寥寥数语便能生成效果炸裂的60秒视频！美国开放人工智能研究中心（OpenAI）推出的视频生成模型Sora近日震惊全球。目前，Sora只发布了多个演示视频和技术指导，并对一些专家开放内测，但该模型尚未对公众开放注册。也...……更多

2024-02-22 19:25:00韭菜,开放,视频,生成,模型,提示

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...模型Sora因其“逼真”和“富有想象力”被广泛赞誉，其生成视频可达60秒也颠覆了传统视频生成领域平均只有4秒的视频生成长度。OpenAI官网介绍，Sora是一种扩散模型，它从看起来像静态噪声的视频开始生成视频，然后通过多个...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

10元就能“复活”亲人？数字重生背后信息安全边界在哪里

...自己面前对话一样。”“AI复活主要用到语音合成、图像生成和对话交互三大技术。”看科技博主黄海峰向记者介绍了AI复活背后的核心技术。在语音合成方面，借助Tacotron等深度学习模型，剖析大量语音数据，提取特征并关联文...……更多

2025-04-01 12:44:00边界,亲人,背后,数字,安全,信息

用过GPT-4 Turbo以后，我们再也回不去了

...成几分钟：我直接不装了，截个图复制粘贴别人的网站，生成自己的，只用 40 秒：利用 ChatGPT 与 Bing 的浏览功能以及与 DALL-E 3 图像生成器的集成，沃顿商学院教授 Ethan Mollick 分享了一段视频，展示了他的名为「趋势分析器」的 ...……更多

2023-11-08 18:08:00模型,测试,用户,代码,基准,尝试

OpenAI史诗级更新！最强大模型炸场，128K上下文、价格

...T打造成一个AI助手，让开发者通过简单的自然语言对话，生成所需要的定制化AI助手。可见，其野心已经远不止于做一个对话机器人，而是要做类似一个生产力工具的“超能”产品。OpenAI将向推出最有用和最常用GPTs的开发者付费...……更多

2023-11-07 17:45:00上下文,史诗,模型,上下,更新,价格

腾讯混元文生图大模型升级并对外开源

...DiT架构。混元DiT是一个基于Diffusiontransformer的文本到图像生成模型，此模型具有中英文细粒度理解能力，混元DiT能够与用户进行多轮对话，根据上下文生成并完善图像。这也是业内首个中文原生的DiT架构文生图开源模型，支持中...……更多

2024-05-15 14:23:00文生,腾讯,模型,对外,升级,文生

“Sora目前仍不够可靠，应用场景受限”

近日，博主“AI疯人院”在网络上发布了一部利用AI技术生成的《西游记》动画短片。短片中展现了错落有致的宫殿群、郁郁葱葱的花果山，还有山间云卷云舒、山石崩裂等动画画面，令众多网友赞叹不已。这段短片利用了AI规...……更多

2024-03-02 10:00:00场景,不够,应用,生成,视频,模型

vivo发布自研大模型，为用户和开发者带来诸多惊喜

...大模型创新：推出中文原生文生图大模型，突破文字可控生成技术难题;3、全模态技术扩展：新增语音和多模态理解大模型，实现全模态AI技术升级;4、端侧大模型发布：隆重推出3B端侧大模型，能力更强、速度更快、更加安全和...……更多

2024-10-14 01:53:00开发者,模型,惊喜,用户,开发,模型

开源社区参数量最大的文生视频模型来了，腾讯版Sora免费使用

...小伙伴又多了一个选择！今日，腾讯宣布旗下的混元视频生成大模型（HunYuan-Video ）对外开源，模型参数量 130 亿，可供企业与个人开发者免费使用。目前该模型已上线腾讯元宝 APP，用户可在 AI 应用中的「AI 视频」板块申请试用...……更多

2024-12-04 09:48:00文生,腾讯,模型,参数,社区,视频

生成式AI的抄袭输出问题值得关注（附图片）

...频游戏中的镜头几乎相同（左侧为原作，右侧为Midjourney生成图片）。（图片来源：IEEE Spectrum）这些图像均由Midjourney制作生成，提示词中均包含“screencap”。（图片来源：IEEE Spectrum）大语言模型（LLM）在多大程度上“记住”了...……更多

2024-01-11 06:45:00生成,输出,抄袭,问题,图片,输出

清华领衔发布多模态评估MultiTrust：GPT-4可信度

...维度，MultiTrust构建了32个多样的任务场景，覆盖了判别和生成任务，跨越了纯文本任务和多模态任务。任务对应的数据集不仅基于公开的文本或图像数据集进行改造和适配，还通过人工收集或算法合成构造了部分更为复杂和具有...……更多

2024-07-25 09:31:00模态,清华,可信度,领衔,可信,几何

Google推出全新人工智能模型Gemini 2.0 用途更

...gle 发布了 Gemini 2.0 Flash，该公司称其除文本外，还能原生生成图像和音频。 2.0 Flash 还可以调用第三方应用程序和服务，使其能够接入 Google 搜索、执行代码等。2.0 Flash 的实验版本将从今天开始通过 Gemini API 和 Google 的人工智能.……更多

2024-12-12 09:54:00人工智能,人工,模型,用途,全新,智能