视频,杜甫,生成,模型,模型,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...(适配大模型语义解析)。(3)跨模态适配:针对文本、图像、视频等生成引擎制定差异化策略(如优化Midjourney提示词以关联品牌视觉风格)。三、应用场景与典型案例1.AIRO的典型场景消费决策引导:用户通过智能助手询问“最佳XXX产品...……更多

2025-03-16 20:57:00一文,生成,引擎,结果,品牌,生成

“图片生成领域的DeepSeek”！智象未来图像生成大模型全

...模型，具备强大的视觉内容生成与理解能力。其模型生成视频内容关联性强、画面自然流畅、拥有 4K 高清画质，且采用影视级的镜头语言，在 AIGC 技术与数字化创意等方面具备领先优势。目前，智象未来已形成“1+3+N”的商业化...……更多

2025-04-17 10:54:00生成,模型,图像,领域,权威,全球

实体“贾维斯” vivo发布PhoneGPT：可自动打电话定

...觉的感知和理解能力，能够对手机屏幕更深度的理解，在视频流的实时对话上也更加流畅自然。蓝心语音大模型、图像大模型和多模态大模型，综合能力都获得行业机构的高度认可，在多家专业榜单上位列第一。【本文结束】如...……更多

2024-10-10 11:42:00贾维斯,贾维,实体,餐厅,模型,模态

亚马逊连甩6款大模型！推出3nm AI训练芯片，最强AI服务

...ro、Premier四个版本的语言模型，还有图像生成模型Canvas、视频生成模型Reel。其中Reel现支持生成6秒视频，很快将会延长到2分钟。亚马逊总裁兼CEO安迪·贾西现场剧透：明年，AWS不仅将发布语音转语音模型，还有更高能的任意转任...……更多

2024-12-05 09:47:00亚马,亚马逊,芯片,模型,训练,服务器

综述｜5月全球人工智能领域新看点

...型，并发布了多个多模态模型，如图像生成模型Imagen 4和视频生成模型Veo 3，具备从文本等多种输入形式生成高质量视觉内容的能力。音乐生成模型Lyria 2为音乐人提供了多模态创作工具。AI电影制作工具Flow集成了先进的多模态技...……更多

2025-06-02 13:09:00人工智能,看点,人工,领域,智能,全球

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...人工智能可以像人类一样感知和理解音频、文本、图像、视频等多种模态信息，并与人类进行更加自然高效的交互，展现出了强大的功能和广泛的商业应用前景。多模态能力是实现通用人工智能的重要路径之一，也是趣丸科技...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

AI拜年火了，通义千问上线一张照片生成拜年视频

...全民舞王应用也迎来上新，用户可通过一张照片生成拜年视频，用更轻松、接近真人出镜的方式向亲朋好友传递新年的美好祝福。足不出户即可免费“拍”全家福春节是中国人约定俗成的团圆时刻。AI大模型技术正在让人们突破...……更多

2024-02-05 13:37:00通义,生成,照片,视频,生成,通义

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...也不容易，因为我们需要的是多模态数据，但LLM无法直接生成图像，DALL-E、Stable Diffusion等图像生成模型又无法同步生成文本。一个直觉的解决方案是将二者结合在一起，直接生成但文生图模型实际上很难对图像细节做到细微精...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

CVPR最佳论文被生成式AI占领，清华武大华南农大上科校友获

...的场景运动建模方法，可用于通过静态图像生成无缝循环视频，还能实现与图像中对象的交互。这项研究来自谷歌，一作谷歌DeepMind研究员Zhengqi Li（李正奇）。最佳学生论文奖也一同公布。一篇BioCLIP: A Vision Foundation Model for the Tr...……更多

2024-06-21 09:21:00华南,清华,农大,获奖,校友,生成

首个可保留情感的音频LLM！Meta重磅开源7B-Spiri

...源了一个7B尺寸的Spirit LM的多模态语言模型，能够理解和生成语音及文本，可以非常自然地在两种模式间转换，不仅能处理基本的语音转文本和文本转语音任务，还能捕捉和再现语音中的情感和风格。在纯文本大模型取得进展的...……更多

2024-11-23 09:43:00音频,模态,重磅,文本,任务,情感

AIGC工具测评：生成式AI的产品表现如何

...工具，它们按功能可以划分为：文本生成、图像创作、音视频处理等多个类别。在这篇文章中，我们将探讨这些工具的表现，通过实际体验和评估，为读者提供一个关于当前AI工具的全面视角。一、ChatGPT-4所属公司：OpenAI 发布时...……更多

2024-03-25 13:00:00生成,工具,产品,用户,界面,通义

又一生成式AI助手将“登机”！谷歌发布多模态Bard助理，交

...lassification）——深度学习表明，人类可训练AI，对图像、视频、音频、语言等输入数据分类。目前人类正处于第二波浪潮“生成式AI”中，即“输入数据并生成新数据”。而未来的第三波浪潮将属于“交互式AI”，“对话才是未...……更多

2023-10-07 16:38:00模态,交互式,助理,助手,一生,时代

阿里发“神笔马良版Sora”，轻轻一抹让猫咪转向，20个演示

AI视频生成赛道风起云涌，国内外新颖的文生、图生视频产品层出不穷。在各大厂商的“内卷”之下，当下的视频生成模型各方面已经接近“以假乱真”的效果。但与此同时，大部分视频生成模型的准确程度、遵循指令的能力还...……更多

2024-08-05 09:34:00马良,神笔,阿里,猫咪,演示,报告

杭州科技企业为何集体押注大模型开源？

...Qwen2.5-Omni-7B。这个模型能够同时处理文本、图像、音频和视频等多种输入，并实时生成文本和自然语音合成输出。用户可以像打电话或视频通话一样与通义千问Qwen聊天，甚至能识别音视频中人物的情绪。在复杂任务中，通义千...……更多

2025-04-03 06:49:00杭州,模型,集体,科技,企业,模型

中国企业调用大模型日均超10万亿Tokens，阿里通义份额第

...大模型，以及AI编程模型Qwen3-Coder、文生图模型Qwen-Image和视频生成模型通义万相Wan2.2等多模态模型，在全球引发接入中国模型热潮。海外知名大模型API聚合平台OpenRouter数据显示，阿里千问模型全球市场份额最高超12.3%，超越美国O...……更多

2025-09-01 13:55:00通义,阿里,中国,份额,模型,中国企业

以假乱真，天工音乐大模型带来颠覆式AI体验

...0秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭代和添加新的能力，让模型具备多模态的情感理解与表达能力。「天工SkyMusic」具有以下五大特点：1. ...……更多

2024-04-03 11:35:00天工,颠覆,模型,体验,音乐,天工

本周硅谷发生了什么？| 高通第三代骁龙8；谷歌20亿美元追投

...件的交互方式。未来，AI PC可以直接基于电脑上的照片和视频，直接剪辑生成内容。它也可以作为工作助手，写文档或者提炼总结要点。Meta公布2023年第三季度财报10月25日，Meta公布截至9月30日的2023财年第三财季业绩，第三财季...……更多

2023-10-30 15:31:00高通,三代,硅谷,模型,个人,模型

AI角色创作平台「捏Ta」完成超千万元融资

...以来，捏Ta的社交媒体曝光量已达到约2.5亿次，多次位列视频号动漫游戏日榜前十。捏Ta在社交媒体上的曝光。图源：看见概念捏Ta团队认为，AIGC技术的发展对图像生产带来的最大改变是，生产资料从原有的像素或图层，变成了...……更多

2024-04-08 17:50:00融资,角色,创作,平台,角色,创作

喜马拉雅音频大模型亮相，AI赋能内容创作者

...雅在云栖大会展示了“珠峰AI创作服务平台”：珠峰AI音视频创作平台，依托通义文本大模型对文本内容语义的深度理解，打造珠峰AI音频大模型，结合喜马拉雅独有的全品类音色库和数字人大模型，为创作者提供高品质的AIGC音...……更多

2024-09-21 09:50:00喜马拉雅,创作者,模型,创作,音频,内容

开年“王炸”！智能体再升级，科大讯飞打造办公新范式

...花“开年大戏”用笑点戳中职场痛点领导天天开会没空拍视频，扔张照片让你后期合成，美其名曰“造血式创新”；为公司写宣传文案，没有时间没有预算，领导还要让你戳中用户的心趴；和“金主”同姓的空降新人，满口大厂...……更多

2025-01-08 17:35:00开年,讯飞,范式,升级,智能,办公

努力开辟数字经济发展新赛道

...提升数据精细化标注水平，积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设，不断提升智能算力综合供给水平；稳步推进公共算力服务平...……更多

2024-03-20 05:57:00赛道,经济发展,数字,发展,经济,数据

我国自研视频大模型面向全球上线

输入文字描述或上传图片，就能生成一段逼真视频。近日，我国自主研发的通用视频大模型Vidu（www.vidu.studio）面向全球正式上线。据悉，这款视频大模型开放文生视频、图生视频两大核心功能，提供4秒和8秒两种时长选择，分...……更多

2024-08-02 03:11:00模型,我国,全球,视频,生成,视频

依图科技“天问”大模型赋能安防，智慧应急跨越式发展

...始研究以Transformer为基础的大模型，并成功将图像感知、视频感知与大模型结合，推动了AI安防技术的跨越式发展。安防行业，作为社会稳定和公共安全的重要保障，一直是科技创新的先行者。随着AI技术的不断进步，安防行...……更多

2024-05-22 15:00:00天问,安防,应急,模型,智慧,发展

下载次数破39万！CMU、Meta联合发布VQAScore文

...等模型能够根据自然语言提示词生成美观且逼真的图像和视频，广受用户喜爱。然而，这些模型在处理复杂的提示词时仍存在不足。例如，当让Stable Diffusion或Midjourney生成「棕色的狗绕着一棵树追黑色的狗」时，模型可能会错误...……更多

2024-11-07 09:53:00文生,次数,联合,方案,模型,文生

破晓之光：2025 ChinaJoy AIGC大会圆满召开

...模态技术正加速演进，其团队开发的Vidu Q1 进一步实现了视频模型的“高可控性”与“高一致性”。依托全球创新的“参考生视频”功能，Vidu 显著提升了视频内容的一致性，并已成功应用于泛互联网、广告营销及智能硬件等多...……更多

2025-08-03 07:45:00之光,大会,智能,技术,用户,模型

首个VR端3D角色扮演AI发布！南洋理工公开SOLAMI技术

...mi-ai.github.io/技术报告：https://arxiv.org/abs/2412.00174完整介绍视频：https://www.bilibili.com/video/BV1D6zpYHEyc/ 从技术报告中我们可以看到，SOLAMI支持多种角色，有超级英雄蝙蝠侠，小可爱机器人……更多

2024-12-10 09:53:00南洋,角色扮演,理工,模型,角色,驱动