一键,模态,高质量,生成,模型,图像头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

文本、图像、点云任意模态输入，AI能够一键生成高质量CAD模

...力于赋能多模态大语言模型，使其能够基于条件输入生成高质量的 CAD 模型。与此同时，针对 CAD 模型的拓扑质量、空间封闭性等核心属性，团队还设计了一系列创新的评估指标，为模型性能提供更全面的衡量标准。借助这一技...……更多

2024-11-26 09:46:00一键,模态,高质量,生成,模型,图像

更快、更强、更可控：智谱“起舞弄清影”，视频生成卷出新高度！

...为视频数据生成高度吻合的文本描述，进而构建了海量的高质量视频文本对，使得训练出的模型指令遵循度高。比如，输入指令“猴子打工”，可以看到智谱对“猴子”主体和“打工”行为理解都十分到位，生成了让打工人心酸...……更多

2024-07-27 10:00:00更快,生成,高度,视频,清影,视频

“图片生成领域的DeepSeek”！智象未来图像生成大模型全

...智能终端及行业应用的全产业生态体系。为了促进产业更高质量发展，高新区今年出台人工智能专项支持政策，创新采取“算力券”“语料券”和“模型券”等方式，打造金融保障体系，强化场景创设应用，加快通用人工智能产...……更多

2025-04-17 10:54:00生成,模型,图像,领域,权威,全球

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

...上之前所用的视觉创意、数据和代码作为prompt，生成多个高质量的除了为每个问题生成答案，作者还提示LLM生成能解释答案的「原理」（rationale），以便用于训练模型，起到类似于CoT的作用。整个构建过程的流水线如下图所示：...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

科学家开发多模态音乐理解和生成大模型，兼具理解和创作音乐能力

...键。“如果未来我们能够与更多专业机构合作，得到更多高质量的音乐训练数据，并解决版权和标注数据质量的问题，就能完成对该模型性能和表现的更进一步迭代。”Sun Chenshuo 表示。在后续研究中，他们将继续迭代优化模型...……更多

2024-04-09 10:25:00模态,音乐,科学家,生成,模型,创作

不要小看「实而不华」的腾讯 AI

...创作引擎：基于腾讯混元的自研图像创作底层模型，输出高质量的 AI 图像生成和编辑能力，为企业客户提供 AI 写真、线稿生图、图像风格化等能力。视频创作引擎：基于多模态算法技术，输出高质量的视频生成与处理能力，提...……更多

2024-05-21 21:25:00腾讯,腾讯,模型,能力,广告,视频

趣丸科技推出天谱乐大模型，可一键让视频开口唱歌

...声兼备。同时输出带有字幕和封面标签的成品视频，方便一键分享到社媒或好友。对于普通用户，即使不会乐器不懂乐理也可以为Vlog、家庭录像增添背景音乐或创作专属歌曲来表达自己的态度与情感。对于专业人士，唱鸭网页...……更多

2024-07-31 19:45:00一键,模型,科技,视频,音乐,生成

超越扩散模型！自回归新范式仅需2.9秒就生成高质量图像

...小满等机构提出通用文生图模型STAR。仅需2.9秒就可生成高质量图像，超越当前一众包括SDXL在内扩散模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。来看看具体是如何做到的？自回归通用文生图模型S...……更多

2024-06-27 09:17:00范式,仅需,高质量,生成,模型,图像

贵州大数据企业为130万家用户提供AI营销方案

...创作者，一枝梅团队推出了基于AI算法将文字描述转化为高质量图片、视频的微信小程序“魔法画师”。该小程序包含魔法文创馆、植物跳舞、秒爆、一键大片、创意文字、AI数字人等多种功能。“此外，团队还对抖音、小红书...……更多

2025-07-24 21:38:00万家,贵州,方案,营销,数据,用户

最强开源文生图模型一夜易主！SD原班人马打造，要发SOTA视

...Stable Diffusion的创始团队成立，该团队此前的工作还包括高质量图像生成模型VQGAN、视频生成模型Stable Video Diffusion等。Stable Diffusion最初的5位作者中，4位曾加入Stability AI并持续开发SD后续版本的成员，包括Robin Ro……更多

2024-08-05 09:39:00文生,人马,模型,生成,视频,模型

Meta首款多模态Llama 3.2开源！1B羊驼宝宝，跑在

...声图像-文本对数据上进行预训练。然后，在中等规模的高质量领域内和知识增强的图像-文本对数据上，再次进行训练。接着，在后训练阶段采用与文本模型类似的方法，通过监督微调、拒绝采样和直接偏好优化进行多轮对齐...……更多

2024-09-27 13:39:00模态,宝宝,模型,图像,训练,文本

vivo自研大模型全家桶炸场，亮出PhoneGPT智能体，蓝

...小V帮记”、内置“小V写作”能力的“vivo输入法”、支持一键剪辑以及AI定制词曲的“小V时光剪影”、能够记住和用户相处点滴的“小V记忆”功能。流畅方面，原系统5进行了超过1000项流畅体验优化。在系统底层层面，原系统5...……更多

2024-10-11 09:55:00一键,衣食,全家,模型,智能,模型

活力中国调研行｜好用好玩！AI点亮百姓生活

...间，借助智象未来的AI创作者平台，几分钟就能制作一个高质量视频。”一位自媒体创作者在现场感叹。好用又有趣！AI从“技术秀场”走入民生场景，点燃了百姓对美好生活的更多想象，也为企业发展开辟了新赛道。如今，越...……更多

2025-07-04 13:33:00好用,百姓生活,中国,调研,活力,百姓

撞墙还是新起点？自回归模型在图像领域展现出Scaling潜力

...质量提升幅度不及前两款旗舰模型之间的质量提升，因为高质量文本和其他数据的供应量正在减少，原本的 Scaling Law（用更多的数据训练更大的模型）可能无以为继。文章发布后，很多人反驳了这一观点，认为 Scaling Law 还没到...……更多

2024-11-27 13:32:00潜力,模型,图像,起点,领域,还是

云知声推出山海多模态大模型：实时生成文本、音频和图像

IT之家 8 月 26 日消息，云知声于 23 日宣布推出山海多模态大模型。通过整合跨模态信息，山海多模态大模型能够接收文本、音频、图像等多种形式作为输入，并实时生成文本、音频和图像的任意组合输出。▲云知声山海助手微...……更多

2024-08-27 09:38:00模态,山海,实时,生成,模型,图像

高通aihub正式发布：支持75个ai模型

...。例如在演示中，模型能够根据不同个人或艺术偏好创建高质量自定义图像。高通表示这一技术不仅能够运用于图像生成，也可以应用于大语言模型等多种生成式AI模型，是实现个性化生成式AI的高效方式。 ……更多

2024-02-27 02:14:00高通,模型,支持,高通,模型,开发者

最强多模态模型GTP-4o问世，OpenAI继续开启人工智能

...在计算机视觉领域，OpenAI推出了DALL-E系列模型，能够生成高质量的图像和艺术作品；在强化学习领域，OpenAI也推出了MuZero等模型，能够在游戏中实现超越人类的表现。未来，OpenAI将继续致力于推动AI技术的发展和应用。公司将不...……更多

2024-05-14 14:04:00模态,之路,人工智能,人工,模型,智能

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 |

...出了一种新颖的多步误差最小化（MEM）方法，用于生成多模态不可学习样本，以保护个人数据不被多模态对比学习模型滥用。通过优化图像噪声和文本触发器，MEM方法有效地误导模型，降低其对隐私数据的学习能力，并在不同模...……更多

2024-08-02 09:55:00误差,中科院,隐私,方法,数据,学习

全模态对齐框架align-anything来啦：实现跨模态指

...质量参差不齐的现有偏好数据集不同，Align-Anything 提供了高质量的数据，包括了混合输入和输出中的任何模态，旨在提供详细的人类偏好注释以及用于批评和改进的精细语言反馈，从而实现跨模态的全面评估和改进。总的来说，...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

昆仑万维SkyReels团队正式发布并开源SkyReels-

...异，能够生成流畅且逼真的视频内容，满足电影制作中对高质量运动动态的需求。3.高效的扩散强迫框架为了实现长视频生成能力，团队提出了一种扩散强迫(diffusion forcing)后训练方法。与从零开始训练扩散强迫模型不同，团队通...……更多

2025-04-21 13:53:00万维,昆仑,团队,生成,视频,模型

夸克AI超级框上新“拍照问夸克” 加码多模态能力

...如，拍照搜索文物时自动关联历史背景，上传商品图片时一键跳转淘宝同款链接。无论是人物、动物、植物、建筑、风景、美食、艺术品、商品、外文资料还是故障代码，夸克都能做到秒级识别，经过多轮问答和深度思考后，给...……更多

2025-04-27 13:22:00夸克,模态,能力,夸克,用户,模态

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...轻量级的轨迹信息模型，能以较低的延迟和模型大小产生高质量的结果。他们的想法基于重新审视普通、非层次化的视觉 Transformer（ViT），将其作为用于视频对象分割的图像编码器，并引入高效内存模块，从而降低帧特征提取和...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

Sora再度颠覆AI视频行业，A股哪些公司有相关布局？

...实现AGI（通用人工智能）的重要里程碑。券商建议关注多模态技术Sora视频一出，立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示，这意味着AGI实现将从10年缩短到1年。其实，Sora出现之前，也有其他类似的AI...……更多

2024-02-19 08:10:00颠覆,布局,行业,视频,公司,模型

阿里国际发布最新开源多模态模型Ovis，多模态能力再升级

...手写英文准确翻译成中文、还能精准分析财报数据……多模态能力再次升级！今天，阿里国际AI团队发布了一款多模态大模型Ovis，在图像理解任务上不断突破极限，多种具体的子类任务中均达到了SOTA（最新技术）水平。多模态...……更多

2024-09-20 13:35:00模态,阿里,模型,能力,升级,国际

Meta推出AI新模型VFusion3D，微美全息布局AIG

...3D生成式AI模型VFusion3D，能够从单张图像或文本描述生成高质量的3D对象，可能会改变虚拟现实、游戏和数字设计等领域。AI新模型VFusion3D来袭据悉，VFusion3D界面简单直观，允许用户自己上传或从一系列预加载的示例中选择图像，...……更多

2024-08-21 13:55:00全息,布局,模型,升级,产业,内容

阶跃星辰宣布开源图生视频模型，多模态领域的DeepSeek时

...者开源。包括参数量300亿，可直接生成204帧、540P分辨率高质量视频的视频生成模型Step-Video-T2V，以及能根据不同场景生成情绪、方言、语种、歌声和个性化风格，和用户自然地高质量对话的语音交互大模型Step-Audio。阶跃星辰创...……更多

2025-02-22 16:36:00时来,模态,星辰,模型,时刻,领域

浪潮科技扭住科技创新“牛鼻子” 开年上线四款新产品

...新，增强核心竞争力，积极服务数字中国建设，不断开创高质量发展新局面。 ……更多

2024-02-27 17:41:00开年,新产,科技,科技创新,浪潮,新产品

杨幂+小兰会是什么样？中山大学新AI成果，实现人脸个性化SO

...0个身份数据集进行可视化。最终可以看到，ConsistentID在高质量生成、灵活的可编辑性和强大的身份保真度方面表现出更强大的能力。而在定量评估中，在大多数评估指标中，ConsistentID始终优于其他方法，并且在生成效率方面超...……更多

2024-05-22 15:47:00小兰,中山大学,人脸,中山,成果,个性

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投，达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍，融资主要用于多模...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

昆仑万维上半年收入25亿，AI应用加速落地，商业化成果显著

...的创新平台WorldEngine，让创作者“一键成剧”，轻松制作高质量AI视频。Melodio产品展示 Mureka商业化展示AI社交产品Linky功能展示商业化侧，天工大模型通过与众多企业如电信运营商、主流手机厂商、金融机构、头部短视频平台...……更多

2024-08-23 21:16:00万维,昆仑,落地,成果,收入,应用

page 1/1667 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

博物馆进入“沉浸时代”，感官残障观众如何“入场”

视障文化博物馆“触摸文明”展厅。中青报·中青网记者李怡蒙/摄如今，许多博物馆将视觉、听觉、触觉等多种感知方式融合，创造出多层次

2025-12-02 05:43:00

烟台联通举办客服人员心理健康专题讲座

胶东在线12月1日讯为加强对一线客服员工的人文关怀，帮助员工有效应对工作压力，提升情绪管理与自我调适能力，11月26日

2025-12-02 06:42:00

现代物流网络布局与供应链弹性提升的关联

摘要：本文分析现代物流网络布局与供应链弹性提升的内在关联，探讨节点布局合理性、线路连接多样性、资源整合协同性对供应链冗余能力

2025-12-02 07:09:00

管理会计在企业战略决策中的应用研究

摘要：本文聚焦管理会计在企业战略决策中的应用，首先解析其与战略决策的内在关联，即通过整合财务与非财务信息，为战略制定提供系统性支持

2025-12-02 07:10:00

警惕境外组织利用恶意SDK收集敏感信息国家安全机关提示

中国网12月2日讯据国家安全部官微消息，国家安全部提示，SDK（软件开发工具包）是一套为特定软件框架、硬件平台或操作系统提供的开发工具集合

2025-12-02 07:26:00

全球首创全动压空气轴承产业化成果发布，开启高端制造新纪元

北京讯—— 2025年11月28日，“全球首创全动压空气轴承产业化成果发布会”在北京首钢园香格里拉酒店圆满落幕。此次盛会标志着我国在超精密制造领域取得了重大突破

2025-12-02 07:32:00

联通超清电视狂欢双十一，临沂IPTV用户喜获iPhone17

鲁网12月1日讯一年一度的双十一购物狂欢盛宴圆满收官，在这场全民消费热潮中，山东联通精心策划的“双十一福利再升级”活动脱颖而出

2025-12-01 11:12:00

千里运荔藏巧思现代加盟终端拓新局

“就算失败，我也想知道，自己倒在距离终点多远的地方。”电视剧《长安的荔枝》中这句掷地有声的台词，精准道出了当下创业者选择加盟之路时的执着与忐忑

2025-12-01 12:23:00

赛事总奖金160万元！WCI国际冠军赛苏州完美收官

2025年坦克世界国际冠军赛（WCI）11月30日在苏州阳澄国际电竞馆落下帷幕。来自中国、欧洲、北美和亚太地区的八支顶尖战队经过激烈角逐

2025-12-01 13:58:00

2025年北京市中小学生电子与信息创意实践活动圆满举行

当AI小球听懂指令，当智能车驰骋赛场，当电路在指尖点亮创意……孩子们像科学家一样思考，像工程师一样实践。11月30日，2025年北京市中小学生电子与信息创意实践活动在北京市第十四中学(畿辅校区)火热开幕

2025-12-01 14:26:00

烟台联通创新应用高压直流供电技术破解高铁5G基站供电瓶颈

胶东在线12月1日讯在青烟威荣高铁5G覆盖扩容工程建设中，烟台联通成功应用高压直流供电技术创新方案，有效解决了牟平北山隧道西口

2025-12-02 05:00:00

海尔智慧家庭成立创新实验室布局好房子住居生态

海尔智慧家庭战略持续强化、开放和加速布局，又交出新成果。11 月 28日，以“AI 新纪元共筑智慧家”为主题的海尔智慧家庭生态创新研讨会在北京召开

2025-12-01 14:51:00

海尔智慧家庭新成果：2025物联网大会斩获两项大奖

海尔智慧家庭持续强化、开放并加速智慧居住领域战略布局，如今再添重磅新成果。11 月 29 日，在首届全球万物智联数字经济可持续发展大会暨2025（第十届）世界物联网大会上

2025-12-01 14:51:00

海尔印尼冷柜工厂奠基将增百万产能

11月27日，海尔印尼冷柜工厂奠基。这座规划年产能100万台的冷柜工厂，将成为海尔智家本土化战略布局及数字化转型落地的又一里程碑

2025-12-01 14:53:00

海尔城市体验中心天津店开业落地数字化转型战略

11月29日，海尔城市体验中心天津店开业。在这里，用户挑选的不再只是一台台冰箱、洗衣机这样的AI单品，而是可以直接把成套解决方案搬回家

2025-12-01 14:54:00

头条订阅服务