一键,模态,高质量,生成,模型,图像头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

科学认识并正确运用人工智能技术赋能国际传播

...有重要的意义。国际传播领域的变革者Sora能够自动生成高质量的视频、图像内容，不论是在工具效能提升、传播效果争夺，还是在传媒生态构建等方面都重塑了智媒时代国际传播新样貌。一是让传播手段更加立体。热闹前行的...……更多

2024-03-22 04:17:00人工智能,人工,传播,智能,科学,国际

创新奇智大模型工业落地初显成效，探索工业智能机器人新方向

...达到 750 亿参数，性能获得了大幅升级。AInno-75B 增加了多模态处理能力，支持输入文本、图像、视频以及工业场景中的行为（Action）模态，如 CAD 等。通过引入高参数量大模型 AInno-75B，创新奇智的主推产品 ChatDoc、ChatBI 获得了...……更多

2024-09-03 10:00:00工业,机器人,成效,落地,模型,方向

科大讯飞大模型新升级：20秒制作PPT，拟人语音能力超越Ch

...k-13B）模型。该模型为130亿参数，经过3万亿以上tokens海量高质量数据集上进行预训练，具备聊天、问答、文本提取、数据分析和代码生成等功能。星火开源大模型同时，科大讯飞也基于星火V3.5的大模型能力，全线升级了翻译机...……更多

2024-01-31 07:32:00讯飞,拟人,语音,模型,能力,升级

深数所发布500个行业多模态算料集

...寻数有路”。此次深数所发布的首批500个人工智能大模型高质量训练数据集，由37家不同的数据商提供，涵盖12个“数据要素×”领域，3家境外数据商，7类数据模态（文本、图像、音频、视频、多模态、3D、GIS等）。且本批数据...……更多

2024-04-13 01:58:00模态,行业,数据,模型,模态,人工智能

幻觉不一定有害，新框架用AI的「幻觉」优化图像分割技术

...易。以往的研究，如 GenSAM [1]，提出利用 LLaVA/BLIP2 这类多模态大模型（MLLMs）来推理出特定样本的分割提示，以指导分割过程。然而，这种方法在处理像伪装样本分割这样的场景时，往往因为目标共现偏差（object co-occasion bias）...……更多

2024-11-05 09:49:00幻觉,有害,框架,图像,技术,任务

人工智能迭代速度超乎想象，对教育有何影响？

...们认为很难解决的问题，但与大模型结合后，就可以得到高质量完成。”梁正表示当前的生成式人工智能已经具有理解能力，可以根据提示词和情境生成内容，发展迭代速度超乎想象。“如果说，2023年是AI年，那么2024年可能就...……更多

2024-01-17 04:26:00何影,迭代,人工智能,人工,速度,智能

空间智能新进展：教机器人组装家具，实现操作步骤与真实视频对齐

...难；室内外场景、不同光照条件下的多样性。为了获得高质量的标注，应对真实视频带来的挑战，研究团队建立了一套可靠的标注系统：识别并标注相机参数变化的关键帧，确保片段内的一致性；结合2D-3D对应点和RANSAC算法进...……更多

2024-11-27 09:57:00新进,机器人,步骤,机器,家具,智能

聚焦2024数博会｜AI助力多彩贵州新未来，讯飞星火V4.0

8月28日，以“数智共生：开创数字经济高质量发展新未来”为年度主题的2024中国国际大数据产业博览会（以下简称“2024数博会”）在贵阳开幕。在专业展馆中，科大讯飞以“懂你的AI助手”为参展主题，携讯飞星火大模型V4.0及...……更多

2024-08-29 20:40:00讯飞,星火,贵州,讯飞,贵州,星火

华为云盘古大模型5.0发布：可控时空生成技术重塑自动驾驶开发

...，其创新的多模态生成能力，可以为自动驾驶领域提供更高质量的数据支持。华为常务董事、华为云CEO张平安表示，盘古5.0通过创新的可控时空生成，大规模的生成和实际场景相一致的驾驶视频数据，有机会重塑自动驾驶的开发...……更多

2024-06-21 18:05:00盘古,华为,生成,模型,驾驶,时空

AI画家的「滑铁卢」：为什么冰可乐不愿意住进茶杯里？

...了为 “茶杯” 分配的采样步数。于是，我们使用一个多模态模型来衡量图像与茶杯以及冰可乐的契合度评分。当图像和两个概念的评分之间相差很大时，说明有一个概念很可能被模型忽略了，于是就需要相应地调整 N 的取值。...……更多

2024-08-07 09:32:00滑铁卢,茶杯,画家,可乐,茶杯,可乐

创新典范：联通元景大模型再获三项殊荣

...发挥联通元景大模型多模态、语义理解和推理能力,构建高质量文本语义表征,以不同历史朝代文物为原型与基本素材,着力挖掘文物元素及艺术特质,实现文创设计辅助。同时还能够准确理解提示词中关于人物形象、古代服饰、文...……更多

2024-07-17 11:28:00殊荣,典范,模型,模型,智能,人工智能

协同办公进入AI时代金山办公张宁：不追求最强AI大模型，合

...WPS AI可为用户提供包括语义检查、内容改写、文档润色和一键生成PPT等功能。据张宁介绍，在应用生成式AI技术之前，WPS只能针对单个单词进行拼写检查，无法根据上下文语境进行语句修改与润色。WPS通过Amazon Bedrock接入Anthropic C...……更多

2024-06-25 09:44:00张宁,办公,金山,模型,时代,模型

ECCV 2024 | 南洋理工三维数字人生成新范式：结构扩

...Feedforward 3D Generative Model），相比于已有 3D GAN 方法可生成高质量、多样化且视角一致的三维数字人，并支持不同层级的可控生成与编辑功能，如局部服装编辑、三维虚拟试衣等部位感知的编辑任务，且不依赖于特定的服装类型或...……更多

2024-08-13 09:36:00南洋,三维,范式,理工,生成,模型

全国产算力平台“飞星一号”的首个成果发布：讯飞星火V3.5来

...问答等任务“信手拈来”。基于此，科大讯飞推出了可以一键快速自动生成文档和PPT的办公产品——讯飞智文，这款产品主要功能有文档一键生成、AI撰写助手、多语种文档生成、AI自动配图、多种模板选择、提供演讲备注功能...……更多

2024-01-30 22:41:00讯飞,星火,成果发布,成果,全国,平台

大模型落地竞赛打响：腾讯加速AI产业化，5分钟可开发一款AI

...器”，帮助用户以极低的门槛创建专属AI智能体，并支持一键分发至QQ、微信客服、腾讯云等渠道。这被普遍视为腾讯版的“GPTs”。今年1月，OpenAI发布GPTs时，市场曾一度将其视为人工智能领域的“iPhone时刻”，有望帮助大模型...……更多

2024-05-21 21:30:00腾讯,落地,竞赛,模型,产业,应用

「一键脱衣」的 AI，连孩子都不放过

...事的男生，将女同学发在社交媒体的照片上传到了一款「一键脱衣」AI 工具。 ▲ 他们所用的 AI 工具.这款工具可以通过手机 app 或者即时通讯软件 Telegram 使用，口号是「免费脱掉任何人的衣服」，只要别人有照片落在你的手机...……更多

2023-12-13 11:21:00一键,孩子,一键,受害者,裸照,图像

与OpenAI o1技术理念相似，TDPO-R算法有效缓解奖

...习并模拟自然界中的扩散过程来合成新数据，尤其在生成高质量逼真图像方面相较于其他模型架构具有显著优势。因此，尽管近年来也有基于 GPT 等其它架构的优秀图像、视频生成模型不断涌现，基于扩散模型的架构依然是当前...……更多

2024-10-26 09:48:00算法,奖励,理念,问题,技术,模型

以假乱真，天工音乐大模型带来颠覆式AI体验

...Diffusion Transformer 负责演唱，通过LDM让Music Patches被还原成高质量音频，使得「天工SkyMusic」能够支持生成80秒44100Hz 采样率双声道立体声歌曲。这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团队也将在后续逐步迭...……更多

2024-04-03 11:35:00天工,颠覆,模型,体验,音乐,天工

Sora这就落伍了？Meta“最强视频模型”不用DiT，用L

...频生成： Movie Gen 不仅可以根据视频内容和文本指令生成高质量的各类音效和音乐，而且还可以做到与视频内容更高度的匹配与同步。这些音频最长可达 45 秒，而且Meta还表示，它们的音频模型可以生成任意长度视频的连贯音频...……更多

2024-10-08 09:51:00模型,不用,奇迹,视频,视频,模型

Sora震撼来袭，AI动画以假乱真了吗？专家：仍存硬伤

...。Sora如果实现大规模推广，将大大降低普通人利用AI合成高质量视频的难度。据中国科学院信息工程研究所正高级工程师韩冀中介绍，Sora应用的技术与此前的深度伪造技术相互承接，又有所不同。深度伪造技术引起公众注意是...……更多

2024-02-20 11:48:00动画,专家,视频,生成,模型,南都

本周（4.8-4.14）AI界发生了什么？

...源：论文论文链接：AI界前线马斯克旗下xAI发布其首款多模态大模型4月13日消息，马斯克AI初创公司xAI推出了其首款多模态大模型Grok-1.5V。除文本功能外，Grok现在可以处理各种各样的视觉信息，包括文档、图表、图表、屏幕截图...……更多

2024-04-14 20:33:00模型,特斯,马斯,芯片,融资,英特

今年 WISE大会的“AIGC”含量有多高？超有料揭秘提前看

...基于行业需求的生产力布局，为音乐产业的数字化升级和高质量发展注入新的活力。WISE2023专题页接入生成式AI产品“文心一言”2023年10月，百度文心大模型4.0版本正式发布，相较文心一言线上版本在理解、生成、逻辑和记忆四...……更多

2023-11-17 14:49:00含量,大会,模型,文心,应用,商业

单图解锁全景视角！北大/港中文/腾讯等推出ViewCraft

...测的轨迹渲染点云，并利用ViewCrafter根据渲染的点云生成高质量的新视角。随后利用生成的新视角更新点云，以扩展全局点云表征。通过迭代执行这些步骤，最终可以获得覆盖大视场范围和扩展点云的高保真新视图，并支持高斯...……更多

2024-09-19 13:37:00全景,腾讯,中文,视角,北大,视角

特斯联完成20亿元D轮融资，国际国有资本双领投

...，加快推动人工智能发展、培育新质生产力，不仅是科技高质量发展的必然要求，同时也是特斯联矢志不渝的内在研发动力。过往八年，通过将人工智能技术与实际场景结合并持续落地，特斯联积累了宝贵的实践经验，并交付了...……更多

2024-04-09 11:26:00特斯,融资,国有,资本,国际,特斯

AI为数字办公按下“加速键”

...新制定国家标准和行业标准50项以上，推动人工智能产业高质量发展的标准体系加快形成。近年来，随着人工智能大模型技术的涌现，中国各行各业纷纷入场，数字办公行业是其中之一。人工智能产业迎来新一轮发展热潮的背景...……更多

2024-02-07 03:22:00数字,办公,人工智能,智能,人工,办公

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...像与语音识别能力。本月初，微软更是公布了 166 页的多模态版 GPT-4V 的相关文档，详细探讨了 GPT-4V 的功能和使用情况，这一举动引起了业界的广泛关注。然而，在视觉语言模型的角逐中，谷歌也不甘示弱。近日，Google Research...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

全球AI大事记·疯狂三月盘点：9万亿AIGC时代即将到来｜钛

...数十名员工已加入苹果的AI部门。苹果推出300亿参数MM1多模态大模型在一篇由多位作者署名的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》中，苹果正式公布自家的多模态大模型研究成果。这是一个具……更多

2024-04-03 15:00:00大事记,盘点,大事,疯狂,媒体,时代

4090笔记本0.37秒直出大片！英伟达联手MIT清华祭出S

...笔！正如其名字一样，Sana能以惊人速度合成高分辨率、高质量，且具有强文本-图像对其能力的模型。而且，它还能高效生成高达4096×4096像素的图像。项目主页：https://nvlabs.github.io/Sana/论文地址：https://arxiv.org/abs/2410.10629……更多

2024-10-18 09:49:00英伟,清华,架构,大片,性能,笔记本