模态,宝宝,模型,图像,训练,文本头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

arxiv研究人员：多模态ai模型存在安全隐患

...论文指出，包括GPT-4V、GPT-4o和Gemini1.5在内的大部分主流多模态AI模型，处理用户的多模态输入（例如一起输入图片和文本内容）之后，输出结果并不安全。这项研究标题为《跨模态安全调整》（Cross-ModalitySafetyAlignment），提出了...……更多

2024-06-26 03:07:00模态,研究人员,隐患,模型,人员,安全

只有谷歌受伤的世界达成了，但“全能模型”到底该不该跟？

...对二，谷歌就跟四个王。那么，这一次较量的核心——多模态大模型，国内AI行业是否要跟进呢？如果要跟进，又该提前考量到哪些问题呢？每一次新产品问世，如果只跟着新闻“震惊”是很难进步的。不妨和我们一起，认真给G...……更多

2024-05-19 16:32:00全能,模型,只有,世界,模态,模型

AI出图更快、更懂你心意，高美感文生图模型修炼了哪些技术秘籍

...千亿量级的高质量图像。此外，团队还专门训练了一个多模态大语言模型进行 recapiton 任务。这个模型将更加全面、客观地描述图片中图像的物理关系。有了高质量高细节的图文对数据之后，想要更好地发挥出模型的实力，还需...……更多

2024-08-13 09:39:00文生,出图,美感,秘籍,心意,更快

BEV“超融合”感知部署轻舟智航迈出量产从0到1的关键一步

...先的数据闭环能力，并创新构建了离线点云大模型，为跨模态的数据标注、数据挖掘和模型训练提供强大支持，大幅提高数据价值和利用效率，提升长尾场景处理能力。在数据标注方面，轻舟智航可实现2D图像和3D图像的自动化...……更多

2023-11-01 20:27:00轻舟,关键,轻舟,模型,场景,数据

首个支持普通话和方言混说的TTS大模型：河南话、上海话说得溜

...合成。2.精细化 Token 对齐技术：我们提出了基于大规模多模态预训练的精细化 token-wise 对齐技术。3.层次混合专家结构：我们设计了一种层次混合专家体系结构，用于学习多个汉语方言的统一表示和每种方言的特定表示。4.层次...……更多

2024-08-14 09:38:00河南,上海,方言,普通话,模型,话说

谷歌大模型Gemini视频被质疑造假、夸大宣传，官方回应：演

...现Gemini能实时地感知人类的动作、直接做出语音回应等多模态技术能力。然而，有多个消息称，这段制作的演示视频夸大了Gemini技术能力，被质疑造假、夸大宣传等，实际上手时发现Gemini并不能达到视频中的效果。同时，这类营...……更多

2023-12-08 22:02:00剪辑,演示,模型,宣传,焦点,媒体

Sora“超级涌现力”将把AI引向何方

...tokens（机器模型输入的基本单位），而谷歌最近发布的多模态通用模型Gemini 1.5 Pro就把稳定处理上下文的上限扩大至100万个tokens。Sora之所以能对物理世界规律进行模拟，一个可能的原因在于大数据驱动下，人工智能模型体现出一...……更多

2024-02-24 05:43:00何方,模型,单词,视频,人工智能,人工

AI也会「刷抖音」！清华领衔发布短视频全模态理解新模型 |

...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异，更在视听联合任务中展现了卓越的性能，证明了其全面性和准确性。想要看懂短视频，除了视觉内容外，语音和音频等听觉信息，如视频音乐、音效...……更多

2024-08-01 09:45:00模态,清华,领衔,模型,视频,音视

我市发布首批行业高质量数据集

...12个重点领域，类型包含文本、图片、音频、视频等多种模态。其中，中国手语多模态数据集、“海河·谛听”言语多模态数据集、基于隐私计算技术政务流通数据集、恒达文博文旅·科普基础数据集等69个数据集为国内首次公开...……更多

2024-06-21 05:16:00高质量,数据,行业,数据,模型,海河

中国也有Sora同款训练架构公司，清华班底，智谱也投了 |

...也出现了大模型独角兽智谱AI的身影。36氪获悉，近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投，达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍，融资主要用于多模...……更多

2024-03-14 15:12:00清华,班底,中国,架构,训练,公司

语音能力再突破！讯飞星火语音大模型即将发布

...代码纠错、代码解释、单元测试生成5个维度升级，其多模态能力的升级具体体现在图像描述、图像问答、识图创作等多个维度。去年10月24日，在第六届世界声博会暨2023科大讯飞全球1024开发者节的主论坛上，星火认知大模型V3.0...……更多

2024-01-29 15:57:00音大,讯飞,星火,语音,模型,突破

拓宽行业应用场景多模态大模型加速通用AI进程

...业内分析认为，该项新产品或将促使大模型厂商加大对多模态大模型的研发投入，并进一步推动AGI（通用人工智能）进程。一直以来，视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后，Sora的发布迎合了...……更多

2024-02-26 08:58:00模态,行业应用,模型,进程,场景,应用

只用 13 天，OpenAI 做出了能听、能说、能自主决策的

...的文本转录到由 OpenAI 训练的，可以理解图像和文本的多模态模型（VLM）中，由该模型处理对话的整个历史记录，得出语言响应，然后通过文本到语音的方式将其回复给人类。同样的模型，也负责决定在机器人上运行哪些学习...……更多

2024-03-14 19:00:00模型,决策,机器,机器人,机器,模型

阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源

...，使得其可以更灵活高效地进行图像处理。二是使用了多模态旋转位置嵌入（M-ROPE）方法。传统的旋转位置嵌入只能捕捉一维序列的位置信息，M-ROPE 使得大规模语言模型能够同时捕捉和整合一维文本序列、二维视觉图像以及三...……更多

2024-09-03 09:45:00二代,通义,阿里,模型,视觉,语言

国内首款安全应急智能模型上线运营

...自我学习与知识更新、文本高效生成、图像理解分析、多模态融合与应用拓展能力，专业知识问答更准确、预案制定修订更实用、图像识别解答更专业、法律法规解析更全面。据研发团队介绍，“大羽安全应急模型”的独创性是...……更多

2024-04-30 18:26:00应急,模型,运营,智能,安全,应急

阿里CEO吴泳铭：生成式AI让世界有了一个统一的语言——To

...为了AI发展的最大障碍。当前的数字化世界，信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立，彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多

2024-09-20 09:51:00阿里,生成,统一,语言,世界,模态

智谱AI杀入视频生成：「清影」上线，时长6秒，免费不限量

...。全自研技术All in 大模型的智谱 AI，很早就开始部署多模态生成式 AI 模型。从 2021 年开始，智谱 AI 先后发布了 CogView（NeurIPS’21）、 CogView2（NeurIPS’22）、CogVideo（ICLR’23）、Relay Diffusion（ICLR’……更多

2024-07-27 09:27:00清影,时长,生成,视频,清影,视频

生成式AI大爆发后，2024年人工智能行业有哪些新趋势

...（人工智能）发展史的一个转折点，活跃的开源环境和多模态模型一同推动了AI研究的进步。随着生成式AI持续从实验室走入现实，人们对这项技术的态度正在变得越来越成熟。对于2024年的AI发展趋势，行业专家们也给出了一些...……更多

2024-02-12 12:33:00人工智能,人工,生成,趋势,智能,行业

四川省首批8个人工智能高质量数据集发布

...量等方面符合相关要求，以文本、图像、音频、视频等多模态呈现，可直接用于开发和训练人工智能模型的数据集，包含行业通识和行业专识数据集。四川省首批人工智能高质量数据集充分利用全省海量数据资源、严格按照国家...……更多

2024-09-25 10:44:00四川省,人工智能,四川,高质量,人工,智能

2023 的人工智能之年

...的情感和情绪。Google 在 Bard 聊天机器人中融入了基于多模态数据集训练的 Gemini，它被誉为目前“最强大”的 AI 模型，是 OpenAI 的 ChatGPT 最强的竞争对手之一。Grok：Elon Musk 的创业公司 xAI 展示了其对 AI 开发的承诺，并可能与 Open.……更多

2023-12-29 05:02:00之年,人工智能,人工,智能,生成,人工智能

首届空天信息技术大会开幕，发布全球首个百亿级遥感解译基础模型

...式的变革提供了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型，也是首个专为遥感领域打造的专业基础模型。自2022年首次推出后，空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于...……更多

2024-09-23 11:53:00空天,遥感,首届,模型,大会,基础

推动终端侧AI发展 MWC2024高通带来多项全球首发

...示了全球首个在搭载第三代骁龙8的Android手机上运行的多模态大模型（LMM）。多模态指AI模型不仅能够接受文本输入，还可以接受图像、音频等其它输入数据类型。在这一演示中展示了一个超过70亿参数的LMM，其支持文本、语音和...……更多

2024-02-29 10:14:00高通,终端,发展,全球,高通,模型

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》，借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果，以及赋能智能音频和数字安全方面的一些思考。首先，请允许我简...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

文档处理效能飙升！浩鲸科技“文档大模型”核心技术揭秘！

...的整体性方案，不仅包含了文档大模型能力，还提供了多模态文档工具链 DocChain 和开箱即用的软硬件一体机，基于垂直模型能力和软硬件相互配合，可帮助企业实现文档的知识抽取、知识融合，直至知识推理和问答的全流程覆...……更多

2024-09-26 13:36:00文档,效能,模型,核心,处理,技术

最强国产多模态刚刚易主！腾讯混元把GPT-4/Claude-

国产大模型，多模态能力都开始超越GPT-4-Turbo了？？权威榜单，中文多模态大模型测评基准SuperCLUE-V，新鲜出炉：特别是腾讯的hunyuan-vision、上海AI Lab的InternVL2-40B，分别成为国内闭源和开源界两大领跑者，甚至超过Claude-3.5-Sonnet..……更多

2024-08-09 09:38:00模态,腾讯,国产,模态,腾讯,元宝

努力开辟数字经济发展新赛道

...精细化标注水平，积极开发涵盖文本、图像、音视频等多模态的高质量数据集。要加快自主算力资源和供给能力建设。大力推动算力基础设施和算力网络建设，不断提升智能算力综合供给水平；稳步推进公共算力服务平台建设，...……更多

2024-03-20 05:57:00赛道,经济发展,数字,发展,经济,数据