• 我的订阅
  • 科技

Meta开源多感官人工智能模型,整合文本、音频视觉等六类数据

类别:科技 发布时间:2023-05-10 10:23:00 来源:浅语科技

Meta公司发布了一个新的开源人工智能模型ImageBind,该模型能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。该模型目前只是一个研究项目,还没有直接的消费者或实际应用,但它展示了未来生成式人工智能系统的可能性,这些系统能够创造出沉浸式、多感官的体验。同时,该模型也表明了Meta公司在人工智能研究领域的开放态度,而其竞争对手如OpenAI和谷歌则变得越来越封闭。

Meta开源多感官人工智能模型,整合文本、音频视觉等六类数据

该研究的核心概念是将多种类型的数据整合到一个多维索引(或用人工智能术语来说,“嵌入空间”)中。这个概念可能有些抽象,但它正是近期生成式人工智能热潮的基础。例如,人工智能图像生成器,如DALL-E、StableDiffusion和Midjourney等,都依赖于在训练阶段将文本和图像联系在一起的系统。它们在寻找视觉数据中的模式的同时,将这些信息与图像的描述相连。这就是为什么这些系统能够根据用户的文本输入生成图片。同样的道理也适用于许多能够以同样方式生成视频或音频的人工智能工具。

Meta公司称,其模型ImageBind是第一个将六种类型的数据整合到一个嵌入空间中的模型。这六种类型的数据包括:视觉(包括图像和视频);热力(红外图像);文本;音频;深度信息;以及最有趣的一种——由惯性测量单元(IMU)产生的运动读数。(IMU存在于手机和智能手表中,用于执行各种任务,从手机从横屏切换到竖屏,到区分不同类型的运动。)

未来的人工智能系统将能够像当前针对文本输入的系统一样,交叉引用这些数据。例如,想象一下一个未来的虚拟现实设备,它不仅能够生成音频和视觉输入,还能够生成你所处的环境和物理站台的运动。你可以要求它模拟一次漫长的海上旅行,它不仅会让你置身于一艘船上,并且有海浪的声音作为背景,还会让你感受到甲板在脚下摇晃和海风吹拂。

Meta公司在博客文章中指出,未来的模型还可以添加其他感官输入流,包括“触觉、语音、气味和大脑功能磁共振成像信号”。该公司还声称,这项研究“让机器更接近于人类同时、全面、直接地从多种不同的信息形式中学习的能力。”

当然,这很多都是基于预测的,而且很可能这项研究的直接应用会非常有限。例如,去年,Meta公司展示了一个人工智能模型,能够根据文本描述生成短而模糊的视频。像ImageBind这样的研究显示了未来版本的系统如何能够整合其他数据流,例如生成与视频输出匹配的音频。

对于行业观察者来说,这项研究也很有趣,因为IT之家注意到Meta公司是开源了底层模型的,这在人工智能领域是一个越来越受到关注的做法。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-05-10 11:45:15

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...推“双子座” 号称最强AI模型安峥本报记者 安峥在美国人工智能(AI)初创公司OpenAI发布ChatGPT、引发人工智能开发竞赛一年后
2023-12-08 06:04:00
大模型不是未来?你需要学习下图灵奖得主Yann LeCun选择的“世界模型”
...型(LLM)成就非凡,应用丛生,还被很多人视为实现通用人工智能(AGI)的重大里程碑,也由此带来了一些「大规模失业论」甚至「AI 末日论」的悲观论调。尽管如此,也有一些业内人
2023-06-26 13:37:00
Google推出全新人工智能模型Gemini 2.0 用途更为广泛
Google的下一个主要人工智能模型已经到来,以对抗来自 OpenAI 的新产品的夹击。本周三,Google 发布了 Gemini 2
2024-12-12 09:54:00
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...用新场景》,借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简单介绍一下趣丸科技。我们是一家成立于2
2024-05-24 22:22:00
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...目由北京大学对齐小组开发并进行长期维护,团队专注于人工智能系统的安全交互与价值对齐,指导老师为北京大学人工智能研究院杨耀东助理教授。核心成员包括吉嘉铭、周嘉懿、邱天异、陈博远
2024-10-18 09:47:00
火爆全球的AI音频大模型,最新技术细节揭秘
...版权在生成式AI快速发展的背景下,人们对音乐行业使用人工智能的争论日益激烈,特别是在版权问题上。Stability AI前音频副总裁Ed Newton-Rex于2023年底离职
2024-07-25 09:22:00
刚刚,重磅发布!阿里、腾讯、科大讯飞在列
...探索。在今年4月11日,国家网信办就曾发布关于《生成式人工智能服务管理办法(征求意见稿)》公开征求意见的通知。《办法》提到,利用生成式人工智能产品向公众提供服务前,应当按照《
2023-06-20 17:00:00
新闻传播业的生成式人工智能应用及其风险应对
...用,探究“AI治理AI”新模式,坚持人本主义,是生成式人工智能风险治理的关键。人工智能的创新应用形塑社会互动模式。在信息传播、医疗、交通、教育等场景中,人工智能成为社会互动的
2024-06-13 10:23:00
机构预测:AIGC市场规模将2030年达1100亿美元
人工智能生成内容(AIGC)在2022年横空出世后,正在不断推动AI从学术界到产业界向一般互联网用户的破圈。微软创始人比尔·盖茨(BillGates)在今年3月发布的博文中说
2023-07-13 22:34:00
更多关于科技的资讯:
厦门网讯(厦门日报记者 沈彦彦)近日,厦门市商务局、厦门市财政局联合印发《厦门市促进直播电商产业园(基地)高质量发展扶持办法》(以下简称《扶持办法》)
2025-10-13 08:47:00
牢记嘱托 感恩奋进—— 安徽往前赶 | “风神之眼” 开启智慧送风时代 美博助推安庆宜秀“智造” 出海
大皖新闻讯 “人在哪,风就到哪!”10月10日,“牢记嘱托 感恩奋进 —— 安徽往前赶” 集中采访团走进安庆市宜秀区美博集团安庆智能化制造基地
2025-10-13 09:51:00
近日,在中国人民银行雄安新区分行指导下,中国银行河北雄安分行推动数字人民币硬钱包在雄安新区容东片区南文营社区食堂正式启用
2025-10-13 10:13:00
广州:“以税赋能”提振消费 黄金假期“好旺好彩”
羊城焕彩,共贺金秋。今年国庆假期与中秋佳节“快乐叠加”,又恰逢十五运会举办的冲刺阶段,广州旅游、餐饮、零售等消费场景迎来多轮热潮
2025-10-13 10:21:00
网友新手机号意外登录李玟账号,网易云回应
10月11日,有网友发文称,使用新办理的手机号注册网易云音乐时,通过短信验证码直接登录了歌手李玟的账号。登录后,该网友还能在账号后台看到粉丝们发来的怀念私信
2025-10-13 10:34:00
雷军开启小米汽车高原测试,回应没舍得买8000元的小刀
10月12日,小米创办人,董事长兼CEO雷军微博发文:我们测试车队来到了盘龙古道,海拔3500多米,连续急弯的山路,30公里山路超过600多个弯路
2025-10-13 10:35:00
果立方郑州突围记:新消费品牌如何在中原大地完成势能跃迁
河南,一种新的入场规则过去,新消费品牌的“入场券” 似乎必须由北上广深来颁发:要在北上验证市场,因为这里聚集着引领潮流的年轻人
2025-10-13 11:01:00
2025 VDC安全与隐私分会:技术持续创新,夯实安全地基
2025年度vivo开发者大会于10月10日成功举办。此次大会以“同心•同行”为主题,开设主会场及11大分会场。其中,在安全与隐私分会上
2025-10-13 11:04:00
齐鲁晚报·齐鲁壹点 李可 通讯员 马传哲近日,在郓城农商银行重点行业营销专项汇报会上,某支行行长对升级后的智慧服务平台赞不绝口
2025-10-13 11:09:00
据央视新闻报道,全国首张“职业弹幕人”罚单近期落地:北京市市场监管局对一家销售“燃咔果冻”的生物科技公司开出10万元罚单
2025-10-13 11:14:00
海尔空调双11将推可感知呼吸、可一键托管等新发明
与利物浦、巴黎圣日耳曼并肩,和中国女排同行!当竞技精神遇上空气科技,海尔空调以“可触摸、可感知”的千人“众测”开启双11
2025-10-13 11:39:00
填补空白!海尔智能门锁主导的《AI智能锁》团体标准发布
随着人工智能飞速发展, AI智能锁正成为市场新宠。奥维云网公布的消费者调研数据显示,超60%的用户愿为了AI智能锁而加价买单
2025-10-13 11:40:00
央视财经综合《新西兰先驱报》等媒体12日报道,美国微软公司将于10月14日起,停止对Windows 10系统提供安全更新和技术支持
2025-10-13 11:42:00
“大地之子”C位出道!深圳车展跨界顶流艺术IP,打造国庆打卡新地标
2025深圳国际车展在跨界融合中开辟新路径,通过引入现象级艺术IP“大地之子”,成功打造了一场艺术与汽车工业深度对话的盛宴
2025-10-13 12:10:00
海尔集团与阿里巴巴达成全面AI合作
10月11日,海尔集团与阿里巴巴集团签署全面战略合作协议,达成全面AI合作。双方将充分发挥海尔的全生态布局与阿里的全栈AI能力优势
2025-10-13 12:29:00