• 我的订阅
  • 科技

metareality推出sapiensai视觉模型

类别:科技 发布时间:2024-08-25 02:39:00 来源:浅语科技

8月24日消息,MetaReality实验室最新推出了名为Sapiens的AI视觉模型,适用于二维姿势预估、身体部位分割、深度估计和表面法线预测4种以人为中心的基本视觉任务。

metareality推出sapiensai视觉模型

这些模型的参数数量各不相同,从3亿到20亿不等。它们采用视觉转换器架构,任务共享相同的编码器,而每个任务有不同的解码器头。

二维姿势预估:这项任务包括检测和定位二维图像中人体的关键点。这些关键点通常与肘、膝和肩等关节相对应,有助于了解人的姿势和动作。

身体部位分割:这项任务将图像分割成不同的身体部位,如头部、躯干、手臂和腿部。图像中的每个像素都被归类为属于特定的身体部位,这对虚拟试穿和医学成像等应用非常有用。

深度估计:这项任务是估算图像中每个像素与摄像头的距离,从而有效地从二维图像中生成三维图像。这对增强现实和自动驾驶等应用至关重要,因为在这些应用中,了解空间布局非常重要。

表面法线预测:这项任务是预测图像中表面的方向。每个像素都会分配一个法向量,表示表面朝向的方向。这些信息对于三维重建和了解场景中物体的几何形状非常有价值。

metareality推出sapiensai视觉模型

metareality推出sapiensai视觉模型

Meta公司表示该模型可原生支持1K高分辨率推理,并且非常容易针对个别任务进行调整,只需在超过3亿张野生人类图像上对模型进行预训练即可。

即使在标注数据稀缺或完全是合成数据的情况下,所生成的模型也能对野生数据表现出卓越的泛化能力。

metareality推出sapiensai视觉模型

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-08-25 08:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

Meta提出“可持续思维链”,让大模型在连续潜空间中推理
今日值得关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2
2024-12-13 09:19:00
SAM是如何做到“分割一切”的
本文转自:科技日报又一通用模型发布SAM是如何做到“分割一切”的视觉中国供图SAM是一类处理图像分割任务的通用模型。与以往只能处理某种特定类型图片的图像分割模型不同,SAM可以处
2023-04-17 01:26:00
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5”
商汤发布开源社区最大最强多模态多任务通用大模型“书生2.5” 3月14日,商汤科技发布多模态多任务通用大模型“书生(INTERN)2.5”,在多模态多任务处理能力方面实现多项全新
2023-03-15 13:30:00
Bengio团队提出多模态新基准,直指Claude 3.5和GPT-4o弱点
...想要达成通用人工智能 AGI 的终极目标,首先要达成的是模型要能完成人类所能轻松做到的任务。为了做到这一点,大模型开发的关键指导之一便是如何让机器像人类一样思考和推理
2024-06-29 09:37:00
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research
2023-10-17 16:31:00
阿里云通义千问 Qwen2-VL 第二代视觉语言模型开源
... 2 日消息,阿里云通义千问今日宣布开源第二代视觉语言模型 Qwen2-VL,并推出 2B、7B 两个尺寸及其量化版本模型
2024-09-03 09:45:00
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
大型语言模型(LLM)的出现统一了语言生成任务,并彻底改变了人机交互。然而,在图像生成领域,能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日,智源推出了新的扩
2024-10-30 09:53:00
微美全息(NASDAQ:WIMI)将迁移学习引入到语义分割模型,实现高质量的语义分割任务
...景理解、图像分析、机器人感知和图像分割等。语义分割模型是计算机视觉领域中的一种模型,旨在将图像中的每个像素分配给特定的语义类别。与传统的图像分类模型只能给整个图像分配一个类别
2023-11-15 01:02:00
Pokémon Go开发地理空间大模型,AR眼镜的高精地图?
...布了新一代AR眼镜——RokidGlasses,通过摄像头、多模态大模型以及(玻璃衍射)光波导等技术,在一定程度上让AR眼镜实现了对真实世界的感知与理解,以及对用户的协同与展
2024-11-22 14:05:00
更多关于科技的资讯:
农银人寿正式发布《2025年度消费者权益保护报告》,以“笃行‘金融为民’”为主线,系统回顾了过去一年围绕“五篇大文章”
2026-03-16 14:15:00
海外科技圈评中国“手搓”经济:灵光等AI工具引爆的创新增长
近期海外科技媒体QUASA报道,在中国普通人正在利用灵光等AI工具 “手搓”出各种功能性、可交互的小应用,并在社交平台上把这种日常小应用进行售卖
2026-03-16 14:19:00
提升20%制作效率,虎鲸文娱豹款影视车获日内瓦国际发明展最高奖
3月15日,第51届日内瓦国际发明展落下帷幕,虎鲸文娱集团自主研发的“豹款影视制作车”,作为今年中国代表团、也是今年展会唯一一个影视行业的发明产品
2026-03-16 14:19:00
2026年大华股份渠道本地经营合作伙伴大会盛大启幕
3月14日,2026年大华股份渠道本地经营合作伙伴大会于绍兴正式启幕。全国渠道合作伙伴齐聚一堂,以"本地经营、区县下沉"为战略主线
2026-03-16 14:46:00
企航管理2026赢利规划盛典启幕,赋能中小微企业“做对战略,持续赢利”
2026年,国家持续释放中小微企业扶持政策红利,下沉市场成为中小微企业实现增长的重要赛道!在此背景下,企航管理“做对战略 持续赢利”2026年315战略大会暨年度赢利规划盛典于北京盛大启幕
2026-03-16 14:46:00
2026年3月15日,第44个国际消费者权益日如约而至。围绕国家金融监督管理总局"清朗金融网络 守护安心消费"的年度主题
2026-03-16 14:46:00
如今,人们常常通过AI大模型帮助自己筛选信息、给出客观的参考答案,只是想着能少踩坑、少被套路。可今年央视“3·15”晚会聚焦曝光的AI大模型遭“投毒”事件
2026-03-16 15:39:00
闪耀AWE2026!海尔发布年度《家庭大脑白皮书》
日前,AWE2026在上海开幕,各大家电品牌纷纷亮相、看家本领层出不穷。刚获欧睿国际“全球智慧家庭销售额第一企业”认证的海尔智慧家庭(下称“海尔智家”)
2026-03-16 15:39:00
近百个家电家居品牌合作!京东JoyInside多款合作新品亮相AWE2026
3月12日,中国家电及消费电子博览会(AWE 2026)在上海开幕,京东以“AI对话未来,新品尽在京东”为主题亮相展会
2026-03-16 16:20:00
据央视新闻微信公众号3月13日消息,市场监管总局印发《关于强化广告中提示性用语监管工作的通知》,部署对相关广告乱象开展为期半年的清理整治工作
2026-03-16 16:48:00
“顾家”以品质升级与服务创新护航消费者合法权益
鲁网3月16日讯3月15日国际消费者权益日,“好眠不设限 服务无边界 ——顾家床垫服务升级发布会”在山东潍坊成功举办。顾家床垫坚持以消费者需求为导向
2026-03-16 16:50:00
长白时评评论员 杨飞按照业内人士爆料,记者在多个网络平台查询搜索到了一项名为GEO的业务,这些从事该项业务的服务商号称
2026-03-16 15:49:00
悟品WU10:以“高配低价”重构中式厨房的洁净,做洗碗机赛道的长期主义者
据产业在线数据显示,在内外销双双逆势增长的繁荣表象下,真正的竞争内核已从单纯的品牌溢价,转向了对用户真实痛点的精准回应与技术普惠
2026-03-16 15:37:00
2026年元宵节当天,兴业银行石家庄分行营业部举办了“闹元宵·猜灯谜”主题活动。本次活动的灯谜设计实现了寓教于乐、金融科普
2026-03-16 11:20:00
2026年春季大型招聘会暨职引未来——全国城市巡回招聘活动14日启动,吸引了万余人到场。据悉,为配合这场春节后首场大型招聘会
2026-03-16 11:45:00