• 我的订阅
  • 科技

一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

类别:科技 发布时间:2024-11-28 12:02:00 来源:新智元

一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

新智元报道

80

【新智元导读】Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。

开源绝对是AI如今发展迅猛的助推剂,而其中的一股重要力量就是来自Meta

Meta在人工智能开源界可谓是硕果颇丰,从大模型LLama到图像分割模型Segment Anything,覆盖了各种模态、各种场景,甚至在AI以外的学科,如医学等科学研究进展也都从Meta的开源模型中受益。

一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

最近,Meta发布了一系列新的开源工作,还对已有的开源工作进行了升级迭代,包括 SAM 2.1、句子表征的细化等,开源社区将再迎来一场狂欢!

Segment Anything Model 2.1

SAM2模型开源以来,总下载量已经超过70万次,在线可用的演示程序也已帮助用户在图像和视频数据中分割了数十万个物体,并且在跨学科(包括医学图像、气象学等研究)中产生了巨大的影响。

本次Meta更新了Meta Segment Anything Model 2.1 (SAM 2.1)权重,性能更强。

一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

开源链接:https://github.com/facebookresearch/sam2

相比SAM2,研究人员引入了额外的数据增强技术来模拟视觉相似物体和小物体,并且通过在较长的帧序列上训练模型并对「空间」和「物体指向记忆」(object pointer memory)的位置编码进行一些调整,提高了SAM 2的遮挡处理能力(occlusion handling capability)。

研究人员还开源了SAM 2开发者套件,基于SAM 2模型构建下游应用会变得更容易,用户现在也可以使用自己的数据来微调SAM 2的训练代码;页面演示的前端和后端代码也开源了。

Spirit LM:语音+文本的语言模型

大型语言模型经常被用来构建文本到语音的流程:首先通过自动语音识别(ASR)技术将语音转写成文本,然后由大型语言模型(LLM)合成文本,最终再通过文本到语音(TTS)技术将文本转换为语音。

但这个过程可能会影响语音的表达性,使得模型在理解、生成带表达的语音上有所欠缺。

为了解决这个限制,研究人员构建了Spirit LM,也是首个Meta开源的多模态语言模型,能够自由地混合文本和语音;通过在语音和文本数据集上使用逐词交错的方法进行训练,实现了跨模态生成。

一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

论文链接:https://arxiv.org/abs/2402.05755

研究人员开发了两个版本的Spirit LM,以展示文本模型的生成语义能力和语音模型的表达能力:基础版(Base)使用音素标记来模拟语音,而表达版(Expressive)使用音调和风格标记来捕捉关于语调的信息,比如是兴奋、愤怒还是惊讶,然后生成反映这种语调的语音。

Spirit LM能够生成听起来更自然的语音,并且有能力跨模态学习新任务,比如自动语音识别、文本到语音和语音分类。

Layer Skip:加速生成时间

大型语言模型已经在各个行业和用例中得到了广泛应用,但需要非常高的计算速度和内存量,运行成本非常高。

为了应对这些挑战,Meta引入一种端到端的解决方案层跳过(Layer Skip),可以在不依赖专用硬件或软件的情况下,加速新数据上的LLM生成时间:通过执行模型的部分层,并利用后续层进行验证和修正,来加速LLMs的运行。

一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

论文链接:https://arxiv.org/pdf/2404.16710

代码链接:https://github.com/facebookresearch/LayerSkip

研究人员开源了层跳过的推理代码和微调检查点,包括Llama 3、Llama 2和Code Llama,这些模型已经通过层跳过训练方法进行了优化,显著提高了早期层退出的准确性,层跳过的推理实现可以提升1.7倍模型性能。

层跳过检查点的一个主要特点是在早期层退出和跳过中间层时的鲁棒性,以及各层之间激活的一致性,这种特性为优化和可解释性方面的创新研究铺平了道路。

Salsa:验证后量子密码标准的安全性

在保护数据的安全领域上,密码学研究必须领先于攻击手段。

Meta此次开源的方法Salsa,能够攻击和破解NIST标准中的稀疏秘密(sparse secrets)Krystals Kyber,使研究人员能够对基于人工智能的攻击进行基准测试,并将其与现在以及将来的新攻击手段进行对比。

一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

论文链接:https://arxiv.org/pdf/2408.00882v1

代码链接:https://github.com/facebookresearch/LWE-benchmarking

国家标准技术研究所(NIST)采用的行业标准,「基于格(lattice)的密码学」建立在「带误差的学习」(LWE)的难题之上。

这种难题假设,如果只提供与随机向量有噪声的内积,那么学习一个秘密向量是非常困难的,此前已经有研究人员展示了针对这种方法的机器学习攻击。

Meta Lingua:通过高效的模型训练加速研究

Meta Lingua 是一个轻量级且自包含的代码库,可以大规模训练语言模型。

该项目提供了一个研究友好的环境,使得将概念转化为实际实验变得更加容易,并强调简单性和可重用性以加速研究,平台高效且可定制,研究人员能够以最小的设置和技术负担来快速测试想法。

一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

代码链接:https://github.com/facebookresearch/lingua

为了实现这一点,研究人员做了几个设计选择,确保代码既模块化又自包含,同时保持高效,其中利用了PyTorch中的多个特性,在保持灵活性和性能的同时,使代码更易于安装和维护。

研究人员可以更专注于工作本身,让Lingua平台来负责高效的模型训练和可复现的研究。

Meta Open Materials 2024:促进无机材料发现

传统上,发现推动技术进步的新材料可能需要数十年的时间,但人工智能辅助材料发现可能会彻底改变这一领域,并大大加快发现流程。

Meta最近开源了Open Materials 2024数据集和模型,在Matbench-Discovery排行榜上名列前茅,有望通过开放和可复现的研究进一步推动人工智能加速材料发现的突破。

一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

代码链接:https://github.com/FAIR-Chem/fairchem

模型链接:https://huggingface.co/fairchem/OMAT24

数据链接:https://huggingface.co/datasets/fairchem/OMAT24

目前最佳的材料发现模型是基于开源人工智能社区的基础研究构建的封闭模型,而Open Materials 2024提供了基于1亿个训练样本的开源模型和数据,也是最大的开放数据集之一,为材料发现和人工智能研究社区提供了一个有竞争力的开源选择。

Meta Open Materials 2024现在公开可用,并将赋予人工智能和材料科学研究社区加速无机材料发现的能力,并缩小领域内开放和专有模型之间的差距。

Mexma:改进句子表征的token级目标

目前,预训练的跨语言句子编码器通常只使用句子级别的目标进行训练。这种做法可能会导致信息的丢失,特别是对于token级别的信息,这最终会降低句子表示的质量。

Mexma是一个预训练的跨语言句子编码器,通过在训练过程中结合token和句子级别的目标,其性能也超越了以往的方法。

一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

论文链接:https://arxiv.org/pdf/2409.12737

以前训练跨语言句子编码器的方法仅通过句子表示来更新编码器,通过同时使用token级别的目标来更好地更新编码器,从而在这方面进行了改进。

一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

研究人员希望研究社区能够从使用Mexma作为句子编码器中受益,目前支持80种语言,所有语言的句子表示都经过对齐,在挖掘包含两种文本的语言数据时,Mexma能够更准确地识别和比较不同语言中的信息,并且在其他下游任务,如句子分类上表现良好。

Self-Taught Evaluator:生成奖励模型

研究人员推出了自学评估器(Self-Taught Evaluator),可以用于生成合成偏好数据以训练奖励模型,而无需依赖人工标注。

这种方法生成对比的模型输出,并训练一个作为评委的大型语言模型(LLM-as-a-Judge)以生成用于评估和最终判断的推理痕迹,并通过迭代自我改进方案进行优化。

一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

论文链接:https://arxiv.org/abs/2408.02666

研究人员发布了一个经过直接偏好优化训练的模型,该生成式奖励模型在RewardBench上表现强大,但在训练数据创建中没有使用任何人工标注。

其性能表现超越了更大的模型或使用人工标注标签的模型,例如GPT-4、Llama-3.1-405B-Instruct和Gemini-Pro,也可作为AlpacaEval排行榜上的评估器之一,在人类一致率方面名列前茅,同时比默认的GPT-4评估器快约7到10倍。

自从发布以来,人工智能社区已经接受了这种合成数据方法,并用来训练表现优异的奖励模型。

参考资料:

https://ai.meta.com/blog/fair-news-segment-anything-2-1-meta-spirit-lm-layer-skip-salsa-lingua/

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-28 14:45:06

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

最低4.99万元起 零跑T03家族“新春大礼包”来了
...”就“购”了!零跑T03。 零跑汽车供图 华龙网发T03新春大礼包,至高享受10000元现金补贴!从2024年1月10日起至2024年1月31日
2024-01-13 20:46:00
OpenAI官宣:圣诞大礼包连更12天!满血版o1、Sora确认亮相
【新智元导读】重磅!12月5日起,OpenAI将开始连续12天的圣诞马拉松。根据外媒The Verge的内部消息,满血版o1和Sora会正式发布
2024-12-06 09:52:00
英卓恩新年大礼包开箱,共启缤纷卯兔年!
...年画上圆满的句号,特此为孩子们奉上英卓恩专属“新年大礼包”,我们希望用一份温暖的礼物为这一年留下特殊的印记,同时也开启新一年的美好时光。接下来我们就深入了解下这份礼物吧~专属
2023-01-03 10:00:00
阿里云盘新版本升级大礼包 安全备份盘存得越多、容量越大
...随时在手机等其他设备随时查看电脑文件夹。新版本升级大礼包 超1TB免费空间等你领此次版本升级,阿里云盘对于新老用户的福利活动可以说是超大力度,首先就是「新版本升级礼」,只要是
2023-08-21 16:00:00
...●扬 凡原价84元的泡芙,现价仅需40元;原价39.8元的零食大礼包只要19.2元……读完《财富》版《临期食品成“新宠”》一文,笔者怦然心动。临期食品是即将达到保质期、但仍在
2023-01-03 02:02:00
重庆城口:600多名山里娃收到新年“大礼包”
...巴山腹地,重庆城口600多名山里娃收到了新年的第一份“大礼包”,让这群山里娃在寒冬里感受到了别样温暖。“收到新年礼物我很开心!这里面有围巾、手套、还有一些学习用品,这些都是我
2024-01-16 17:17:00
...的愿望也得到了满足。航天员太空跨龙年精心准备了春节大礼包除了航天员所需的生活必需品外,还专门为他们准备了春节大礼包,以及神舟十七号、十八号两个乘组在空间站进行交接的礼物。尹锐
2024-01-16 02:46:00
赏车购车,玩转“五一”
...3680元的家充服务包;埃安S MAX综合优惠1.6万元,订车就送大礼包;江淮钇为3推出“万元现金优惠+装潢礼包”
2024-05-02 09:14:00
暴雨来临怕电脑进水潮湿?AI商务本惠普战66安全感拉满
...应需所选,新品享6期免息,评论晒单限量送战系列包鼠大礼包,参与京东预售付定金用户加赠惠普六合一拓展坞。惠普战66七代酷睿Ultra版搭载了英特尔酷睿Ultra系列处理器
2024-05-12 16:15:00
更多关于科技的资讯:
成安“一品一播”赋能工业企业发展主播带货推动工业品线上热销河北新闻网讯(记者刘剑英)因一场直播,前不久,一名新疆卡车司机跨越3000多公里
2025-12-25 11:29:00
海尔×牛客AI面试:用技术重塑候选人体验,让招聘更有温度
效率与品质并行的时代,AI正在改写招聘的底层逻辑。从校招高峰到全球人才争夺战,越来越多企业正让AI深度介入招聘流程,让人才筛选像生产一样精准
2025-12-25 12:27:00
百度AI营销 × 茅台酱香:以岁月记忆沉淀品牌温度,打造全链路沟通范式
那些关于奔赴与抵达的足迹,那些串联起奋斗与团圆的旅程,不仅是时光的印记,更藏着一整年的热爱与坚守。当这些珍贵的生活轨迹被温柔唤醒
2025-12-25 12:29:00
不只是杯壶!新华社文创·哈尔斯“必胜”系列正式上线
近日,新华社文创与头部杯壶品牌哈尔斯携手推出“必胜”系列杯壶产品,该系列产品的策划灵感,源自纪念中国人民抗日战争暨世界反法西斯战争胜利80周年大会受阅现场划破长空的铿锵口号
2025-12-25 12:29:00
鸿蒙星火,桃李芳华:2025 HarmonyOS人才布道师年度论坛凝聚生态向心力
12月20日,“2025 HarmonyOS人才布道师年度论坛”于重庆举行。本次论坛不仅是一场对2025年度HarmonyOS人才发展的最新进展与成果的集中展示
2025-12-25 12:31:00
TPACK框架赋能高中英语教师信息化教学设计:现状、挑战与路径
摘要: 本研究基于TPACK框架,采用混合方法调查河南省高中英语教师信息化教学现状。结果显示:教师总体能力尚可(3.85)
2025-12-25 13:19:00
中新经纬12月25日电 “携程黑板报”公众号25日发布关于用户关切问题的郑重声明。针对近日大家高度关注的用户数据安全等问题
2025-12-25 14:01:00
长白时评评论员 久泰平近日,中国人民大学“书记严选”文创羽绒服热销火爆全网,源自中国人民大学党委书记张东刚在小红书社交平台上发帖推荐该校近期上新的人大超绒羽绒服
2025-12-25 14:06:00
Soul App联合复旦发布2026社交趋势十大关键词
近日,社交平台Soul App旗下Just So Soul研究院联合复旦大学传播与国家治理研究中心、复旦大学价值认知传播与人智协同治理交叉创新团队
2025-12-25 14:13:00
腾讯扣叮发布2026新品,助力人工智能教育普及
12月22日,2025腾讯扣叮渠道生态大会暨2026年新产品推介会在深圳举行。会上,腾讯扣叮宣布“快叮岛”迎来全新升级版本
2025-12-25 14:13:00
北京惠诚律师事务所举办律师品牌建设主题沙龙
12月5日下午,由北京市惠诚律师事务所与北京律页网络科技有限公司联合主办,百度百科、百度智能体、律视微言共同支持的“律业IP·惠诚赋能——律师品牌建设的创新路径”主题沙龙在惠诚律师事务所成功举办
2025-12-25 14:13:00
卡游:架设国潮文化和青少年之间的桥梁 ——“文化赋能,育心育人” 学术研讨会在京举办
12月20日,由央广传媒集团主办、浙江卡游动漫有限公司公益支持的“文化赋能,育心育人——中华优秀传统文化促进青少年心理健康学术交流活动”在北京举行
2025-12-25 14:43:00
中新经纬12月25日电 25日,公安部举行新闻发布会。会上,公安部经济犯罪侦查局局长华列兵表示,金融领域“黑灰产”已形成一套完整的产业链条
2025-12-25 14:48:00
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)“未来音乐研讨会暨国家社科基金艺术学重大项目《音乐与人工智能协同创新发展理论研究》学术研讨会”
2025-12-25 15:49:00
在唐山,金融服务正跳出传统柜台,上演着一场场生动的“现场作业”。曹妃甸经开区一家手握多项专利的科技企业,一周内获得了急需的发展资金
2025-12-25 15:56:00