• 我的订阅
  • 科技

Meta使研究人员能够更多地访问Facebook和Instagram数据

类别:科技 发布时间:2023-11-24 16:17:00 来源:DeepTech深科技

Meta 近日发布公告,它将发布一款名为 Meta Content Library and API (Meta 内容库和 API,以下简称内容库)的新透明度产品。这款新工具将允许特定研究人员访问 Facebook 和 Instagram 平台上的公开数据,以便更全面地了解这些平台上的情况。

Meta使研究人员能够更多地访问Facebook和Instagram数据

(来源:STEPHANIE ARNETT/MITTR | ENVATO)

此举出台之际,包括 Meta 在内的多家社交媒体公司正面临公众和监管压力,要求提高其产品(特别是推荐算法)的工作方式及其影响的透明度。

学术研究人员长期以来一直呼吁,希望更好地访问 Meta 等社交媒体平台的数据。对于 Meta 平台正在发生的事情的可见性,以及 Meta 的产品对网络对话、政治和整个社会的影响而言,这个新内容库是朝着积极的方向迈出的重要一步。

Meta 全球事务总裁尼克·克莱格(Nick Clegg)在接受采访时表示,这些工具“确实非常重要”,因为它们在很多方面提供了“对 Facebook 和 Instagram 上公开内容的最全面访问(渠道),这是我们至今所建的所有东西都无法比拟的”。

正如 Meta 在一篇博客文章中指出的那样,该内容库还将帮助该公司满足数据共享和透明度方面的新监管要求和义务。

该内容库和相关 API 于几个月前首次发布了测试版,允许研究人员访问 Facebook 上的页面、帖子、群组和事件,Instagram 上的创建者和企业帐户以及相关的近实时数据。反应数(互动数)、分享数、评论数和帖子浏览数。

虽然所有这些数据都是公开的,比如任何人都可以在 Facebook 上看到公开的帖子、反应和评论,但内容库使研究人员可以更轻松地大规模搜索和分析这些内容。

Meta 表示,为了保护用户隐私,这些数据只能通过虚拟“无尘室(clean room)”访问,并且不可下载。访问权限目前仅限于获得批准的研究人员,他们需要通过独立的第三方组织进行申请。

除了新的库和 API 之外,Meta 还宣布了新的合作伙伴关系,扩大社交网络与经济流动性之间联系的研究。

就在几天前,有媒体报道称,该公司正在解散其负责任人工智能(Responsible AI)团队,并将研究人员分散到该组织的其他部门。此举引发了对其用户安全承诺的怀疑。克莱格对人工智能团队的重组没有发表评论。

Meta使研究人员能够更多地访问Facebook和Instagram数据

希望进行“有意义的”研究

研究人员过去与社交媒体公司的关系令人担忧,特别是在访问平台可能不希望公开的数据时。例如,2021 年,Facebook 向纽约大学透明度项目的研究人员发出了一封中止函,他们当时正在通过网络爬虫在该平台上调查定向投放政治广告的情况。该公司称该项目侵犯了用户隐私。

克莱格表示,他希望该产品能够实现“有意义”的研究,他强调研究人员目前对社交媒体的确切影响缺乏共识。由于缺乏来自社交媒体公司的公开数据,研究无疑变得更加困难。

新的内容库主要是一个数据库,可以通过类似于搜索引擎的界面或通过 API 进行访问,研究人员可以在 API 中编写自己的查询以得到大量数据。例如,研究人员可以要求查看 2023 年 2 月 14 日有关生成式人工智能的所有英文公开帖子,按查看次数最多到最少排序。

监管机构,尤其是欧盟监管机构,最近的举措可能促使 Meta 要求提高透明度。欧盟数字服务法案 (DSA) 于今年 8 月生效,要求 Meta 这种规模的大型平台为调查“欧盟系统性风险的检测、识别和理解”的研究人员提供实时数据访问权限。

澳大利亚、巴西、美国和其他地方的其他监管部门也试图模仿这些要求。在所谓的“布鲁塞尔效应”中,科技公司通常会选择在其运营的每个国家都遵守最严格的标准(通常由欧盟制定),以避免产品碎片化。

政策层面的努力一直在试图平衡提高透明度的要求和对隐私保护的担忧。克莱格表示,Meta 试图通过申请流程来达到这种平衡。

希望访问内容库和 API 的研究人员必须向密歇根大学的独立组织“政治和社会研究大学间联盟(Inter-university Consortium for Political and Social Research)”提交有关其机构和研究问题的信息。

梅塔表示,筛查的主要目的是对使用数据的群体及其经济利益进行安全检查,而不是审查研究问题。

然而,申请过程已经引起了一些人的关注。康奈尔理工大学研究社交媒体影响的博士后研究员史密莎·米利(Smitha Milli)说:“我的主要问题是,为什么不是每个人都可以使用它?” 特别是因为该内容库只包含公开可用的数据。

米利补充说,重要的是要考虑申请过程将增加研究周期的时间,并表示这可能是“最大的限制(因素)”。

Meta 表示,它对内容库的访问设限,是为了保护用户隐私。“平台上公开可获取的数据与以编程的方式访问大量数据之间存在很大差异。” Meta 产品经理基兰·贾加迪什(Kiran Jagadeesh)说道。

米利指出,研究人员非常希望获得有关推荐算法如何工作、人们在个人信息流中看到的内容以及在平台上运行实验的方法的信息。

目前尚不清楚最新产品将如何在这些方面取得进展,但克莱格表示,研究人员可以将内容库与其他项目(例如推荐系统卡)结合起来,这将提供“比以往任何时候都更加丰富的画面”。

南丹麦大学数字民主中心教授莉娜·弗里施利希(Lena Frischlich)测试了内容库的测试版,并表示她的团队发现访问 Instagram 上的视频和 Facebook 上的活动等多媒体内容特别有用,而且它提供了有关观看次数的新数据。

弗里施利希还表示,虽然新产品是“迈向提高透明度的重要一步”,但这只是一步。 “数据访问仍然受到某种限制”,因为并非每个国家都包含在数据库中,并且只有合格的学术或非营利研究机构的研究人员才会被授予访问权限。

克莱格表示,出于多种原因,他希望新工具最终能够更好地研究社交媒体在社会中的作用。“我认为这里有一种社会责任感。”他说,“但也关乎一种自身利益,那就是试图消除一些围绕社交媒体的夸张说法,让辩论更加扎根于事实。”

支持:Ren

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-11-24 18:45:20

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...究场景让人眼前一亮。这里看不到身穿白大褂的实验操作人员,瓶瓶罐罐的实验工作都由一台机器人完成。这台机器人由中科大化学物理系教授江俊团队研发。它不仅能根据指令操作实验,还能够利
2023-04-26 02:17:00
人类多样性调查发现近3亿基因突变
...已取得实质性成果。美国国立卫生研究院(NIH)等机构的研究人员对“我们所有人”项目收集的24.5万个基因组进行了分析,发现了超过2.75亿个新的遗传标记,其中近150个可能与
2024-02-23 06:41:00
华人团队爆火instructblip抢跑看图聊天
...劣的天气因素造成的。给我介绍下这幅画进行多轮对话 研究人员表示,正是基于强大BLIP-2,才使得InstructBLIP「看」的更好
2023-05-15 20:17:00
...负责人和政策负责人Gracy Crane也在线上进一步分析了企业研究人员进行真实世界数据质量评价的实践。拓展新场景释放数据新潜力得益于博鳌乐城国际医疗旅游先行区“先行先试”政
2023-11-09 07:08:00
《中国开放数据白皮书》首发:78%受访者赞成公开研究数据
...旬发布2023年度《开放数据状况报告》,全球共有6000多名研究人员对调查作出回复,其中印度(12%)、中国(11%)和美国(9%)的回复比例最高
2023-11-30 18:35:00
谷歌员工曝AI改进速度放缓,Gemini已成立新团队解决问题
...该公司希望模型性能提升的速度可以与去年相当,这促使研究人员专注于其他方法来勉强取得效果。这种情况和OpenAI的遭遇类似。此前有报道称,OpenAI模型性能提升速度有所放缓,
2024-11-15 09:51:00
下午锻炼降糖效果最佳
本文转自:中国科学报本报讯 美国研究人员发现,在下午进行体育锻炼的人比其他时间运动的人血糖降低得更快。5月25日,相关成果发表于《糖尿病护理》。超过3700万名美国人患有糖尿病,
2023-05-30 06:05:00
研究人员新发现18起黑洞吞噬恒星事件
美国麻省理工学院近日发布公报说,该校研究人员领衔的团队在距地球6亿光年范围内新发现了18起黑洞吞噬恒星的潮汐瓦解事件,使附近宇宙空间中已知的这类事件数量增加了一倍多。相关论文发表
2024-02-06 21:48:00
睡得好可延年益寿,数据来说话
本文转自:长江日报美国研究人员用数据说明晚上睡得好可能有助延年益寿。那么,如何界定睡得好不好呢?哈佛大学医学院研究人员23日在提交给美国心脏病学会年会的论文中说,健康睡眠要素包括
2023-02-24 20:47:00
更多关于科技的资讯: