• 我的订阅
  • 科技

无视用户隐私 大量AI应用正在共享你的数据

类别:科技 发布时间:2023-07-03 14:14:00 来源:三易生活

如今距离OpenAI第一次将ChatGPT带给大众用户已经过去了半年之久,但毕竟再好的东西都有“保质期”,所以随着时间的推移,大众围绕AI大模型的狂热也逐渐褪去、其暗面也开始被大量讨论。且不提早已被摆在台面上的AI大模型生成内容可能存在版权风险,以及AI的伦理道德等过于虚无缥缈的话题,仅仅就其窃取用户隐私这个问题,就足以让外界对大模型提起十二万分的注意了。

无视用户隐私 大量AI应用正在共享你的数据

近日,美国一家律师事务所向加州北区联邦法院提起集体诉讼,指控OpenAI和微软使用互联网抓取的信息来训练ChatGPT时,严重侵犯了大量用户的版权和隐私,要求后者赔偿30亿美元。在这份长达157页的诉状中,原告指责OpenAI尽管制定了购买和使用个人信息的协议,但包括账户信息、姓名、联系方式、支付信息、聊天记录等隐私数据都在未经许可的情况下,被OpenAI和微软收集、存储、共享和披露。

如果说这家律所指控OpenAI和微软更多的是在博眼球,那么网络安全公司Home Security Heroes公布的一份研究数据,则可能更具现实意义。在该公司对苹果App Store的研究中发现,有四分之三的AI相关应用与第三方共享用户数据。而在接受调查的159个应用中发现,64%的应用会跟踪用户的个人数据,其中监控用户数据比例最大的一款AI应用是Brainly(一款数学求解应用)。

无视用户隐私 大量AI应用正在共享你的数据

除此之外,Google Assistant与第三方共享了超过35.71%的用户数据,语言教育应用Duolingo、图像生成应用AI Arta和DaVinci,以及AI医疗应用K Health则分别与第三方共享了多达28.57%的用户数据。根据Home Security Heroes方面的说法,从整体来看,有54%的AI应用会跟踪用户数据。

毫无疑问,这样的一组数字是相当惊人的,毕竟App Store应该是目前对应用审核最为严格的应用商店,而苹果也是当下对用户隐私保护力度最强的消费电子企业。因此也可想而知,在Android生态中,AI应用窃取用户数据的情况大概率只会更加严重。

事实上,与第三方分享用户数据自Meta的“剑桥门”以来,就是被整个行业非常忌讳的一件事,也很容易让用户联想到企业本身对于个人隐私持漠视态度,因此近年来也是各大应用商店严防死守的一点。

无视用户隐私 大量AI应用正在共享你的数据

比如苹果在App Store的审核指南中就明确写到,“从App中收集的数据不能与第三方共享,用于与提升用户体验、软件/硬件性能无关的功能,自助广告必需遵守《苹果开发者计划许可协议》”。既然向第三方分享用户数据是一个被苹果禁止的行为,那么为什么这一大批AI应用会选择糊弄苹果的审核人员,冒着被移出App Store的风险也要这样干呢?

其实这是因为AI应用对于数据有着几乎永无止境的渴求,它们像饕餮一般吞噬数据、以训练自家的模型。而AI的智能则是以数据为支撑的,机器学习/深度学习技术的底座就是大量数据,也就是著名AI科学家吴恩达教授倡导的Data-centric AI,它是一种以数据为中心的人工智能理念,强调数据在人工智能开发和应用中的重要性。

无视用户隐私 大量AI应用正在共享你的数据

传统搭建AI模型的方法主要是聚焦迭代模型,数据也相对固定,通常会聚焦于几个基准数据集,然后设计各式各样的模型去提高预测准确率。但这一模式的缺陷也非常突出,准确率高的模型只能确保“拟合”数据,并不一定意味着实际应用中会有很好的表现,如今也已经被边缘化,目前用更大规模和更高质量的数据来训练AI,则成为了主流。

以OpenAI的GPT模型为例,从GPT-1到ChatGPT、再到GPT-4,所用的训练数据大体经历了以下变化,小数据规模数据——大规模数据——更大规模、更高质量的数据——大规模的人类标注的高质量数据。毕竟所谓语言模型的训练和学习,就是从大量的数据中学习复杂的上下文联系。而为了获得更多的数据,OpenAI更是四处出击,例如它就以每年200万美元的价格获得了推特推文数据的访问权限。

无视用户隐私 大量AI应用正在共享你的数据

如果没有持续的数据输入,ChatGPT就不可能完成向GPT-4的“进化”,而两者间的一个显著区别,就是ChatGPT的数据只截止到2021年、缺乏2022年及之后的数据。没错,随着AI大模型概念的走红,AI相关企业如今已然成为了数据交易市场的大买家。

也正是因为这一事实,导致了现阶段数据本身的价格水涨船高,掌握数据源头的企业已经开始哄抬物价。以前段时间闹出不小风波的Reddit为例,其所给出第三方抓取5000万次内容需支付12000美元的价格,显然就已经很高。

出于对数据的渴求,以及数据本身的价格原因,AI应用的开发者自然就有了强烈的从应用内收集用户数据、并分享给第三方的动力。对于当下的绝大多数AI应用而言,变卖数据或许是它们现阶段所能找到、最具可行性的挣钱方式。而且目前会去下载AI应用的用户,基本都是对AI感兴趣的人群,如何让这一部分用户的价值变得更大,显然开发者没有理由不动心。

无视用户隐私 大量AI应用正在共享你的数据

事实上,肆意挖掘用户隐私现象的泛滥,对于尚且稚嫩的AI生态本身而言有着极大的伤害,因此有识之士也纷纷站出来疾呼。谷歌DeepMind的首席商务官Colin Murdoch就表示,督促AI开发者专注于构建一个“强大而负责任”的社群。只是想要遏制AI应用的开发者违规挖掘用户数据,还得应用商店加强审核才行。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-03 18:45:32

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

华为等企业正在致力于通过创新科技打造“坚固之盾”
...游子即将归乡,在回家团聚的兴奋之余,春节期间的个人隐私保护更要提起重视。除了大众自身提高信息安全意识之外,保护个人隐私安全需要多方合力。华为等企业正在致力于通过创新科技打造“
2024-01-28 10:47:00
苹果称applemaps隐私漏洞并未影响iphone
巴西记者RodrigoGhedin于本月初报道称,AppleMaps存在一个隐私BUG,可以在未经用户许可的情况下,允许App收集用户位置数据
2023-02-11 21:19:00
36氪研究院 | 2023年中国隐私计算行业洞察报告
...痕迹和联系方式呢?没错,这就是我们生活中常见的数据隐私滥用现象,315晚会也曝光过有关个人信息数据买卖的黑色产业链。无独有偶,近年来数据滥用、数据隐私保护不利等现象频发,涉及
2023-03-15 08:25:00
苹果Vision Pro上线,可穿戴设备会带来更深层隐私焦虑吗?
...士传递出对其复杂的传感器所收集的大量数据带来的个人隐私风险的担忧。这款搭载两个深度传感器、12个摄像头和6个麦克风的头显,相比较于传统的智能设备,其带来的隐私安全风险有哪些变
2024-02-07 11:44:00
手机安全新突破!OPPO Find N3带来国密芯片级保护
...层安全到数据安全,再到支付应用安全,为用户提供最强隐私保护芯片锁的安全保护体验。FindN3通过全新安全解决方案,可实现“芯片锁万物”,如文件锁防破解、生物信息锁防盗用、丢失
2023-10-23 20:42:00
“联盟智能”:共享大数据“思想”
...性、适应性不高等“瓶颈”。要保障用户数据的安全性和隐私性,同时让人工智能模型有尽可能多的数据训练,联盟智能便成为解决问题的有效途径。它可以在各单位不交换“苹果”的情况下共享“
2023-08-07 03:24:00
苹果ceo担忧meta的隐私问题
...(TimCook)过去也多次批评Facebook的商业模式,苹果甚至将隐私称作一项“人权”。通过Meta最近的财报及其对效率和成本的重视不难看出
2023-02-17 14:10:00
【科学的温度】聂再清:AI时代,把更多决策权还给个人数据主权方
...看?Web3.0时代正在到来,人工智能应用越来越广泛,个人隐私数据和信息泄漏问题随之而来。隐私被泄漏,该找谁?如何做好数据保护和管理?人工智能被恶意使用,责任归属如何划定?就
2022-12-21 19:24
新技术带来隐私挑战,百度、蚂蚁、抖音等呼吁协同治理
大模型等新技术不断涌现,这给隐私保护带来哪些风险和挑战,企业该如何做好隐私保护工作?9月8日,百度、抖音集团、荣耀、众安在线、蚂蚁集团的隐私保护和合规方面的负责人在2023外滩大
2023-09-09 18:12:00
更多关于科技的资讯: