• 我的订阅
  • 科技

能够弥补现行法律规制爬虫的滞后性

类别:科技 发布时间:2024-01-24 01:46:00 来源:每日看点快看

本文转自:法治日报

饶传平谈利用基于风险的方法规制数据抓取——

能够弥补现行法律规制爬虫的滞后性

能够弥补现行法律规制爬虫的滞后性

江西财经大学法学院饶传平在《东方法学》2023年第6期上发表题为《论数据抓取法律风险的流程化管理》的文章中指出:

网络爬虫能够高效收集所需数据,是释放数据价值的重要技术手段,在各行业不同场景中得到广泛应用。与此同时,由于缺少对正当爬虫的引导与对不法爬虫的规制,恶意使用爬虫侵害他人合法权益或公共利益的行为屡见不鲜。目前,对爬虫抓取数据的立法规制呈现部门化、碎片化倾向,无法应对不法爬虫更新快、具有不确定性和复杂性等技术特点,由此导致司法实践中只能生搬硬套地将相关法律适用范围延伸至网络治理领域,难以起到良好的治理效果。

就法律而言,网络爬虫是一种能够自动化收集并存储数据的技术。规制不法爬虫技术的有效途径是引入“基于风险的方法”。该方法的本质是对技术复杂性和风险多样性的规制,并在实质上为爬虫的合法性划定一条新边界,要求数据处理者基于风险的方法形成有效的自我合规模式,监管者则应基于风险的方法制定标准和监管体系。利用该方法规制数据抓取技术具有正当性与可行性:基于风险的方法能够弥补现行法律规制爬虫的滞后性;能够针对不法爬虫行为隐蔽性的特征,更加公平合理地分配数据处理风险;能够将爬虫可能造成的不确定的损害转化为确定性的合规行为,将损害的无形性、不可控性、隐蔽性转化为合规行为的可操作性。

通过归纳既有司法判例,并对不同数据抓取行为构建流程化的风险场景识别框架,将其划分为禁止行为、高风险、中风险、低风险或无风险四个风险等级,数据处理者对风险不同的技术措施予以不同的关注和合规措施,监管者同样应基于数据处理行为风险的高低予以不同的监管力度。该种“基于风险的方法”与我国数据安全法第二十九条规定开展数据处理活动应当加强风险监测的方法相吻合,可以为数据处理者和监管者提供一个具体的风险管理指南,不仅为企业提供具有引导性、可操作性的数据抓取规则和合规目标,对可预期的法律风险进行动态的防范与控制,也使行政机关能够对风险较大的抓取行为进行全阶段的有针对性监管,以提高行政效能。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-01-24 05:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...型的升级依靠海量的公开数据,而科技公司大多通过网络爬虫来获取用户数据。但这个过程并不一定被用户、网站所有者所允许。8月8日,OpenAI推出了一款名为GPTBot的网络爬虫机
2023-08-08 17:40:00
...部分内容通常也难以做到百分百的准确授权;三是利用“爬虫”技术爬取的网络信息,这也是生成式人工智能技术最常用的数据收集手段,其爬取的内容受网络爬虫协议条款约束,应视其具体使用目
2023-10-11 07:42:00
为训大模型不择手段的 AI 公司,打破了这个古老的互联网协议
...是一个文本文件,每个网站都用它来说明自己是否愿意被爬虫抓取。30 年来,一直是它,让互联网不至于在混乱中运行。不过这个规则能长久运行其实纯靠一个人性逻辑——你让搜索引擎抓取你
2024-02-20 15:28:00
一键屏蔽 AI 模型爬虫机器人,Cloudflare 推出“防扒”网络工具
... 月 26 日消息,网络服务商 Cloudflare 本周推出一系列防 AI 爬虫的工具,包括可查看 AI 爬虫具体活动的 AI Audit 和一键屏蔽所有 AI 爬虫的 Block AI Scrapers and Crawlers
2024-09-27 09:48:00
OpenAI 现允许网站阻止其网络爬虫抓取数据
...题,OpenAI最近推出了一个新功能,让网站可以阻止其网络爬虫(webcrawler)从其网站上抓取数据训练GPT模型
2023-08-08 16:36:00
Claude团队引众怒,为爬数据不择手段,给爬虫改名字无视禁止规则
...因:24小时内访问某公司服务器100万次,以不付费形式,爬虫抓取网站内容。不仅明目张胆无视了“禁止爬取”的公告,还强行占用了服务器资源。这家“受害者”公司其实尽力防御了,但阻
2024-08-01 09:35:00
斯坦福AI虚拟小镇开源;英伟达再推超级芯片;OpenAI发布爬虫机器人 | 本周硅谷发生了什么?
...H200,主要面向大模型和生成式AI。OpenAI则发布了一款新的爬虫机器人,但用户可以选择自己的数据是否被用于模型训练
2023-08-14 15:59:00
好学编程:编程0基础,应当如何开始学习 Python?
...、选择发展方向这个就看你需求了,web开发、数据分析、爬虫开发等等,他们要求的技能是不一样的,学习路线也不一样。路线一
2022-12-29 10:00:00
遭泄露的知名企业家信息“全网最早出现时间”如此集中,究竟谁干的?技术专家揭秘
...前主要用的是大数据+超链分析技术。这两种技术是基于爬虫的目前最先进的数据整合分析技术。”什么是大数据+超链分析技术?喻波告诉每经记者,大数据+超链分析技术运用类似传统爬虫技术
2024-05-30 10:19:00
更多关于科技的资讯: