• 我的订阅
  • 科技

一键屏蔽 AI 模型爬虫机器人,Cloudflare 推出“防扒”网络工具

类别:科技 发布时间:2024-09-27 09:48:00 来源:IT之家

IT之家 9 月 26 日消息,网络服务商 Cloudflare 本周推出一系列防 AI 爬虫的工具,包括可查看 AI 爬虫具体活动的 AI Audit 和一键屏蔽所有 AI 爬虫的 Block AI Scrapers and Crawlers。站长们可以部署相关服务,从而防止自己网站的内容被用于训练 AI 的机器人爬虫扒取。

IT之家注:爬虫是一种自动化的程序,可以在互联网上搜索和获取信息,目前许多厂商使用相关爬虫扒取各大网站信息用于训练 AI 模型,相关爬虫容易导致被扒网站产生大量异常流量,为此站长需支付高昂的网络带宽费用,同时也容易导致网站上大量原创 / 隐私内容泄露。

Cloudflare 推出的相关工具主要利用签名比对、启发式算法、机器学习和行为分析技术来辨别爬虫,用户可以查看 AI 爬虫的各种行为,包括爬虫类型、访问频率和扫描内容,站长还可以按照需要放行“善意的 AI 机器人”抓取信息(此类“善意的 AI 机器人”主要寻找网站的 robots.txt来获取信息,通常不会对网站本身产生异常流量,也不会将网页所有数据直接用于全盘训练模型)。

一键屏蔽 AI 模型爬虫机器人,Cloudflare 推出“防扒”网络工具

如果不确定如何处理这些 AI 爬虫,站长们也可以使用 Block AI Scrapers and Crawlers 功能,一键屏蔽所有 AI 爬虫。

一键屏蔽 AI 模型爬虫机器人,Cloudflare 推出“防扒”网络工具

互联网为许多大语言模型(如 OpenAI 的 GPT 模型和谷歌的 Bard)提供了大部分的训练数据,如今许多厂商为了刷自家 AI 模型分数,大肆通过网络爬虫“拿来式”地获取训练数据,从而让本应你情我愿的行为变得“污名化”,各大网络商直接推出此类禁用 AI 爬虫的服务也在意料之中。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-27 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

为训大模型不择手段的 AI 公司,打破了这个古老的互联网协议
...这里面可能根本不承认有你存在。在互联网发展的早期,机器人有很多名字:蜘蛛、爬虫、蠕虫、网蚁、网络爬虫。大多数时候,这些名字都出于好意。通常抓取数据是开发人员为了给一个新网站建
2024-02-20 15:28:00
Claude团队引众怒,为爬数据不择手段,给爬虫改名字无视禁止规则
...了iFixit的防御。iFixit其实成功阻止了两个Anthropic的AI抓取机器人,分别名为“ANTHROPIC-AI”和“CLAUDE-WEB”
2024-08-01 09:35:00
「AI数据荒」雪上加霜!MIT:网页数据的公开共享正走向衰落
...研究方法通常来说,限制网页爬虫的措施有以下两种:- 机器人排除协议(Robots Exclusion Protocol
2024-08-14 09:40:00
...来越多的科技和媒体公司开始要求支付费用,希望从聊天机器人的热潮中分一杯羹。翻译内容如下:如果你曾在博客上发表过文章、在Reddit上发布过帖子,或在开放网络上分享过任何内容,
2023-05-01 09:29:00
斯坦福AI虚拟小镇开源;英伟达再推超级芯片;OpenAI发布爬虫机器人 | 本周硅谷发生了什么?
...主要面向大模型和生成式AI。OpenAI则发布了一款新的爬虫机器人,但用户可以选择自己的数据是否被用于模型训练。ChatGPT强敌Claude本周上新了“平替版”Claude Instant 1
2023-08-14 15:59:00
...者所允许。8月8日,OpenAI推出了一款名为GPTBot的网络爬虫机器人,用于收集训练AI模型所需的数据信息。传闻OpenAI将利用这些数据升级GPT-4和其他大语言模型(如可能即将推出的GPT-5和开源的G3PO)
2023-08-08 17:40:00
围攻谷歌!Meta秘密训练AI搜索引擎8个月,苹果与OpenAI发力
...在秘密研发一款自己的AI搜索引擎,旨在提升其Meta AI聊天机器人的搜索能力,并减少对谷歌和微软两大科技巨头的依赖。据报道,该项目已经持续了8个月,目标是为Meta AI聊
2024-10-30 09:51:00
一文详解AIGC:忘记概念,只聊落地
...答、翻译等。IBM Watson Assistant:用于构建虚拟助手和聊天机器人的工具,支持多种语言和平台。Google Cloud Natural Language
2023-06-10 15:00:00
...智思享会」上,豆神教育重点分享了全新硬件产品“学伴机器人”。该产品集课业辅导、智能批改、百科问答、生活管家等功能于一体,依托百度智能云文心大模型4.5、生图模型以及看图识万物
2025-09-13 15:22:00
更多关于科技的资讯:
新华社记者 阳娜“老粉路过,点赞反馈”“不饿不动,瘦了十几斤”“产品很牛,这次是来回购”……可曾想,活跃在直播间屏幕上的这些弹幕
2026-01-22 11:36:00
瑞幸云南咖啡豆专列发车,中国咖啡行业驶入“精耕细作”时代
进入咖啡产季的云南,空气中都弥漫着一种成熟的气息,不仅来自于缀满枝头的红果,更来自于咖啡产业的红火兴旺。咖啡鲜果据云南省农业农村厅刚刚发布的最新数据
2026-01-22 11:36:00
Soul发布《2025年度生态安全报告》,8万余名用户共建网络清朗空间
在数字浪潮滚滚向前的今日,社交平台已不再仅仅是信息的交互场,更是情感的链接地与精神的寄托所。然而,虚假宣传、网络诈骗、语言暴力等阴影
2026-01-22 12:06:00
从牧场到餐桌全链把控,认养一头牛打造“新国民品牌”范式
近年来,中国乳业正经历一场深刻变革。从规模扩张转向品质升级,从粗放式管理迈向精细化运营,行业新规的出台与消费者需求的迭代
2026-01-22 11:34:00
不止计时,更是地标:厦门帕瑟尔以科技与美学重构塔钟价值
在城市天际线中,一座塔钟不仅是时间的指示器,更是文化、秩序与美学的象征。然而长期以来,我国塔钟行业面临“重功能、轻设计”“精度不足
2026-01-22 13:08:00
国务院新闻办公室1月21日上午举行新闻发布会,工业和信息化部介绍2025年工业和信息化发展成效有关情况,并答记者问。全国所有乡镇以及95%的行政村已通5G在移动网络方面
2026-01-22 08:12:00
1月21日,市场监管总局召开专题新闻发布会,通报了2025年综合整治“内卷式”竞争十大典型案例。十大案例中,首案为公开约谈货拉拉
2026-01-22 08:13:00
2025年12月底,全国多家头部家装企业密集推出“资金存管”业务,在行业掀起了一股加强资金安全的新风。资金存管模式在互联网金融
2026-01-22 08:13:00
能治疗癌症的CAR-T细胞疗法有了“国家级说明书”!
大河网讯 你听说过用“特种兵”免疫细胞(CAR-T细胞)来精准打击癌症吗?日前,由郑州大学第一附属医院生物细胞治疗中心牵头编制的《CAR-T细胞疗法临床应用技术规范》《CAR-T
2026-01-22 10:08:00
杭州日报讯 从全球大火的游戏到艺术展再到专门的衍生品零售店,杭州出品的“黑神话”IP的每一场活动都引发了粉丝的关注。这个周末(1月23日-25日)
2026-01-22 08:19:00
日前,太重智能高端装备产业园区的厂房内一片欢腾。由企业自主研发的智能轴承,成功应用于大型电铲并顺利完成厂内模拟测试,各项性能指标均优于设计标准
2026-01-22 07:03:00
最近有件事儿越来越常见:外国人不光来中国旅游,还专门“打飞的”来看病。不是出于好奇体验,而是真心觉得值!值在哪儿?三个字
2026-01-21 21:52:00
中新经纬1月21日电 广东省政府网站21日公布《广东省人工智能赋能交通运输高质量发展若干政策措施》(下称《政策措施》)
2026-01-21 20:20:00
织金平远公司完成 500kVⅡ 组母线母差保护装置校验及传动
多彩贵州网讯(通讯员 史凡莉)近日,织金平远公司厂区内,500kVⅡ组母线设备区域一派忙碌景象。电热检修部与发电运行部工作人员有条不紊地开展母差保护A屏
2026-01-21 17:15:00
九阳太空厨房已安全稳定运行超1500天
中国消费者报报道(记者桑雪骐)航天员们如何健康、舒适地展开太空生活和吃好一日三餐,是大家都很关心的话题。据了解,这背后其实有一个我国自主研制的太空厨房
2026-01-21 18:05:00