• 我的订阅
  • 科技

一键屏蔽 AI 模型爬虫机器人,Cloudflare 推出“防扒”网络工具

类别:科技 发布时间:2024-09-27 09:48:00 来源:IT之家

IT之家 9 月 26 日消息,网络服务商 Cloudflare 本周推出一系列防 AI 爬虫的工具,包括可查看 AI 爬虫具体活动的 AI Audit 和一键屏蔽所有 AI 爬虫的 Block AI Scrapers and Crawlers。站长们可以部署相关服务,从而防止自己网站的内容被用于训练 AI 的机器人爬虫扒取。

IT之家注:爬虫是一种自动化的程序,可以在互联网上搜索和获取信息,目前许多厂商使用相关爬虫扒取各大网站信息用于训练 AI 模型,相关爬虫容易导致被扒网站产生大量异常流量,为此站长需支付高昂的网络带宽费用,同时也容易导致网站上大量原创 / 隐私内容泄露。

Cloudflare 推出的相关工具主要利用签名比对、启发式算法、机器学习和行为分析技术来辨别爬虫,用户可以查看 AI 爬虫的各种行为,包括爬虫类型、访问频率和扫描内容,站长还可以按照需要放行“善意的 AI 机器人”抓取信息(此类“善意的 AI 机器人”主要寻找网站的 robots.txt来获取信息,通常不会对网站本身产生异常流量,也不会将网页所有数据直接用于全盘训练模型)。

一键屏蔽 AI 模型爬虫机器人,Cloudflare 推出“防扒”网络工具

如果不确定如何处理这些 AI 爬虫,站长们也可以使用 Block AI Scrapers and Crawlers 功能,一键屏蔽所有 AI 爬虫。

一键屏蔽 AI 模型爬虫机器人,Cloudflare 推出“防扒”网络工具

互联网为许多大语言模型(如 OpenAI 的 GPT 模型和谷歌的 Bard)提供了大部分的训练数据,如今许多厂商为了刷自家 AI 模型分数,大肆通过网络爬虫“拿来式”地获取训练数据,从而让本应你情我愿的行为变得“污名化”,各大网络商直接推出此类禁用 AI 爬虫的服务也在意料之中。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-27 11:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

为训大模型不择手段的 AI 公司,打破了这个古老的互联网协议
...这里面可能根本不承认有你存在。在互联网发展的早期,机器人有很多名字:蜘蛛、爬虫、蠕虫、网蚁、网络爬虫。大多数时候,这些名字都出于好意。通常抓取数据是开发人员为了给一个新网站建
2024-02-20 15:28:00
Claude团队引众怒,为爬数据不择手段,给爬虫改名字无视禁止规则
...了iFixit的防御。iFixit其实成功阻止了两个Anthropic的AI抓取机器人,分别名为“ANTHROPIC-AI”和“CLAUDE-WEB”
2024-08-01 09:35:00
「AI数据荒」雪上加霜!MIT:网页数据的公开共享正走向衰落
...研究方法通常来说,限制网页爬虫的措施有以下两种:- 机器人排除协议(Robots Exclusion Protocol
2024-08-14 09:40:00
...来越多的科技和媒体公司开始要求支付费用,希望从聊天机器人的热潮中分一杯羹。翻译内容如下:如果你曾在博客上发表过文章、在Reddit上发布过帖子,或在开放网络上分享过任何内容,
2023-05-01 09:29:00
斯坦福AI虚拟小镇开源;英伟达再推超级芯片;OpenAI发布爬虫机器人 | 本周硅谷发生了什么?
...主要面向大模型和生成式AI。OpenAI则发布了一款新的爬虫机器人,但用户可以选择自己的数据是否被用于模型训练。ChatGPT强敌Claude本周上新了“平替版”Claude Instant 1
2023-08-14 15:59:00
...者所允许。8月8日,OpenAI推出了一款名为GPTBot的网络爬虫机器人,用于收集训练AI模型所需的数据信息。传闻OpenAI将利用这些数据升级GPT-4和其他大语言模型(如可能即将推出的GPT-5和开源的G3PO)
2023-08-08 17:40:00
围攻谷歌!Meta秘密训练AI搜索引擎8个月,苹果与OpenAI发力
...在秘密研发一款自己的AI搜索引擎,旨在提升其Meta AI聊天机器人的搜索能力,并减少对谷歌和微软两大科技巨头的依赖。据报道,该项目已经持续了8个月,目标是为Meta AI聊
2024-10-30 09:51:00
一文详解AIGC:忘记概念,只聊落地
...答、翻译等。IBM Watson Assistant:用于构建虚拟助手和聊天机器人的工具,支持多种语言和平台。Google Cloud Natural Language
2023-06-10 15:00:00
...智思享会」上,豆神教育重点分享了全新硬件产品“学伴机器人”。该产品集课业辅导、智能批改、百科问答、生活管家等功能于一体,依托百度智能云文心大模型4.5、生图模型以及看图识万物
2025-09-13 15:22:00
更多关于科技的资讯:
“十五五”开局看河北|邯郸工业品,直播间里闯市场
车间变身云展厅 重卡也能“上链接”邯郸工业品,直播间里闯市场4月16日,宜邦机械科技(邯郸市)有限公司主播正在讲解紧固件产品
2026-04-17 08:04:00
当AI成为最可靠的“合伙人”,一个人也能掀起创业浪潮。随着人工智能技术的飞速发展,一种以“单人+AI工具”为核心运营模式的新型创业形态——一人公司(One Person Company
2026-04-17 07:09:00
4月15日至17日,以“服务提质”为主题的第二十六届中国零售业博览会(2026 CHINASHOP)在杭州大会展中心举办
2026-04-17 07:39:00
英特尔全球高管来杭 专程到上城喝了一杯咖啡
AlphaBot机器人正在制作咖啡4月15日下午,上城区丁兰街道西子智慧产业园迎来了英特尔全球高管一行。他们进门的第一件事
2026-04-17 07:39:00
昨天,杭州市余杭区和临平区初三年级第一次模拟考试举行。上午,语文学科先进行了测试。上午11点考试结束后,作文题目出炉:写作交流活动(50分)阅读下面材料
2026-04-17 07:39:00
眼下,杭州OPC(一人公司)创业者数量持续增长,但普遍面临诸多难题。比如缺乏固定经营场所导致准入门槛高,技术或创意出身的创业者对合规经营
2026-04-17 07:39:00
4月16日,阿里巴巴发布可实时构建和交互的世界模型产品HappyOyster(快乐生蚝)。该模型基于原生多模态架构而建
2026-04-17 07:39:00
河北新闻网讯(吴建春)4月10日至12日,国和裕华汽车园第三届樱花节在位于石家庄的园区内成功举行并圆满落幕。活动以“逐风入画樱落裕华里”暨“花漾裕华樱为有你”为主题
2026-04-16 20:17:00
斯坦福权威报告:阿里AI贡献全球第三、中国第一
4月16日消息,斯坦福大学人工智能研究所发布了最新一期《2026年人工智能指数报告》,阿里巴巴位列2025年全球顶级模型贡献榜第三名
2026-04-16 21:00:00
以标准之名,行预防之实:usmile笑容加携手中国家电协会,共启电动牙刷“精准预防”新纪元
4月10日,广州。在这个见证行业历史的时刻,usmile笑容加以一个“标准贡献者”的身份,站在了中国家用电器协会的讲台上
2026-04-16 21:06:00
江南时报讯 近日,泗洪农商银行向辖区内某企业高管成功发放80万元“金领快贷”,标志着该行针对“五高”人群的消费信贷服务实现提质升级
2026-04-16 22:14:00
AI浪潮席卷网络视听领域,低成本、高效率、量产化的AI仿真人内容快速扩张,短剧行业一度陷入“技术替代真人”的争论。在日前举办的第十三届中国网络视听大会上
2026-04-16 18:29:00
4月15日,20多位知名读书博主及抖音电商相关负责人走进人民日报社,参加由人民日报出版社、人民日报社图书馆、人民日报智慧媒体研究院主办
2026-04-16 18:58:00
摩根 Moorgen米兰旗舰店即将揭幕!沉浸式体验顶奢全屋智能美学
继三月斩获欧睿国际认证,并重磅推出“豪宅级全屋智能”品牌战略之后,中国高端智能家居领军品牌摩根(Moorgen)即将在国际设计舞台上迎来重要亮相
2026-04-16 19:46:00