一步之遥即深渊：爬虫有罪？_叩富网

立即提问“ ”

提问

北京[切换城市]

股票开户 | 期货开户

叩富问财>资讯>其他>一步之遥即深渊：爬虫有罪？

一步之遥即深渊：爬虫有罪？

发布时间：2019-11-5 10:57阅读：561

资深期货投顾期货

帮助3.5万好评2385 入驻6年

问一问

文 | 徐磊石冉冉金融科技微洞察

经授权发布

640?wx_fmt=gif&tp=webp&wxfrom=5&wx_lazy=1

随着互联网技术的日益发展，新型法律纠纷也层出不穷。其中，“爬虫”的法律边界一直是互联网争议的热点，尤其是在大数据时代，随着内容数据价值的日益凸显，爬虫所引发的个人隐私和商业数据侵权案件也越来越多。自今年9月6日开始，多家互联网金融大数据公司迎来风波。据媒体报导，多家大数据公司被调查，相关爬虫业务也已停止。一时间，整个行业风声鹤唳。而且，据媒体报道，央行近日已将《个人金融信息（数据）保护试行办法》的初稿下发到各家银行征求意见，进一步强调保护个人信息。究竟什么是爬虫？它面临着什么法律风险？国内外对此的司法处理原则是什么？本文将简要讨论这几个问题。爬虫的概念、类别和风险

最初的爬虫就像是一个搜索探测器，按照指定规则，通过遍历网络内容的方式，搜集、提取所需的网页数据，被技术人员储存或重新加工。我们每天使用的各大搜索引擎，其实就是利用了爬虫技术。它扒取互联网上的所有网站信息，整理好信息索引，提供给其他用户进行快速搜索和访问。发展至今天，爬虫所获得的信息多种多样，不仅扒取互联网网站上的信息，在不同场景下还扒取公民身份、电信、出行、社交、电商、银行记录等多个维度的数据。

从数据来源渠道分，爬虫可分为网页爬虫和接口爬虫。网页爬虫是根据网页上的超链接进行遍历，扒取网页的数据信息，最常用于搜索引擎。这是早期的一类爬虫。在大数据时代，新型的接口爬虫则是通过精准构造特定 API 接口的请求，来获得所需数据信息[1]。从数据访问权限分，爬虫行为可以分为4种逐渐演变的类型。最早的爬虫属于前两类，现在争议最为热门的则是第三、四类[2]。

第1类：完全公开信息爬虫。网站面向公众开放，无需登录身份验证即可访问。爬虫通过浏览网站，能够获取完全公开的信息。
第2类：附加协议的完全公开信息爬虫。网站虽然面向全体公众开放，无需登录验证即可访问，但网站设置了协议，明确禁止爬虫行为。
第3类：需登录一般账号访问公开信息的爬虫。网站面向不特定的公众开放注册，用户注册账号登录后可访问自己账号的信息和网站披露信息。爬虫公司就通过批量注册账号或得到用户授权委托，进入网站或特定设备扒取数据。
第4类：需登录特定账号访问公开信息的爬虫。网站面向需验证身份的特定人群开放注册，用户注册账号登录后可访问自己账号的信息和网站披露信息。爬虫公司借用授权账号登录，进入网站或特定设备扒取数据。

目前引起问题的爬虫公司往往是后两类。它们在网站或App上获得用户在注册协议、隐私协议中自觉或无意的授权后，就利用授权信息登录网站或接入API，获取用户个人数据以及网站数据。有些爬虫甚至具备突破网站本身设置的控制能力，获取被保护的数据。这些非完全公开、涉及用户隐私和网站商业信息的数据正是爬虫的危害来源。

非法爬虫会威胁到保存在网站服务器上的用户个人和互联网服务提供商数据，从而侵犯用户隐私和服务提供商的商业信息，会带来法律风险。在实际商业世界中，大量的案件都围绕爬虫者侵犯商业数据、形成不当竞争有关。

爬虫管制的美国司法原则演变

各国法院对于爬虫的态度相差不大，其基本原则可以归纳为：首先要获得爬虫协议授权，无授权则违法；其次，协议未禁止的行为，就不受法律保护；再次，协议本身也必须满足正当竞争要求，不能设置不合理协议。这些原则在多年的立法和司法实践中得以发展，不论是对协议还是对所谓“正当竞争”的定义和理解都经历了变迁。美国在这个方面的司法实践一直走在前头。

为了维护网站的正常运营，免遭爬虫攻击瘫痪，并避免爬虫抓取敏感信息，早期的爬虫法律界线以网站爬虫协议为准绳。1994年，大部分互联网公司以及互联网爱好者们就达成了共识，撰写了一份Robots协议（Robots Exclusion Protocol，又称“爬虫协议”），以文本文件（.txt）的形式放在网站的根目录下。网站通过Robots协议告诉搜爬虫，哪些页面可以抓取，哪些页面不能抓取。每当爬虫访问一个站点时，它会检查该站点根目录下是否有爬虫协议。站点通过协议对爬虫软件进行约束，告诉使用者哪些数据可以抓取。即便如此，爬虫协议仅仅只是一个协议，是保护网站数据和敏感信息的互联网道德规范，却不是强制性法律或程序设置，所以并非所有爬虫均会遵守该标准。在真正发生纠纷诉讼时，还需要考虑在数据获取过程中，是否侵犯及多大程度侵犯了数据属主及其代理人的利益。

爬虫协议面世25年后，今年7月，Google发布了最新的互联网公约，其中就包括了新的爬虫协议，提交给了国际互联网工程任务组（Internet Research Task Force , IETF）。新的协议没有改变原本协议的实质原则，但进一步修正规范了爬虫行为，比如新协议适用于除了Http协议外的其他网络协议，规定了协议的解析和匹配场景，且如果网站因为服务器故障而无法读取爬虫协议时，任何读取行为都是不被允许的。Google新的协议规范了现代互联网中的爬虫行为，一旦被IETF认可，将会变成最新的国际准则并被法律所认可。

但协议不是万能的，即使网站设置了协议，这个单方面协议也有可能对爬虫者没有法律效果。美国一直以《1986年计算机欺诈与滥用法》（Computer Fraud and Abuse Act of 1986，CFAA）为主要法理依据，规定若“未经授权故意访问或超过授权访问权限，从任何受保护的计算机获取信息”，那么法官就有可能根据CFAA判决爬虫侵权违法，关键词在于“未经授权”、“超过授权访问权限”和“受保护的计算机”[3]。“授权”就包括明示的爬虫协议、用户协议、告知条款等和暗示的用户登录密码等。早些年的若干个案例中，“未经授权”或“超过授权访问权限”一度是爬虫判决的准绳，爬虫公司很难胜诉。

案例1 EarthCam,Inc.vs. OxBlueCorp[4]

EC和OxBlue都是经营影像器材和解决方案的公司。EC的一个用户将自己账户密码给了OxBlue公司，希望经营类似业务的OxBlue能帮忙解决一些技术问题。后者登录了该账户密码，并抓取EC社群论坛上的大量图片等其他信息。EC控诉至法院。

法官最后还是支持了EC，判决意见是虽然CFAA并没有明确规定用户不得与他人共享账户信息，但是EC网站上明确声明出借账户信息违反了其”使用条款“。这属于CFAA认定的”超出权限“——网站只授权给当事人使用，其他人用当然超出了权限。但是，2017年hiQ公司与LinkedIn公司之间的诉讼案判决以爬虫公司的胜诉对此类案件产生了标志性的影响。

----

案例2 hiQ Labvs. LinkedIn[5]

hiQ Lab公司的主营业务就是利用爬虫从LinkedIn网站上获取公开的求职者数据，帮助企业分析和管理人力资源，招致LinkedIn的不满并采取技术反制，于是hiQ将LinkedIn告上法庭。法院令人意外地裁决了爬虫公司胜诉，原因有3条：第一，法庭认为在网站上公开的信息不是CFAA法条中阐明的“受保护的计算机”，所以没有违反CFAA，将对CFAA的解释重心从传统的“未经授权”延伸至“未经允许访问受保护的计算机”。换句话说，法院认为hiQ是上文所述的前两类爬虫，扒取的是社交媒体的公开信息。第二，根据加州反不正当竞争法（California’sUnfair Competition Law），LinkedIn将它在在职场社交领域的竞争优势转移到职场数据分析领域，是不正当的竞争行为，从而支持了hiQ公司。第三，美国最高法院最新裁定社交媒体类似于一个“现代公共广场”，用户在LinkedIn上的信息相当于公共场所言论，由此根据加州宪法对言论自由权的保护，hiQ声称LinkedIn不能限制别的公司去获取这些相当于“言论”的信息[6]。

尽管这个案件仍然有很大争议，在互联网界引起关于数据权的震动[7]，该案件表明美国司法界对爬虫侵权违法问题有了更深入的认识，不再一味保护数据被扒取的一方，而从数据信息的本质上思考。数据是否公开、独占性和价值有多大等，关系到各方的合法权益，

温馨提示：投资有风险，选择需谨慎。

资深期货投顾

当前我在线

期货期权诚信开户，低手续费保证金，您的期货期权投资助手，专业

一对一咨询

文章很精彩？转发给需要的朋友吧

版权及免责声明：本文内容由入驻叩富问财的作者自发贡献，该文观点仅代表作者本人，与本网站立场无关，不对您构成任何投资建议。用户应基于自己的独立判断，自行决策投资行为并承担全部风险。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至kf@cofool.com 举报，一经查实，本站将立刻删除。

推荐相关阅读查看更多>

手机怎么买股票？这里一步一步教学

你好，很高兴为您答疑解惑，在手机上购买股票的过程相对简单，但首先需要确保你已经在一家证券公司开户并完成了相关的身份验证。以下是在手机上购买股票的步骤：1.下载证券公司的交易软件：根据你所在的证券...

理财师马经理

拜登距离大选胜利仅一步之遥，金价重新站上1900美金/盎司，后续空间是否更大，怎么开户做现货黄金？

早几天就说过了，如果拜登当选总统，黄金下跌；如果特朗普当选，黄金上涨。果不其然，拜登胜，昨晚黄金大跌，美元大涨，股指期货大涨。影响黄金波动的因素主要有以下三个方面：1、避险2、美元3、供求关系【...

高级顾问金陵

手机买股票，一步一步怎么操作？

您好，手机买股票需要开通股票账户后进行的，开户后第二个交易日就可以进行投资，想要办理开户建议您可以先跟线上客户经理进行沟通，让客户经理给您开通一个低佣金账户，还有客户经理对您的一对一专属指导，非...

资深顾问王

开户怎么开，能一步一步交吗

你好，广发证券开户流程支持线上手机自助开户，专属顾问一对一陪伴式服务解答使用过程中的问题也可以一步一步详细为你解答开户流程，欢迎点击上方头像进入页面在线联系客服微信咨询了解，广发证券开...

广发证券客服

等待2638！一步之遥！

今日市场低开低走，上周五尾盘因科技股和次新股砸盘之后今天两大板块同样继续调整，次新股科锐国际创投股东清仓似得减持，引发连锁反应导致次新股跌停潮，今天的次新股依旧是跌停潮。明日注意主板继续往下破，一般三角形收敛收盘的时候跌破，很容易超跌2638点而去，上周有跌破2653，但是持续被蓝筹大盘股护盘回去，今天算是跌破，明天2638点就要破了，大家拭目以待。看看破了之后有没有小幅资金来抄，一般在双节前，市场会持续弱势缩量行情为主。成交量今天主板不到900亿，两市加起来才2000亿而已，可见盘面如一潭...

一步之遥即深渊：爬虫有罪？

随着互联网技术的日益发展，新型法律纠纷也层出不穷。其中，“爬虫”的法律边界一直是互联网争议的热点，尤其是在大数据时代，随着内容数据价值的日益凸显，爬虫所引发的个人隐私和商业数据侵权案件也越来越多。自今年9月6日开始，多家互联网金融大数据公司迎来风波。据媒体报导，多家大数据公司被调查，相关爬虫业务也已停止。一时间，整个行业风声鹤唳。而且，据媒体报道，央行近日已将《个人金融信息（数据）保护试行办法》的初稿下发到各家银行征求意见，进一步强调保护个人信息。究竟什么是爬虫？它面临着什么法...

资深期货投顾

上一篇资讯：

聊聊期货的中长线趋势交易：抓取利润必先跟对趋势！

下一篇资讯：

别把长牛逻辑当做死扛的借口

TA的文章全部>

TA的回答全部>

优选券商更多>

民生期货

券商控股，保证金比例低

预约

方正中期期货

市场口碑好、实力认证、品质服务

开户

中信期货

安全可靠、极速开户、品质服务

提问

中衍期货

首都老牌期商，1v1服务

预约

华融融达期货

极速开户、实力认证、市场口碑好

提问

西南期货

券商控股、国资背景、保证金灵活

开户

创元期货

市场口碑好、品质服务、安全可靠

预约

热点推荐

中信证券现在可以买黄金吗？有人知道吗？
2025-11-10 09:49
一文搞懂【量子科技】产业链（附上中下游上市公司名单）
2025-11-10 09:49
小白必看：红利指数、红利指数基金、红利类ETF分别是什么？
2025-11-10 09:49

回到顶部

关于叩富问财/ 股票开户/ 期货开户/ 期货答主/ 股票答主/ 保险答主/ 炒股大赛

理财有风险，投资需谨慎

免责声明:本站问答内容均由入驻叩富问财的作者撰写，仅供网友交流学习，并不构成买卖建议。本站核实主体信息并允许作者发表之言论并不代表本站同意其内容，亦不代表本站对该信息内容予以核实，据此操作者，风险自担。同时提醒网友提高风险意识，请勿私下汇款给作者，避免造成金钱损失。点击查看全部>

App下载商务合作网站地图最新内容城市索引全国答主排行证券公司索引期货公司索引

公众服务

微信服务，随时可得，扫码一键关注

叩富问财

问一问，财不偏
30秒问财/秒答

叩富网销学苑

网络获客培训
分享获客经验

叩富简投

模拟交易/有奖大赛
ai炒股机器人/炒股百宝箱

联系我们

客服热线：010-59490342

客服咨询

入驻认证咨询
券商合作用户咨询/有奖炒股大赛咨询

意见反馈不良信息举报电话：010-59490342 举报微信：524272835 网站法律顾问叩富网2008年被上海证券交易所选为年度投资者教育训练网站 | 国家高新技术企业

ICP备案：京ICP备18019099号-3 增值电信业务经营许可证京B2-20241016 广播电视节目制作经营许可证：（京）字第18189号经营许可证编号：京B2-20190488 京公网安备：11010802032515号
叩富网版权所有 © 2007-2025