青岛网站建设公司,青岛网站制作公司-奈薇建站网
建站咨询热线:0532-8878113115166683288 
知识普及 » 如何防止网站被采集

如何防止网站被采集

奈薇建站网 2009-10-23 17:32发表
阅读次数 4000

  采集就是使用程序通过自动化操作复制数据。


  首先说明,只要是能让浏览器访问的,就没有不能采集的。


  但是可以通过一定的手段让采集变得非常麻烦,进而在大量数据的情况下延迟采集完成时间,加大采集难度。


  一般的情况略过不说,几种情况比较特别的:


  1、验证来路,cookie,session这些,比如PHP可以用fsockopen自定义HTTP Header,基本上这些方法没什么效果。


  2、限速,限制某段时间内打开页面数量。这个只是推迟了下,大部分时间效果一般。比如某站限制一分钟之内只能打


  开30个网页,页面大小平均30K,则用迅雷批量下载就OK了,设置限速为2K,一觉醒来什么都好了。这个方法效果也基


  本没有。


  3、比较特别的方法,设置一个数量级的阀值,达到这样数量后,必须验证方能继续,比如打开10个页面需要输入验证


  码,这个时候只需要保证验证码不可识别,分配一个session,以后的浏览过程中用session保证用户合法性,这样不影


  响后续访问,同时可以有效防止采集。


  4、第三条对蜘蛛是致命的,此时可通过手机蜘蛛IP段,放行,其它的按照严格规则来。


  5、3+4真是无敌的吗?远非可以高枕无忧,比如此站有10万个页面,则设置100个代理,在阀值前循环使用代理,这样实


  际上绕过了3的限制。


  6、还有别的办法吗?不能,因为你的网站能用浏览器打开。


  7、另外的方案,开发专有浏览器,专有数据加密。


  8、社会工程学来说,进行知识产权保护,让采集的风险远大于成本,前提是你的数据值得你付出这么多来折腾。


  从另外的角度来说,数据并非最重要的,就像钱不如人重要。回想百多年前,你家大清帝国装备一流,也还是败的一塌


  糊涂。



如何防止网站被采集相关标签:设计网页网站设计公司网站搭建网站规划
相关热点推荐
浅谈如何设计企业网站的
企业网站制作如何留住客
青岛网站制作之SEO标
友情链接相关名字解释
网站设计2016年流行
发布网站改版时的3要3
网页设计灵感的起源地
企业建站后进行网站推广
专业建站之相关常识(二
如何防止网站被采集
网站工作者必须掌握的技
写给做BBS的新站长
搜索引擎优化教程之链接
视觉层次感提升网页设计
建站的数据及信息的整合
大型企业网站存在的问题
网站制作的要领下
建设营销型网站有什么注
网页设计技巧系列之二浅
留住访客如何最优化设计
如何做一个有特色的网站
搜索引擎是如何判断新闻
企业建设网站前的准备工
网站颜色在网站建造策划
做网站到底是什么个概念
如何利用微信高级接口?
戴着锁链跳舞
建站事项2
用户体验影响客户信任值
企业建站如何才能够赚钱
浅谈网站策划运营的方方
图片上下循环滚动的公告
网站优化站内很重要
中小企业如何进行网络营
标题、描述和关键词的选
如何改变企业网站优化弊
关于网站排名的基本原则
上网行为管理如何实现上
SEO网站内容优化的重
做网站大局只有两点;歧
奈薇建站网青岛网站建设公司/青岛网站制作公司,专业提供"气质"型网站建设及精美网站制作服务,同时欢迎各地网站建设公司、网站制作公司代理我们的奈薇建站系统共同发展

热点地区:青岛网站建设价格 青岛即墨网站制作公司 开发区信息港 山东在线门户
建站咨询热线0532-88781131 15166683288 18562723728
版权所有© BangJianZhan.Com & Nev.Cn 青岛网站建设/网站制作公司
青岛雨后网络科技有限公司 - 青岛市市北区福州北路90号,景泰尚都6层
已经为您服务了
213个月 4