a毛片毛费观看-a毛片在线-a毛片在线观看-a毛片在线免费观看-国产成人综合洲欧美在线-国产成人综合高清在线观看

始創于2000年 股票代碼:831685
咨詢熱線:0371-60135900 注冊有禮 登錄
  • 掛牌上市企業
  • 60秒人工響應
  • 99.99%連通率
  • 7*24h人工
  • 故障100倍補償
您的位置: 網站首頁 > 幫助中心>文章內容

網絡爬蟲與Web安全

發布時間:  2012/9/15 18:25:30
聯系請致電:15378720700 河南億恩科技有限公司,專注IDC服務13年,華中地區最大IDC服務商。
BGP新機房優惠活動正在進行中。。。期待您的加入。

網絡爬蟲概述

網絡爬蟲(Web Crawler),又稱網絡蜘蛛(Web Spider)或網絡機器人(Web Robot),是一種按照一定的規則自動抓取萬維網資源的程序或者腳本,已被廣泛應用于互聯網領域。搜索引擎使用網絡爬蟲抓取Web網頁、文檔甚至圖片、音頻、視頻等資源,通過相應的索引技術組織這些信息,提供給搜索用戶進行查詢。隨著網絡的迅速發展,萬維網成為大量信息的載體,如何有效地提取并利用這些信息成為一個巨大的挑戰。不斷優化的網絡爬蟲技術正在有效地應對這種挑戰,為高效搜索用戶關注的特定領域與主題提供了有力支撐。網絡爬蟲也為中小站點的推廣提供了有效的途徑,網站針對搜索引擎爬蟲的優化曾風靡一時。

傳統網絡爬蟲從一個或若干個初始網頁的URL(Universal Resource Locator統一資源定位符)開始,獲得初始網頁上的URL,在抓取網頁的過程中,不斷從當前頁面上抽取新的URL放入隊列,直到滿足系統的一定條件停止抓取。現階段網絡爬蟲已發展為涵蓋網頁數據抽取、機器學習、數據挖掘、語義理解等多種方法綜合應用的智能工具。

網絡爬蟲的安全性問題

由于網絡爬蟲的策略是盡可能多的“爬過”網站中的高價值信息,會根據特定策略盡可能多的訪問頁面,占用網絡帶寬并增加Web服務器的處理開銷,不少小型站點的站長發現當網絡爬蟲光顧的時候,訪問流量將會有明顯的增長。惡意用戶可以利用爬蟲程序對Web站點發動DoS攻擊,使Web服務在大量爬蟲程序的暴力訪問下,資源耗盡而不能提供正常服務。惡意用戶還可能通過網絡爬蟲抓取各種敏感資料用于不正當用途,主要表現在以下幾個方面:

1)搜索目錄列表

互聯網中的許多Web服務器在客戶端請求該站點中某個沒有默認頁面的目錄時,會返回一個目錄列表。該目錄列表通常包括可供用戶點擊的目錄和文件鏈接,通過這些鏈接可以訪問下一層目錄及當前目錄中的文件。因而通過抓取目錄列表,惡意用戶往往可獲取大量有用的資料,包括站點的目錄結構、敏感文件以及 Web服務器設計架構及配置信息等等,比如程序使用的配置文件、日志文件、密碼文件、數據庫文件等,都有可能被網絡爬蟲抓取。這些信息可以作為挑選攻擊目標或者直接入侵站點的重要資料。

2)搜索測試頁面、手冊文檔、樣本程序及可能存在的缺陷程序

大多數Web服務器軟件附帶了測試頁面、幫助文檔、樣本程序及調試用后門程序等。這些文件往往會泄漏大量的系統信息甚至提供繞過認證直接訪問Web服務數據的方法,成為惡意用戶分析攻擊Web服務器的有效情報來源。而且這些文件的存在本身也暗示網站中存在潛在的安全漏洞。

3)搜索管理員登錄頁面

許多網絡產品提供了基于Web的管理接口,允許管理員在互聯網中對其進行遠程管理與控制。如果管理員疏于防范,沒有修改網絡產品默認的管理員名及密碼,一旦其管理員登錄頁面被惡意用戶搜索到,網絡安全將面臨極大的威脅。

4)搜索互聯網用戶的個人資料

互聯網用戶的個人資料包括姓名、身份證號、電話、Email地址、QQ號、通信地址等個人信息,惡意用戶獲取后容易利用社會工程學實施攻擊或詐騙。

因此,采取適當的措施限制網絡爬蟲的訪問權限,向網絡爬蟲開放網站希望推廣的頁面,屏蔽比較敏感的頁面,對于保持網站的安全運行、保護用戶的隱私是極其重要的。

基于網絡爬蟲技術的Web漏洞掃描

前面提到的網絡爬蟲對網站的間接安全威脅,是通過對網絡站點的信息收集為不法份子的非法訪問、攻擊或詐騙作準備。隨著安全技術的發展,利用網絡爬蟲技術對Web漏洞的直接探測已經出現,這會直接影響到Web服務器的安全。Web服務器漏洞中,跨站腳本(Cross Site Script)漏洞與SQL注入(SQL Injection)漏洞所占比例很高,這兩種漏洞均可以通過對網絡爬蟲的改進來進行探測。由于缺乏足夠的安全知識,相當多的程序員在編寫Web應用程序時對網頁的請求內容缺乏足夠的檢查,使得不少Web應用程序存在安全隱患。用戶可以通過提交一段精心構造的包含SQL語句或腳本的URL請求,根據程序的返回結果獲得有關的敏感信息甚至直接修改后臺數據。基于目前的安全現狀,網絡爬蟲技術在Web漏洞掃描上的應用,大大提高了發現漏洞的效率。

基于網絡爬蟲技術的Web漏洞掃描大至分為如下過程:

1)頁面過濾:通過自動化的程序抓取網站頁面,對包含

等標簽的Web頁面進行URL提取處理,這些HTML標簽中包含URL信息,便于惡意用戶進行更深入的Web訪問或提交操作。

2)URL 匹配:對Web頁面中的URL進行自動匹配,提取由參數組合而成的動態查詢URL或提交URL,進行下一步的漏洞探測。如動態查詢 URL“http://baike.xxxx.com/searchword/?word=frameset&pic=1”,其中 frameset為URL中動態的參數部分,可以進行參數變換。提交URL用于把Web用戶的輸入提交到服務器進行處理,其參數多為用戶輸入,同樣可以進行參數變換。

3)漏洞試探:根據動態查詢URL或提交URL,自動在參數部分進行參數變換,插入引號、分號(SQL注入對其敏感)及 script標簽(XSS對 其敏感)等操作進行試探,并根據Web服務器返回的結果自動判斷是否存在漏洞。如“URL匹配”中的動態查詢URL可以變換成 http://baike.xxxx.com/searchword/?word= &pic=1進行跨站腳本漏洞探測。

如何應對爬蟲的安全威脅

由于網絡爬蟲帶來的安全威脅,不少網站的管理人員都在考慮對爬蟲訪問進行限制甚至拒絕爬蟲訪問。實際上,根據網站內容的安全性及敏感性,區別對待爬 蟲是比較理想的措施。網站的URL組織應該根據是否為適合大范圍公開,設置不同的URL路徑,在同一Web頁面中既有需要完全公開信息也有敏感信息時,應 通過鏈接、標簽嵌入網頁等方式顯示敏感內容,另外盡可能把靜態頁面等經評估安全性較高的頁面與安全性較差的動態頁面從URL上分開。當限制爬蟲時可以針對 URL路徑的安全性與敏感性對不同種類的爬蟲與代理進行限制。

限制爬蟲可以通過以下幾種方法實現:

1) 設置robots.txt文件

限制爬蟲最簡單的方法是設置robots.txt文件。robots.txt文件是搜索引擎爬蟲訪問網站的時候要查看的第一個文件,它告訴爬蟲程序在服務器上什么文件是可以被查看的,如設置Disallow: /,則表示所有的路徑均不能查看。遺憾的是并不是所有的搜索引擎爬蟲會遵守這個規則,因此僅僅設置robots文件是不夠的。

2) User Agent識別與限制

要對不理會robots.txt文件的爬蟲訪問進行限制,首先要把爬蟲流量與普通用戶的訪問流量進行區分,即對其進行識別。一般的爬蟲程序都可以通過其 HTTP請求中的User Agent字段進行識別,該字段使服務器能夠識別客戶使用的操作系統及版本、CPU類型、瀏覽器及版本、瀏覽器渲染引擎、瀏覽器語言、瀏覽器插件等。爬蟲的User Agent字段一般與瀏覽器的有所不同,如Google搜索引擎爬蟲User Agent字段中會有類似Googlebot的字符串,如User-Agent: Googlebot/2.1 ( http://www.google.com/bot.html),百度搜索引擎爬蟲則會有類似Baiduspider的字符串。不少Web服務器軟件如 Apache,可以設置通過User Agent字段進行訪問過濾,可以比較有效的限制大部分爬蟲的訪問。

3) 通過訪問行為特征識別與限制

對于在HTTP請求的User Agent字段刻意偽裝成瀏覽器的爬蟲,可以通過其訪問行為特征進行識別。爬蟲程序的訪問一般是有規律性的頻率比較高,區別于真實用戶瀏覽時的隨意性與低 頻率。對這類爬蟲的限制原理與DDoS攻擊的防御原理很相似,都基于統計數據。對于這類爬蟲的限制只能通過應用識別設備、IPS等能夠做深度識別的網絡設 備來實現。用網絡設備限制網絡爬蟲,不僅比較全面,而且非常適合在多服務器情況下進行統一的管理,避免多服務器單獨管理有可能造成的疏漏。

結束語

網絡爬蟲及其對應的技術為網站帶來了可觀訪問量的同時,也帶來了直接與間接的安全威脅,越來越多的網站開始關注對網絡爬蟲的限制問題。隨著互聯網的 高速發展,基于網絡爬蟲與搜索引擎技術的互聯網應用將會越來越多,網站管理員及安全人員,有必要了解爬蟲的原理及限制方法,準備好應對各種各樣的網絡爬蟲。


本文出自:億恩科技【www.ibaoshan.net】

服務器租用/服務器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經營性ICP/ISP證:贛B2-20080012
  • 服務器/云主機 24小時售后服務電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務電話:0371-60135900
  • 專注服務器托管17年
    掃掃關注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權所有  地址:鄭州市高新區翠竹街1號總部企業基地億恩大廈  法律顧問:河南亞太人律師事務所郝建鋒、杜慧月律師   京公網安備41019702002023號
      0
     
     
     
     

    0371-60135900
    7*24小時客服服務熱線

     
     
    国产无遮挡又黄又爽免费视频| 玩弄中年熟妇正在播放| 国产精品国产三级国AV| 伊人久久大香线蕉AV色| 天堂俺去俺来也WWW色官网| 麻豆人妻少妇精品无码专区2| 国产高清不卡一区二区| 中文有无人妻VS无码人妻激烈| 无码人妻精品一区二区三区蜜桃 | 亚洲成在人线在线播放无码| 人妻中字视频中文乱码| 久久97超碰人人澡人人爱| 丰满人妻熟妇乱偷人无码出轨| 幼儿HIPHOP仙踪林的功能| 无码人妻精品一区二区桃蜜| 女刑警被两个黑人挺进| 黑料吃瓜网998.SU永久有效| 成人免费看的A级毛片| 一区二区三区AV高清免费波多| 我的好妈妈中文字幕| 欧美成人精品三级又大又粗 | 亚洲 熟 图片 小说 乱 妇| 欧洲女人牲交视频免费| 九九九精品成人免费视频 | 少妇无码人妻一区二区三区| 乱码中字在线观看一二区| 国产女人18毛片水真多| 扒开双腿疯狂进出爽爽爽免费| 亚洲熟女综合色一区二区三区| 天天拽天天狠天天透| 女人18毛片A级毛片免费视频| 狠狠色噜噜狠狠狠狠色综合久AV| 成人在线高清不卡免费视频| 制服在线无码专区| 小受叫床高潮娇喘嗯啊MP3| 人人妻人人添人人爽日韩欧美| 久久理伦片琪琪电影院| 国产精品怡红院在线观看| はるとゆき温泉旅馆攻略| 夜夜躁狠狠躁日日躁2002| 洗澡被公强玩好舒服肉欲小说| 人妻人人添人人爽夜夜欢视频 | 被两个男人按住胸吃奶好爽| 一本久久知道综合久久| 香蕉尹人综合在线观看| 日本护士毛茸茸高潮| 乱人伦中文字幕在线视频| 国产在线精品国自产拍影院同性| 成人乱码一区二区三区AV| 中文日本字幕MV在现线观看 | 男男黄GAY片免费网站WWW| 狠狠精品干练久久久无码中文字幕| 绯色AV永久无码一区二区蜜臀| √天堂资源最新版中文资源最新版| 亚洲AV综合色一区二区三区| 少妇与大狼拘作爱| 欧美激欧美啪啪片SM| 久久久久久A亚洲欧洲AV冫| 国产精品乱码一区二区三| 波多野结衣av在线| 18禁黄污无遮挡无码网站| 亚洲乱码日产精品BD在线下载| 婷婷久久综合九色综合97最多收 | 亚洲美女又黄又爽在线观看| 天堂影院一区二区三区四区 | 国产亚洲欧美日韩精品一区二区| 成熟交BGMBGMBGM在线| 2021精品久久久久精品免费网| 亚洲乱色伦图片区小说| 无人区码卡二卡乱码字幕 | 大杳蕉在线影院在线播放| 99福利资源久久福利资源| 亚洲中文字幕日产乱码小说| 亚洲AⅤ无码专区在线观看Q | 极品婬荡少妇XXXX欧美| 国产精品电影久久久久电影网| А√天堂资源地址在线下载| 中国CHAIN同志GAY片国产| 亚洲国产日韩A在线播放| 无码欧精品亚洲日韩一区| 日韩精品免费一线在线观看| 欧美 亚洲 日本 成人| 久久男人AV资源网站无码| 狠狠做深爱婷婷综合一区| 国产精品久久久久精品A级| 春色校园亚洲愉拍自拍| JIZZJIZZ欧美69巨大| 中文字幕亚洲一区二区VA在线| 亚洲亚洲人成综合网络| 亚洲AV永久无码精品九之| 我趁老师喝醉后玩弄她的身体| 日本护士毛茸茸XX| 欧美日韩一区二区成人午夜电影 | 性色AV.网站免费| 熟妇人妻不卡中文字幕| 日本WV一本一道久久香蕉| 女女女女女裸体处开BBB| 久久无码中文字幕免费影院蜜桃 | 久久中文字幕AV一区二区不卡| 禁欲少校大哥的囚禁| 国产欧美日韩VA另类在线播放| 国产AV丝袜熟女AV一区| 潮喷大喷水系列无码| AⅤ成年女人毛片免费观看| 中日AV乱码一区二区三区乱码| 亚洲熟伦熟妇AV无码春| 亚洲VA中文字幕无码毛片| 午夜无码免费福利视频网址| 他把胸罩撕了捏胸吃奶| 日日澡夜夜澡人人高潮| 全免费A级毛片免费看无码| 女人为啥摸几下就让进了| 蜜桃AV无码免费看永久| 久久久久夜夜夜精品国产 | av 无码av 丰满av| 中文字幕亚洲乱码熟女1区2区| 一对一大尺度聊天APP安装| 亚洲五月丁香综合视频| 亚洲欧美日韩中文高清WWW| 亚洲AV永久无码精品秋霞电影秋| 西西人体艺术摄影| 无码少妇一区二区三区| 天天爱天天做天天添天天欢| 少妇高潮惨叫喷水在线观看| 日日噜噜夜夜狠狠久久无码区| 日本精产国品一二三产品| 人成AAAAA毛天堂片| 欧美三级不卡在线播放| 女人大胆张开荫道口∞| 免费无遮挡无码H肉动漫在线观看| 老师办公室被吃奶好爽在线观看| 久久久久亚洲AV无码网站少妇| 久久精品卫校国产小美女| 精品无码AV一区二区三区| 精品国产福利一区二区| 极品VPSWINDOWS少妇| 狠狠噜天天噜日日噜视频麻豆| 国内精品久久久久影院优 | 性色AV极品无码专区亚洲| 无码一区二区三区蜜桃| 无码AV专区丝袜专区| 天天看片在线完整版| 甜性涩爱在线播放| 玩丰满少妇XXXXXⅩ性麻| 偷拍东北熟女BBWW| 未成18不能看的视频| 天堂8在线天堂资源在线| 私人家庭影院5577| 天天天天躁天天爱天天碰2018| 天码AV无码一区二区三区四区 | 久久WWW成人_看片| 精人妻无码一区二区三区| 久久精品国产亚洲AV果冻传媒 | 厨房里挺进岳丰满大屁股| 成在人线AV无码免观看麻豆 | 韩国电影办公室6免费完整版| 国模无码视频一区| 黑料社ZZTT.WIN免费观看| 狠狠做深爱婷婷久久综合一区 | AV无码精品久久久久精品免费| BT天堂网.WWW在线资源| JIZZJIZZ无码中国在线观| 爱丫爱丫影院在线视频| 草草地址线路①屁屁影院成人| 吃了继兄开的药后我做的梦更长了| 成人午夜精品久久久久久久| 二三四五六七无产乱码| 国产AV午夜精品一区二区三区| 国产成人啪精品视频免费APP| 国产极品粉嫩馒头一线天AV| 国产精品亚洲LV粉色| 国产亚洲精品第一综合另类灬| 黑色丝袜老师自慰喷水浪潮免费| 精品人妻人人做人人爽| 久久九九久精品国产88| 邻居少妇张开腿让我爽了在线观看 | 日韩丰满少妇无吗视频激情内射| 日韩午夜理论免费TV影院| 少妇扒开粉嫩小泬视频| 天天天欲色欲色WWW免费| 午夜精品久久久久9999| 亚洲AV一二三四区四色婷婷| 亚洲国产一卡2卡3卡4卡5公司| 亚洲色欲综合一区二区三区小说| 一本大道久久香蕉成人网| 找老女人泻火对白自拍| 97丨九色丨国产人妻▌| 啊轻点灬大巴太粗太长视频| 大家闺秀VS糙汉将军古言| 国产精品18HDXXXⅩ| 国产又黄又爽又刺激的免费网址| 精品久久久久久天美传媒| 久久久综合亚洲色一区二区三区 | 高清欧美精品XXXXX在线看| 国产精品三级在线观看无码| 国精产品一区二区三区有限| 精品国产AⅤ无码一区二区 | 欧美成人黑人XX视频免费观看| 人妻丰满AV无码久久不卡| 日日摸日日碰夜夜爽97|