a毛片毛费观看-a毛片在线-a毛片在线观看-a毛片在线免费观看-国产成人综合洲欧美在线-国产成人综合高清在线观看

始創于2000年 股票代碼:831685
咨詢熱線:0371-60135900 注冊有禮 登錄
  • 掛牌上市企業
  • 60秒人工響應
  • 99.99%連通率
  • 7*24h人工
  • 故障100倍補償
您的位置: 網站首頁 > 幫助中心>文章內容

如何規劃好網站的URL

發布時間:  2012/9/14 15:14:44
 URL的問題是SEO過程中的一個基本問題,做一個新網站也好,優化現有的網站也好,都繞不開這一點。這兩篇文章就來大體總結一下URL的規劃應該怎么做。  

在開始講這些問題之前,需要先閱讀完以下文檔:  

  • 《優化網站的抓取與收錄》 http://www.google.cn/ggblog/googlewebmaster-cn/2009/08/blog-post.html
  • 《谷歌搜索引擎入門指南》第7頁到11頁。 
  • 《創建方便 Google 處理的網址結構》http://www.google.com/support/webmasters/bin/answer.py?hl=cn&answer=76329

這些都是google官方的文檔,講述了各種各樣的規則。這些對百度也是同樣適用的,因為它是針對爬蟲的特性提出來的,并不是只有某個搜索引擎才適用。  

看完上面的那些這些規則,發現翻來覆去講得都是怎么讓爬蟲能非常順暢的抓取完整個網站。其實絕大部分網站都存在這樣或那樣的問題的,也包括我這個博客,在抓取方面也存在一些問題。但是看在每篇博文都能被收錄的情況下,也就不去優化了。但是對于很多收錄還成問題的網站(特別是大中型網站)來說,就要好好規劃一下了。大家可以用HTTrack抓取semyj這個博客看看,就能發現為什么我這么說了。(誰能一天之內抓取完這個博客的人請告訴我。)  

 

還是先從搜索引擎的處境講起吧。正如Google在文章中寫道的那樣:  

網絡世界極其龐大;每時每刻都在產生新的內容。Google 本身的資源是有限的,當面對幾近無窮無盡的網絡內容的時候,Googlebot 只能找到和抓取其中一定比例的內容。然后,在我們已經抓取到的內容中,我們也只能索引其中的一部分。
URLs 就像網站和搜索引擎抓取工具之間的橋梁: 為了能夠抓取到您網站的內容,抓取工具需要能夠找到并跨越這些橋梁(也就是找到并抓取您的URLs)。
  

這段話很好的總結了搜索引擎所面臨的處境,那么爬蟲在處理URL的時候會遇到哪些問題呢?

我們先來看重復URL的問題,這里說的重復URL是指同一個網站內的不同頁面,都存在很多完全相同的URL。如:  

http://www.semyj.com/archives/1097  和 http://www.semyj.com/archives/1114 這兩個頁面。  

模板部分的URL是一樣的

模板部分的URL是一樣的

雖然頁面不同,但是他們公用的部分,URL地址是一樣的。看起來如果不同的爬蟲抓取到這些頁面的時候,會重復抓取,從而浪費很多不必要的時間。 這確實是一個問題,不過這個問題搜索引擎倒是基本解決好了。實際上,爬蟲的抓取模式不是像我們理解的那樣看到一個網頁就開始抓取一個網頁的。  

爬蟲順著一個個的URL在互聯網上抓取網頁,它一邊下載這個網頁,一邊在提取這個網頁中的鏈接。假設從搜索引擎某一個節點出來的爬蟲有爬蟲A、爬蟲B、爬蟲C,當它們到達semyj這個網站的時候,每個爬蟲都會抓取到很多URL,然后他們都會把那個頁面上所有的鏈接都放在一個公用的“待抓取列表”里。(可以用lynx在線版模擬一下爬蟲提取鏈接。)  

待抓取列表

待抓取列表

這樣一來,在“待抓取列表”里,那些重復的URL就可以被去重了。這是一個節點在一種理想狀態下的情況,不過實際上因為搜索引擎以后還要更新這個網頁等等一些原因,一個網站每天還是有很多重復抓取。所以在以前的文章中,我告訴大家用一些方法減少重復抓取的幾率。  

這里有一個問題,很多人肯定想問是不是一個網頁上所有的鏈接搜索引擎都會提取的,答案是肯定的。但是在《google網站質量指南》中,有這樣一句:“如果站點地圖上的鏈接超過 100 個,則需要將站點地圖拆分為多個網頁。”有些人把這句話理解為:“爬蟲只能抓取前100個鏈接”,這是不對的。  

因為在“待抓取列表”里的URL,爬蟲并不會每一個鏈接都會抓取的。 鏈接放在這個列表里是沒問題的,但是爬蟲沒有那么多時間也沒必要每個鏈接都要去抓取,需要有一定的優先級。在“待訪問列表”里,爬蟲一邊按照優先級抓取一部分的URL,一邊把還未被抓取的URL記錄下來等待下次抓取,只是這些還未被抓取的URL,下次爬蟲來訪問的頻率就每個網站都不一樣了, 每一類URL被訪問的頻率也不一樣。  

按優先級抓取

按優先級抓取

那么在“待抓取列表”里的URL,哪些是能被優先抓取,哪些是被次要抓取的呢?  

我們稍微思考一下都能明白這個抓取的優先級策略應該怎么定。首先,那些目錄層級比較深的URL是次要抓取的;那些在模板部分的或重復率非常高的URL是被次要抓取的;那些動態參數多的URL是次要抓取的…..  

這么做的原因,就是因為搜索引擎的資源是有限的,一個網站實際擁有的內容也是有限的,但是URL數量是無限的。爬蟲需要一些“蛛絲馬跡”來確定哪些值得優先抓取,哪些不值得。  

在《谷歌搜索引擎入門指南》中,google建議要優化好網站的URL結構,如建議不要用“…/dir1/dir2/dir3/dir4/dir5/dir6/page.html”這樣的多層嵌套。就是因為在待抓取列表里,在其他條件相同的情況下,爬蟲會優先抓取目錄層級淺的URL。如用Lynx在線版查看本網站的頁面:

抓取優先級

抓取優先級

如果說,在這17個鏈接里,爬蟲只能選幾個鏈接抓取的話,紅色箭頭所指的鏈接在其他條件相同的情況下是要優先的。

但是這里又有一個誤區,有人在SEO過程中,把所有的網頁都建立在根目錄下,以為這樣能有排名的優勢。這樣也是沒有理解這個原因。而且爬蟲在這個網站上先抓取哪些URL后抓取哪些URL,都是自己的URL和自己的URL比,如果所有網頁都是在同一個目錄下,那就沒有區別了。

最好的規劃URL目錄層級的方式,就是按照業務方的邏輯來規劃,從內容上應該是什么從屬關系就怎么規劃URL就是。就像《谷歌搜索引擎入門指南》中舉的那些例子一樣。

(順帶說一下。我經常看到,一個網站中,很多人非SEO的人員,如工程師和網頁設計人員或者網站編輯,都以為SEO和他們做的事情是相反的。這都是因為長期以來一些SEOer經常提交很多明顯違反用戶體驗的SEO需求給他們,造成他們以為SEO就是和他們做的事情是有沖突的。實際上,SEO和別的部門有非常少的沖突,只要你能用科學的方法去實踐,就能發現以前有太多誤導人的觀點了。還有,對于其他部門的專業人員,他們專業領域的意見非常值得去考慮。)

爬蟲有一個特點,就是它不能實時的比較它正在抓取的內容是不是重復的內容。因為如果要做到實時的比較,那它至少要把正在抓取的頁面和那些已經在索引庫的頁面做對比,這是不可能短時間內可以完成的。 前面把所有URL統一放到一個待抓取列表中的方法只能避免那種URL完全一模一樣的重復抓取,但是無法應對URL不一樣、但是內容一樣的抓取。  

正如所有搜索引擎都強調的那樣,動態參數是一個經常產生URL不一樣、但是內容一樣的現象的原因。所以搜索引擎建議大家用靜態化的方法去掉那些參數。靜態化的本質是URL唯一化,在《優化網站的抓取與收錄》這篇文章中,曾經用的“一人一票”這個描述就很貼切的表達了這個意思。靜態化只是一個手段而不是目的,為了保證URL的唯一化,可以把URL靜態化、也可以用robots.txt或nofollow屏蔽動態內容、可以用rel=canonical屬性、還可以在webmaster tool里屏蔽一些參數等等。  

而靜態化也會有好的靜態化和不好的靜態化之別。我們這里不說那種把多個參數直接靜態化了的案例,而是單純來看看如下兩個URL: 

http://www.semyj.com/archives/1097和 http://www.semyj.com?p=1097  

這兩個URL中,這個靜態化的是不是就比動態的好呢? 實際上這兩個URL的差別很小。首先這兩種URL搜索引擎都能收錄,如果說動態URL“?p=1097”可能產生大量重復的內容讓爬蟲抓取,那這個靜態的URL“archives/1097”也不能保證不會產生大量重復的內容。特別是爬蟲在抓取時碰到大量有ID的靜態的URL時,爬蟲無法判斷這個網站是不是把session ID等參數靜態化了才造成的,還是這個網站本來就有這么多內容。 所以更好的靜態化是這樣的: 

http://www.semyj.com/archives/seo-jingli 

這種URL就能保證唯一化而不會和其他情況混淆了,所以URL中要盡量用有意義的字符。這不是因為要在URL增加關鍵詞密度而這么做的,是為了方便搜索引擎抓取。 

以上是因為爬蟲固有的特點造成的抓取障礙,而有時網站的結構也能造成爬蟲的抓取障礙。這種結構在《優化網站的抓取與收錄》一文中用的名字是“無限空間”。文中舉了一個日歷的例子:如很多博客上都會有一個日歷,順著這個日歷的日期一直往下點,永遠都有鏈接供你點擊的,因為時間是無限的。 

其實還有更多的“無限空間”的例子,只是“無限空間”這個名詞沒怎么翻譯好,翻譯做“無限循環”就容易理解多了。


本文出自:億恩科技【www.ibaoshan.net】

服務器租用/服務器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經營性ICP/ISP證:贛B2-20080012
  • 服務器/云主機 24小時售后服務電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務電話:0371-60135900
  • 專注服務器托管17年
    掃掃關注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權所有  地址:鄭州市高新區翠竹街1號總部企業基地億恩大廈  法律顧問:河南亞太人律師事務所郝建鋒、杜慧月律師   京公網安備41019702002023號
      0
     
     
     
     

    0371-60135900
    7*24小時客服服務熱線

     
     
    しぼっちうぞ2在线观看1一| 欧美黑人巨大VIDEOS精品| 97人洗澡人人澡人人爽人人模| 玩弄丰满熟妇XXXXX性HD| 久久精品国产99国产精2020| 成人区人妻精品一区二区不卡视频 | 久久精品一本到99热免费| 大乳BOOBS巨大吃奶| 野花日本视频免费观看3| 水多的女人男人最上瘾| 美女下部裸体张开腿视频| 国产乱XXXX搡XXXXX搡| 97超碰精品成人国产| 亚洲AV成人综合网| 人妻AV鲁丝一区二区三区蜜臀| 精品不卡一区二区| 大J8黑人W巨大888A片| 一区二区三区毛片| 无码人妻丰满熟妇精品区| 欧美巨大黑人精品一二三| 激情五月综合 香亚洲| 大白肥妇BBVBBW高潮| 中国老熟女重囗味HDXX| 亚洲AⅤ优女AV综合久久久| 人人妻人人澡人人爽欧美二区 | AJ四色鸳鸯真假区别| 亚洲AV永久无码精品秋霞电影影院| 人与禽zozzo性伦| 久久久久亚洲AV无码专区喷水| 国产成人一区二区三区| AV 无码 在线 观看| 亚洲精品无码AV中文字幕电影网| 少妇精品久久久久www| 免费夜色污私人影院在线观看| 韩国青草无码自慰直播专区| 大香伊蕉在人线国产69| 中文字幕久久综合伊人| 亚洲AV无码一区二区三区人| 日韩人妻无码精品无码中文字幕 | 亚洲中文字幕乱码电影| 无码成A毛片免费| 欧美日韩国产A∨| 久久精品国产亚洲AV麻豆图片| 国产成人综合亚洲精品| FREE性丰满HD性欧美| 亚洲熟女少妇一区二区| 无码人妻久久一区二区三区蜜桃 | 思思久久99热只有频精品66| 娜娜麻豆国产电影| 交换玩弄两个美妇教师韩国电影 | 亚洲人成色77777| 婷婷色综合AⅤ视频| 全免费A级毛片免费看网站| 久久婷婷成人综合色综合| 国产色无码精品视频国产| 宝贝腿开大点我添添公口述视频| 岳把腿扒开让我添| 亚洲AV无码一区二区乱子伦AS| 色爽黄1000部免费软件下载| 能让我流水水的一千字| 久久精品国产69国产精品亚洲| 国产麻豆 9L 精品三级站| 被猛男伦流澡到高潮H| 中文字幕亚洲综合久久综合 | 极品性荡少妇一区二区色欲| 国产AV一区二区精品凹凸| GOGO大胆啪啪艺术| 一本一道精品欧美中文字幕| 性生交大片免费看| 色妞WWW精品视频| 欧美老人巨大XXXX做受视频| 久久久久影院美女国产主播| 国外AV无码精品国产精品| 国产成人高清精品亚洲| おっさんとわたし天堂的资源| 一区二区三区无码免费看| 亚洲VA在线∨A天堂VA欧美V| 丝袜AV在线丝袜AV天堂| 强伦姧人妻三上悠亚中文字幕| 领导不戴套玩弄下属娇妻 | 97国语精品自产拍在线观看一 | 九九九国产精品成人免费视频| 国产精品久久久久久久久KTV| 超碰97人人做人人爱亚洲尤物| 2021韩剧在线观看韩剧网| 亚洲香蕉中文日韩V日本| 性色AⅤ一二三天美传媒| 视频一区二区三区在线观看蜜桃| 欧美最猛黑人XXXⅩ猛男欧视频| 两只奶头被老头吸肿了| 精品亚洲国产成人| 国产新婚夫妇叫床声不断| 国产成人婷婷丁香在线| 成人在线高清不卡免费视频| H无码精品动漫在线观看| 中文字幕乱码人在线视频1区| 亚洲色欲色欲WWW在线播放| 亚洲AV成人一区二区三区| 天天槽夜夜槽槽不停| 日韩精品无码一区二区忘忧草 | 乱JAPANESE偷窥PISS| 久久AV高清无码| 好吊妞人成视频在线观看27DU| 国产精品高潮呻吟爱久久AV无码| 大陆精大陆国产国语精品| ZOZ○ZO女人和另类ZOZ0| 717影院理论午夜伦八戒| 一区二区三区高清AV专区| 亚洲欧美日韩国产成人精品影院| 亚洲AV涩涩涩成人网站在线播放| 无码免费一区二区三区免费播放| 少妇扒开毛茸茸的B自慰| 日本人XXXX裸体XXXX| 欧美成人精品三级网站视频| 麻豆亚洲AV熟女国产一区二| 久久久久亚洲AV无码专区首| 精品日产A一卡2卡三卡4卡乱| 黑人性狂欢在线播放| 国产色欲AV一区二区三区| 国产激情无码一区二区APP| 饭桌上故意张开腿让公在线观 | 贵阳40多岁熟女高潮呻吟 | 性色ΑV一二三天美传媒| 无码 有码 日韩 人妻| 色777狠狠狠综合| 欧洲美女粗暴交视频| 女人毛毛扒开自慰| 麻豆专媒体一区二区| 久久久久人妻精品一区三寸蜜桃 | 久久久久久精品免费S| 精品少妇人妻AV无码专区| 护士被强女千到高潮视频| 国精品无码一区二区三区在线| 国产精品自在欧美一区| 国产精久久一区二区三区| 隔壁邻居是巨爆乳寡妇| 丰满少妇三级全黄| 儿子耕了母亲荒废的田清朝| 不屈的儿媳妇电视剧汉语版| 把佛珠一个一个挤出去| www.内射孕妇网站入口| JAPANESEⅩⅩⅩHD69| av色欲无码人妻中文字幕| 52秋霞东北熟女叫床| 2022最新韩国理伦片在线观看 | 国模GOGO无码人体啪啪| 国产欧美久久久久久精品一区二区 | 日产幕无线码三区在线| 日本极品白嫩ASSPICS| 人人妻人人妻人人片色AV| 人妻中文字系列无码专区| 人妻熟妇乱又伦精品无码专区| 秋霞人妻无码中文字幕| 人妻丰满熟妇av无码区乱| 人妻人人澡人人添人人爽冫 一| 人妻被按摩到潮喷中文不卡| 人妻无码ΑV中文字幕琪琪布 | 免费A级毛片无码免费视频| 老旺的大肉蟒进进出出视频| 么公的粗大挺进了我的密道| 蜜臀AV无码一区二区三区小说| 免费人妻AV无码专区| 女被啪到深处喷水GIF动态视频| 欧美超大胆裸体XX视频| 欧美熟女一区二区三区| 人妻内射一区二区在线视频| 日本乱人伦AⅤ精品潮喷| 日韩在线一区二区三区| 少妇极品熟妇人妻无码| 铜铜铜铜铜铜铜好多水谜妹| 无码专区丰满人妻斩六十路| 午夜精品一区二区三区在线视| 性XXXX18免费观看视频| 亚欧洲精品在线视频免费观看| 亚洲AⅤ无码乱码在线观看性色| 亚洲AV无码专区在线电影APP| 亚洲国产丝袜精品一区| 亚洲无日韩码精品| 一下子挺进浓密的黑森林| 曰本BBWW高潮BBWR| 2019理论韩国理论中文| A级国产乱理伦片在线观看| 被吊起来张开腿供人玩弄| 粗大的内捧猛烈进出视频嘿嘿视频| 丰满的少妇XXXXX人妻| 国产成人亚洲精品无码AV大片| 国产毛多水多高潮高清| 韩国精品久久久久久无码| 精品国产亚洲AV麻豆| 久久久久久精品成人免费| 美女高潮无套内谢| 欧美乱大交XXXXX性喷潮| 日本妞vs黑人巨大XXXXX| 熟女系列丰满熟妇AV| 无遮挡又色又刺激的视频黄| 亚洲AV性色在线观看| 亚洲熟妇无码久久精品| 中文无码久久精品| SEERX性欧美| 吃花核心舌头在里面旋转|