網(wǎng)絡(luò)蜘蛛雖然不是人,但它同樣也有范圍,很顯然對(duì)于如大海般浩瀚的網(wǎng)絡(luò)世界來(lái)說(shuō),網(wǎng)絡(luò)蜘蛛抓取互聯(lián)網(wǎng)上所有的網(wǎng)頁(yè)幾乎是不可能的,從目前公布的數(shù)據(jù)來(lái)看,容量最大的搜索引擎不過(guò)是抓取了整個(gè)網(wǎng)頁(yè)數(shù)量的40%左右,有很多網(wǎng)頁(yè)根本無(wú)法被收錄。因此,要想讓網(wǎng)絡(luò)蜘蛛抓到你,要想讓客戶能從搜索引擎中找到你的信息,就必須先做好網(wǎng)站收錄工作。
筆者一直都認(rèn)為這個(gè)網(wǎng)絡(luò)蜘蛛很人性化。因此,下面了解一下網(wǎng)絡(luò)蜘蛛的工作原理。要想網(wǎng)站被百度收錄可以從以下八個(gè)方面入手。
(1) 向百度提交你的網(wǎng)站,這對(duì)新網(wǎng)站而言尤其重要,網(wǎng)絡(luò)蜘蛛也喜歡認(rèn)識(shí)“新朋友”,像百度提交你的網(wǎng)站就好像你向百度提交你的“名片”一樣,讓人家記住你。一般情況下,網(wǎng)絡(luò)蜘蛛會(huì)在1~4周的時(shí)間對(duì)你的網(wǎng)站作出收錄回應(yīng)。提交網(wǎng)站時(shí)只要提交網(wǎng)站首頁(yè)就可以了,沒必要提交內(nèi)容網(wǎng)頁(yè),因?yàn)橹灰o網(wǎng)絡(luò)蜘蛛一個(gè)開頭,它就會(huì)自動(dòng)爬遍每個(gè)“角落”。
百度網(wǎng)站提交網(wǎng)址為:http://ziyuan.baidu.com/linksubmit/url
(2) 適度競(jìng)價(jià)排名。雖然百度收錄只與網(wǎng)頁(yè)價(jià)值有關(guān),與競(jìng)價(jià)排名等商業(yè)因素沒多大關(guān)系,但如果你的網(wǎng)站還未被百度收錄,進(jìn)行競(jìng)價(jià)排名不失為一種良策,此時(shí)網(wǎng)站猶如在“行賄”一樣,提醒百度蜘蛛記住你。
(3) 設(shè)置友情鏈接。這里的友情鏈接是指有“質(zhì)量”的友情鏈接,而不是垃圾鏈接(垃圾鏈接太多,反而會(huì)讓百度蜘蛛生厭,有損網(wǎng)絡(luò)收錄),這個(gè)過(guò)程猶如從別人的網(wǎng)頁(yè)上搭“橋”過(guò)來(lái)。在百度蜘蛛收錄別人的同時(shí),順著“橋”會(huì)爬到你的網(wǎng)頁(yè)中。
(4) 給每個(gè)網(wǎng)頁(yè)加上與正文相關(guān)的標(biāo)題。之所以說(shuō)百度蜘蛛具有人性,其原因是百度只會(huì)收錄符合用戶搜索體驗(yàn)的網(wǎng)頁(yè)或網(wǎng)站。給每個(gè)網(wǎng)頁(yè)加上標(biāo)題,無(wú)疑就是為了符合人的閱讀習(xí)慣,即往往是先看標(biāo)題是否感興趣,再?zèng)Q定是否看內(nèi)容。對(duì)于網(wǎng)頁(yè)標(biāo)題的設(shè)置必須保證標(biāo)題中的關(guān)鍵詞與正文有關(guān),如果是網(wǎng)站首頁(yè),那么標(biāo)題最好是網(wǎng)站的名稱或公司的名稱,如果是其余頁(yè)面,標(biāo)題最好是正文內(nèi)容的提煉。
(5) 設(shè)置最容易提取的網(wǎng)頁(yè)形態(tài)。網(wǎng)絡(luò)蜘蛛能抓取下來(lái)的網(wǎng)頁(yè)有html、圖片、doc、pdf、多媒體、動(dòng)態(tài)網(wǎng)頁(yè)及其他格式。這些文件抓取下來(lái)后,需要把這些文件中的文本信息提取出來(lái),相對(duì)而言,doc、pdf等文檔比HTML、圖片、多媒體等文檔更容易提取,靜態(tài)網(wǎng)頁(yè)比動(dòng)態(tài)網(wǎng)頁(yè)更容易提取。
(6) 提高網(wǎng)頁(yè)的質(zhì)量。百度蜘蛛更喜歡高質(zhì)量的網(wǎng)頁(yè),因此網(wǎng)頁(yè)內(nèi)容最好是原創(chuàng)性文章。如果是復(fù)制的文章有可能不會(huì)被收錄。
(7) 經(jīng)常保持網(wǎng)站更新。經(jīng)常更新的網(wǎng)站,網(wǎng)絡(luò)蜘蛛就會(huì)經(jīng)常光顧,而長(zhǎng)期不更新的網(wǎng)站,網(wǎng)絡(luò)蜘蛛到訪會(huì)減少。同時(shí),網(wǎng)站的更新時(shí)間最好是在工作日的9點(diǎn)到10點(diǎn),這個(gè)時(shí)候是網(wǎng)絡(luò)蜘蛛進(jìn)行重新梳理的最佳時(shí)間,因?yàn)榘俣仁珍洺藱C(jī)器收錄之外,還有人工收錄方式。
(8) 如果上述工作都做了,還是沒有被百度收錄,你也可以發(fā)信息到webmaster baidu.com去詢問(wèn)。
本文鏈接:http://m.hdqikan.net/xinwenzhongxin/563.html
|