石家莊網(wǎng)站建設(shè):網(wǎng)站的真實(shí)收錄數(shù)據(jù)
來(lái)源:theclubhubb.com 作者:筆者小丹 時(shí)間:2018-10-09 14:49:16 瀏覽:2516次
我們?cè)跈z查網(wǎng)站收錄的時(shí)候一般會(huì)看兩個(gè)數(shù)據(jù),一個(gè)是快照另一個(gè)是索引。但是很多時(shí)候我們發(fā)現(xiàn),兩個(gè)數(shù)據(jù)并不是對(duì)等的,會(huì)出現(xiàn)此起彼伏的情況。而作為網(wǎng)站的運(yùn)營(yíng)者,我們首先要知道的是哪個(gè)是網(wǎng)站的真實(shí)收錄數(shù)據(jù),是快照數(shù)據(jù)還是索引量呢?今天不妨跟著筆者小丹一起來(lái)分析一下。
網(wǎng)站日常優(yōu)化維護(hù)中,收錄量是每天的必查的數(shù)據(jù)之一,通過site命令檢查出大數(shù)據(jù)和統(tǒng)計(jì)工具中的索引數(shù)據(jù)總是有出入。有的時(shí)候我們發(fā)現(xiàn)site命令下的快照數(shù)據(jù)比較高,而有時(shí)候我們發(fā)現(xiàn)統(tǒng)計(jì)工具中的索引數(shù)據(jù)是快照數(shù)據(jù)的上百倍。到底哪個(gè)才是我們對(duì)網(wǎng)站進(jìn)行分析的真實(shí)數(shù)據(jù)呢?哪個(gè)才是反應(yīng)網(wǎng)站當(dāng)下情況的數(shù)據(jù)呢?就快照和索引的不同情況,我們可以以百度為例細(xì)細(xì)來(lái)說明一下,看看小丹說的是否有道理。
第一,快照數(shù)據(jù)高于索引數(shù)據(jù)。
很多時(shí)候我們看到site命令下的百度快照數(shù)據(jù)要高于索引數(shù)據(jù),而在檢查索引量的時(shí)候我們可以很明確的發(fā)現(xiàn)是近一個(gè)或兩個(gè)快照周期內(nèi)出現(xiàn)了索引量下降的情況,也就是利用“綠色”表現(xiàn)的數(shù)據(jù)。但是對(duì)照快照數(shù)據(jù)卻依然是原來(lái)的數(shù)據(jù),這個(gè)其實(shí)一般是百度數(shù)據(jù)庫(kù)更新緩存的原因,沒有及時(shí)更改掉百度快照數(shù)據(jù),當(dāng)你再等一段時(shí)間后就會(huì)發(fā)現(xiàn)數(shù)據(jù)基本已經(jīng)與此事的索引數(shù)據(jù)持平。
第二,快照數(shù)據(jù)低于索引數(shù)據(jù)。
通過百度統(tǒng)計(jì)我們可以觀察到每天網(wǎng)站的真實(shí)索引量,或是“紅色”的數(shù)據(jù)增幅或是“綠色”的數(shù)據(jù)下跌。而,百度快照的數(shù)量卻不是每天變化的,或者說不是每天都能夠同步更新的。我們知道百度快照其實(shí)是網(wǎng)站在百度數(shù)據(jù)庫(kù)中的緩存數(shù)據(jù),也就是百度蜘蛛抓取時(shí)留在網(wǎng)站中的影像,一般我們優(yōu)化排名的時(shí)候都是進(jìn)行的這個(gè)影像的更新,但是這個(gè)也僅僅是一個(gè)緩存,并非真正的網(wǎng)站主體。所以當(dāng)我看到網(wǎng)站的百度快照低于索引量的時(shí)候也不必驚慌,這只是你的網(wǎng)站收錄增加,但是快照沒有釋放出來(lái)的原因。
第三,索引數(shù)據(jù)是快照數(shù)據(jù)的百倍。
不知道大家有沒有發(fā)現(xiàn)過這樣的情況,當(dāng)我們利用站長(zhǎng)工具去檢查某個(gè)網(wǎng)站數(shù)據(jù)的時(shí)候,會(huì)出現(xiàn)網(wǎng)站是索引數(shù)據(jù)高達(dá)上百萬(wàn),與之相反的快照收錄數(shù)據(jù)僅僅幾千甚至更少。一般我們認(rèn)為索引量是百度對(duì)于網(wǎng)站的真實(shí)的收錄,也就是存在于索引庫(kù)中的網(wǎng)站留存影像,會(huì)彼此有一定的差距,但是不會(huì)有如此龐大的數(shù)據(jù)差距,而出現(xiàn)這樣的數(shù)據(jù)差距,筆者小丹想到的其中必定有原有。其中最可能的情況有兩種:
1、網(wǎng)站內(nèi)存在寄生蟲。網(wǎng)站如果出現(xiàn)寄生蟲程序就會(huì)自發(fā)的出現(xiàn)很多頁(yè)面,這些頁(yè)面不是網(wǎng)站本身的頁(yè)面而是通過寄生蟲程序自生成的頁(yè)面,而且這樣的頁(yè)面如果是自己植入的那么就多是用來(lái)沖擊網(wǎng)站收錄的,不會(huì)參與排名;而如果是被其他人植入的也就是網(wǎng)站被黑了,那么網(wǎng)站很容易被搜索引擎報(bào)毒,影響網(wǎng)站正常優(yōu)化。
2、網(wǎng)站存在泛目錄程序。改程序和寄生蟲有類似之處,就是會(huì)為網(wǎng)站增加大批量的頁(yè)面,來(lái)催增網(wǎng)站收錄。但是不同的是,一般泛目錄程序是我們自己添加的,是有目的的來(lái)增加網(wǎng)站索引數(shù)據(jù),以增加網(wǎng)站流量的一種方式。
講到這里,我們是否了解了網(wǎng)站真實(shí)的收錄數(shù)據(jù)是哪個(gè)了呢!正規(guī)優(yōu)化的站點(diǎn)來(lái)說,網(wǎng)站的索引量是搜索引擎對(duì)于網(wǎng)站收錄的最貼近的數(shù)據(jù)。但是,如果遇到第三種情況,那么個(gè)索引量的質(zhì)量性就要大打折扣了,亦或者說是針對(duì)網(wǎng)站優(yōu)化來(lái)說,這樣龐大的索引量并不能完全發(fā)揮他的作用來(lái)幫助我們實(shí)現(xiàn)網(wǎng)站收錄的最終目的。
(轉(zhuǎn)載請(qǐng)注明轉(zhuǎn)自:theclubhubb.com,謝謝!珍惜別人的勞動(dòng)成果,就是在尊重自己!)
最新案例