Spider對網(wǎng)站抓取數(shù)量突增往往給站點帶來很大煩惱,紛紛找平臺想要Baiduspider IP白名單,但實際上BaiduSpider IP會隨時變化,所以并不敢公布出來,擔(dān)心站長設(shè)置不及時影響抓取效果。百度是怎么計算分配抓取流量的呢?站點抓取流量暴增的原因有哪些呢?
Spider對網(wǎng)站抓取數(shù)量突增往往給站點帶來很大煩惱,紛紛找平臺想要Baiduspider IP白名單,但實際上BaiduSpider IP會隨時變化,所以并不敢公布出來,擔(dān)心站長設(shè)置不及時影響抓取效果。百度是怎么計算分配抓取流量的呢?站點抓取流量暴增的原因有哪些呢?
總體來說,Baiduspider會根據(jù)站點規(guī)模、歷史上網(wǎng)站每天新產(chǎn)出的鏈接數(shù)量、已抓取網(wǎng)頁的綜合質(zhì)量打分等等,來綜合計算抓取流量,同時兼顧站長在抓取頻次工具里設(shè)置的、網(wǎng)站可承受的最大抓取值。
從目前追查過的抓取流量突增的case中,原因可以分為以下幾種:
1, Baiduspider發(fā)現(xiàn)站內(nèi)JS代碼較多,調(diào)用大量資源針對JS代碼進(jìn)行解析抓取
2, 百度其他部門(如商業(yè)、圖片等)的spider在抓取,但流量沒有控制好,sorry
3, 已抓取的鏈接,打分不夠好,垃圾過多,導(dǎo)致spider重新抓取
4, 站點被攻擊,有人仿冒百度爬蟲(推薦閱讀:《如何正確識別BaiduSpider》)
如果站長排除了自身問題、仿冒問題,確認(rèn)BaiduSpider抓取流量過大的話,可以通過百度反饋中心來反饋,切記一定要提供詳細(xì)的抓取日志截圖。
河南億恩科技股份有限公司(1tcdy.com)始創(chuàng)于2000年,專注服務(wù)器托管租用,是國家工信部認(rèn)定的綜合電信服務(wù)運營商。億恩為近五十萬的用戶提供服務(wù)器托管、服務(wù)器租用、機(jī)柜租用、云服務(wù)器、網(wǎng)站建設(shè)、網(wǎng)站托管等網(wǎng)絡(luò)基礎(chǔ)服務(wù),另有網(wǎng)總管、名片俠網(wǎng)絡(luò)推廣服務(wù),使得客戶不斷的獲得更大的收益。
服務(wù)器/云主機(jī) 24小時售后服務(wù)電話:
0371-60135900
虛擬主機(jī)/智能建站 24小時售后服務(wù)電話:
0371-55621053
網(wǎng)絡(luò)版權(quán)侵權(quán)舉報電話:
0371-60135995
服務(wù)熱線:
0371-60135900