談百度判斷采集和權(quán)重 采集小型網(wǎng)站是不錯選擇 |
發(fā)布時間: 2012/7/10 17:45:36 |
隨著國內(nèi)大型CMS 動易、新云、DEDECMS 以及其他各式樣的CMS 增加采集功能,網(wǎng)絡(luò)就到處是采集了!利用這些采集工具不用很長時間,便可以做出N多垃圾站點。
當論壇采集工具也出現(xiàn)的時候,采集之風(fēng)就更甚了!基本上網(wǎng)站站點可以隨意復(fù)制了! 既然本文談的是采集與權(quán)重,我現(xiàn)在好像離題了,我們進入正題。 首先來說下我的環(huán)境! 網(wǎng)站類型:分類信息網(wǎng) 域名注冊年限:2年 在百度權(quán)重:比被采集站點站點相比要高點 目的:把采集變原創(chuàng),保證排名和權(quán)重 搜索引擎:百度 我們首先來看下,百度是怎么樣來判斷一個信息是原創(chuàng)還是采集的! 1.一條信息----2.百度----3.百度蜘蛛---4.蜘蛛收錄此頁面---5.規(guī)則審核---6.入庫并顯示在結(jié)果里 按照百度的規(guī)律 一條信息從收錄到顯示結(jié)果基本就這幾步! 這幾步最塊也要2天時間才能完成,從1到5 基本上最快也要1天。你不要問我說!我剛發(fā)布的他就會收錄了?只要你沒被K,基本上百度蜘蛛是把你的數(shù)據(jù)臨時保存起來的。通過5 才會顯示在搜索結(jié)果內(nèi)的! 當你的信息進入5的時候!百度也就是在這個階段判斷是否原創(chuàng)或者采集的!也是從這里決定你的排名高低的! 按照上面來說,你有至少1天時間來進行操作,使百度認為你就是原創(chuàng)! 列出例子說明: 被采集站點每天大概有500條新的分類信息 我利用采集工具設(shè)置自動采集!每日 8點 10點 12點 14點 16點 18點 20點 22點 0點 進行采集!!并且進行直接入庫!基本上我站信息和被采集站信息發(fā)布時間誤差不超過30分鐘! 我們來看下 百度是怎么判斷的: 規(guī)則審核:1.對比現(xiàn)有數(shù)據(jù),數(shù)據(jù)庫中是否有存在相同內(nèi)容,不存在就直接收錄 默認此信息屬性為原創(chuàng)。 2.對比現(xiàn)有數(shù)據(jù),數(shù)據(jù)庫中是否有存在相同內(nèi)容,存在就進入下個對比。 3.存在相同內(nèi)容,就對比A和B的所屬網(wǎng)站在百度權(quán)重.權(quán)重高者勝出!低著則排在后面!或者直接刪除。 知道了百度的審核的機制 我們就很好來操作了!及時更新了。說白了,就是及時采集。我的例子說過了!他最新的信息,我采集過來誤差不超過 0分鐘.百度在這個30分鐘內(nèi),是不可能把這個信息內(nèi)容緩存起來的。到了這里,就要看百度更新誰的網(wǎng)站快了。誰的網(wǎng)站先更新,那誰就是原創(chuàng)!! 為什么你也是及時采集了他,但是仍然和他不能比! 那就是因為百度先更新的是他!他在規(guī)則審核中勝出了!!為什么先更新他?他權(quán)重比你高! 說到權(quán)重 我說下百度如何判定權(quán)重的: 1.外鏈 2.網(wǎng)站運營時間的長短 3.流量 4.采用的編寫語言 這只是一部分! 還有的我不在鏊述! 要高質(zhì)量的友情連接,和百度K過的站做連接,你那是找K!運營時間的長短 要看個人站長的 毅力和專注了。經(jīng)常改變主題改變定位的站,百度不喜歡!一天是音樂,第二天變小說了!百度絕對會在你第三次改之前K了你。 流量也是一部分先決條但不是絕對!!網(wǎng)站使用的腳本語言!當然能靜態(tài)化的就靜態(tài)化把!如果自己開發(fā)能力不怎么樣,還是使用現(xiàn)有的CMS吧! 總而言之,想盡一切辦法縮小采集更新的時間,想盡一辦法提高自己權(quán)重!還有一條!有很多小型網(wǎng)站是你采集的不錯選擇! 本文出自:億恩科技【1tcdy.com】 服務(wù)器租用/服務(wù)器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |