百度如何判斷網(wǎng)站文章是否原創(chuàng) |
發(fā)布時間: 2012/8/19 9:49:14 |
大量復(fù)制內(nèi)容網(wǎng)站有的時候會影響關(guān)鍵字的排名。 比如說原本是你寫的文章,本來應(yīng)該排名很好,但是其他人抄襲或轉(zhuǎn)載你的文章,而且搜索引擎不幸的判斷那篇被抄襲或轉(zhuǎn)載的網(wǎng)頁是原始出處的話,你應(yīng)有的排名就會被那個網(wǎng)頁奪走。 那么搜索引擎怎樣才能從多個網(wǎng)頁中挑出哪一個是原始出處呢?可能有以下幾個考慮: 1)網(wǎng)頁P(yáng)R值。網(wǎng)頁P(yáng)R值越高,被認(rèn)為是原始版本的可能性就越大。 2)網(wǎng)頁第一次被收錄的時間。網(wǎng)頁被搜索引擎收錄的時候越早,相比后發(fā)現(xiàn)的相同內(nèi)容的網(wǎng)頁來說,被當(dāng)作原始出處的可能性就越大。 3)域名注冊時間。越老的域名上面的網(wǎng)頁被當(dāng)成原始出處的可能性也越大。 4)網(wǎng)站的權(quán)威度。這就有點(diǎn)說不清了,可能包含前面3個因素,還有很多其他因素。 但到目前為止,無論以哪一個因素為主,或怎樣組合這些因素,都不可能完全正確從多個網(wǎng)頁中挑出原始出處。 比如說我這個博客就很新,域名也很新,文章被收錄的時間有的時候也不一定是最早的,就權(quán)威地位和被信任度來說,也肯定比不上很多中文網(wǎng)站。但我的博客新,我的域名新,并不意味著我的內(nèi)容就不是原始出處,實(shí)際上我的所有博客都是原創(chuàng)。 我最近也發(fā)現(xiàn)了很多網(wǎng)站都轉(zhuǎn)載,有的時候是抄襲我的博客內(nèi)容,很多網(wǎng)站的規(guī)模,歷史,PR值都比我的網(wǎng)站要高的多。 在檢測文章原始出處方面,Google做的比較好,基本上能夠正確判斷,百度做的就比較差。從我的文章在不同的地方出現(xiàn)的情況看,百度似乎認(rèn)為域名比較老的就是原創(chuàng)。( 本文出自:億恩科技【1tcdy.com】 服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |