蜘蛛抓取工具分析_Lynx 在線版以及瀏覽器插件 |
發(fā)布時間: 2012/9/15 14:19:13 |
Lynx 在線版以及瀏覽器插件
最近還是太忙,所以關于內(nèi)外部鏈接的文章還沒開始寫。現(xiàn)在給大家一個Lynx 在線版以及相關的瀏覽器插件。
我在《Lynx瀏覽器在SEO上的應用》一文中介紹過這個工具。不過有些人說在linux下沒有安裝好或者有亂碼的出現(xiàn)。后來有人給我看了國外的一個Lynx在線版,但是那個在線版也存在著一些問題。我的這個Lynx 在線版把那些問題都解決了,使用起來還不錯。
如果正在仔細閱讀《google網(wǎng)站質量指南》的朋友應該能注意到,在這個《google網(wǎng)站質量指南》里,至少十幾篇文章中都出現(xiàn)了要你去用Lynx檢測網(wǎng)站的提示。而且是一到具體的做法的時候,都說:請用Lynx去檢測你的網(wǎng)站,因為它和爬蟲看到的內(nèi)容幾乎一樣。這個工具在05年就有一些一線的SEOer在用了。
使用方法非常簡單,你只要填入你要查看的URL,點擊“查看”就可以了。網(wǎng)址要以http://開頭。
URL:
如,我輸入http://www.baidu.com/ ,查看到的界面如下:
以lynx查看百度
輸出的結果分為兩部分:
第一部分,就是搜索引擎爬蟲看到的內(nèi)容,這個內(nèi)容和別的查看方式都不一樣。不僅顯示了文字信息,還顯示了網(wǎng)頁的結構信息。去了解搜索引擎的原理就會知道,這種結構信息也是搜索引擎會儲存下來的。 并且在分析你的網(wǎng)站講了什么信息的時候,這些結構信息就是判斷的依據(jù)。每個錨文本旁邊還標上了這個鏈接的序號。
第二部分就是網(wǎng)站中所有爬蟲能夠識別的鏈接。有些網(wǎng)頁這里會顯示隱藏的鏈接。經(jīng)常有人問我這個隱藏鏈接要不要緊,我這里統(tǒng)一回答一下:其實不是太重要,當你網(wǎng)站的SEO優(yōu)化是正規(guī)的方法的話,可以忽視掉這個;但是當你用了很多黑帽的方法,這個隱藏鏈接就是讓你“罪加一等”的地方。所以在alibaba的首頁雖然也檢測出幾個隱藏鏈接,但是都沒改過來。
這個工具支持絕大部分編碼,日文、韓文、俄文等等都沒問題的。
還有兩個瀏覽器插件,一個是給 Firefox的,一個是給IE 的。
1,下載Lynx 在線版 for IE IE卸載文件
2,下載Lynx 在線版 for Firefox
裝上了插件后,在你瀏覽一個網(wǎng)頁的時候,在網(wǎng)頁上點擊右鍵的彈出菜單里,會有“以Lynx方式查看”的選項。這樣非常方便平常大家查看網(wǎng)頁。
瀏覽器右鍵菜單
由于這個工具放在國外的虛擬主機上,可能速度有點慢的。我還不知道有多少人會用這個工具,到時候可能有短暫的時間會使用不了。
不過大家可以先慢慢用著,以后還有講述如何更好的應用這個工具的文章。
為了更好的推廣這個工具,大家可以在自己的網(wǎng)站上,加上這個工具。
代碼為:
<form action=”http://lynx.semyj.com/lynxview.php” enctype=”application/x-www-form-urlencoded” method=”get” target=”_blank”>
URL:
<input id=”url” style=”width: 300px;” name=”url” type=”text” value=”http://” /> <input type=”submit” value=”查看” />
</form> 本文出自:億恩科技【1tcdy.com】 |