老Y文章管理系統(tǒng)采集自動偽原創(chuàng)詳解 |
發(fā)布時間: 2012/7/10 17:42:38 |
做垃圾站的站長們,最希望的事就是網(wǎng)站可以自動采集、自動完成偽原創(chuàng)、然后自動收錢,這實在是天底下最幸福的事,呵呵。自動采集和自動收錢就不討論了,我今天介紹一下如何利用老Y文章管理系統(tǒng)采集時自動完成偽原創(chuàng)的方法。 老Y文章管理系統(tǒng)使用簡單、方便,雖然功能不如DEDE之類的強大到幾乎變態(tài)的程度(當然,老Y文章管理系統(tǒng)是asp語言寫的,似乎也沒有可比性),但是該有的都有,且相當簡單,所以也受到了不少站長們的歡迎。老Y文章管理系統(tǒng)采集時自動完成偽原創(chuàng)的具體方法還很少有人探討,在老Y的論壇上,甚至有人在賣這個方法,小小的鄙視一下。 關于采集,我就不多說了,相信大家都可以搞定,我要介紹的是老Y文章管理系統(tǒng)如何在采集的同時自動完成偽原創(chuàng)工作的具體方法,大體的思路就是利用老Y 文章管理系統(tǒng)自帶的過濾功能實現(xiàn)近義詞的自動替換,從而達到偽原創(chuàng)的目的。比如我想將被采集文章中的所有“網(wǎng)賺博客”字樣替換為“網(wǎng)賺日記”。詳細步驟如下: 第一步,進入后臺。找到“采集管理”-“過濾管理”,添加一個新的過濾項目。 我可以建立一個名為“網(wǎng)賺博客”的項目,具體設置請看圖:
“過濾名稱”:填入“網(wǎng)賺博客”即可,也可以隨意寫,但是為了方便查看,建議與被替換的詞語一致。 “所屬項目”:請根據(jù)自己的網(wǎng)站進行選擇一個網(wǎng)站欄目(必須選擇一個欄目,否則過濾項目無法保存)。 “過濾對象”:可選項有“標題過濾”和“正文過濾”,一般選“正文過濾”即可,如果你連標題都想偽原創(chuàng)一下,可以選擇“標題過濾”。 “過濾類型”:可選項有“簡單替換”和“高級過濾”,一般選“簡單替換”,如果選擇了“高級過濾”,需要指定“開始標記”和“結束標記”,這樣可對采集來的內容進行代碼級的替換。 “使用狀態(tài)”:可選項有“啟用”和“禁用”,不用解釋。 “使用范圍”:可選項有“公有”和“私有”。選擇“私有”,該過濾僅對當前網(wǎng)站欄目有效;選擇“公有”,對所有欄目都有效,不管采集任何欄目的任何內容,該過濾均有效。一般選“私有”即可。 “內容”:填入“網(wǎng)賺博客”,將要被替換的詞語。 “替換”:填入“網(wǎng)賺日記”,這樣只要被采集的文章中含有“網(wǎng)賺博客”字樣,就會被自動替換為“網(wǎng)賺日記”。 第二步,重復第一步的工作,直到添加完所有的近義詞。 有網(wǎng)友要問了:我有30000多條近義詞,難道要一條一條手動添加?那要到添加什么時候!?不能批量添加嗎? 這個問題問得好!手動添加的確幾乎是個不可能完成的任務,除非你有超常的毅力,可以手工把這30000多條近義詞添加進去。遺憾的是,老Y文章管理系統(tǒng)并沒有提供批量導入的功能。但是,作為真正的、資深的、有思想的懶人,我們要有懶人的覺悟。 要知道,我們剛才輸入的內容,是存儲在數(shù)據(jù)庫中的,而老Y文章管理系統(tǒng)是用asp+Access寫的,mdb數(shù)據(jù)庫可以很方便的編輯!于是乎,我可以通過直接修改數(shù)據(jù)庫的方法來批量導入偽原創(chuàng)替換規(guī)則! 改進的第二步:修改數(shù)據(jù)庫,批量導入規(guī)則。 經過查找,我發(fā)現(xiàn)這個數(shù)據(jù)庫位于“你的管理目錄\cai\Database”下。用Access打開這個數(shù)據(jù)庫,找到“Filters”表,你會發(fā)現(xiàn)我們剛才添加的替換規(guī)則就在這兒存著呢,根據(jù)你的需要,批量添加吧!接下來的工作涉及到Access的操作了,我就不羅嗦了,大家自己可以搞定。 解釋一下“Filters”表中的幾個字段的含義: FilterID:自動生成,無需輸入。 ItemID:欄目ID,就是我們手動輸入時“所屬項目”的內容,不過這里是個數(shù)字ID,注意跟欄目的采集ID做好對應,如果不知道ID,可以重復第一步,測試一下。 FilterName:即“過濾名稱”。 FilterObjece:即“過濾對象”,填1為“標題過濾”,填2則是“正文過濾”。 FilterType:即“過濾類型”,填1為“簡單替換”,填2為“高級過濾”。 FilterContent:即“內容”。 FisString:即“開始標記”,僅在設置了“高級過濾”時有效,如果設置了“簡單過濾”請留空。 FioString:即“結束標記”,僅在設置了“高級過濾”時有效,如果設置了“簡單過濾”請留空。 FilterRep:即“替換”。 Flag:即“使用狀態(tài)”,TRUE為“啟用”,F(xiàn)ALSE為“禁用”。 PublicTf:即“使用范圍”。TRUE為“公有”,F(xiàn)ALSE為“私有”。 最后說一點利用過濾功能實現(xiàn)偽原創(chuàng)的使用感受: 老Y文章管理系統(tǒng)的這個功能可以實現(xiàn)采集時自動偽原創(chuàng),但是功能還不夠強大。比如我站上有“欄目一”、“欄目二”、“欄目三”共三個欄目。我希望“欄目一”對標題和正文都進行偽原創(chuàng),“欄目二”只對正文進行偽原創(chuàng),“欄目三”只對標題進行偽原創(chuàng)。 于是,我只能做如下設置(假設我有30000的近義詞規(guī)則): 為“欄目一”的標題偽原創(chuàng)創(chuàng)建30000條替換規(guī)則; 為“欄目一”的正文偽原創(chuàng)創(chuàng)建30000條替換規(guī)則; 為“欄目二”的正文偽原創(chuàng)創(chuàng)建30000條替換規(guī)則; 為“欄目三”的標題偽原創(chuàng)創(chuàng)建30000條替換規(guī)則。 這樣就造成了極大的數(shù)據(jù)庫浪費,如果我的站有幾十個欄目,每個欄目的要求都不一樣,這個數(shù)據(jù)庫的尺寸將會十分恐怖。 所以建議老Y文章管理系統(tǒng)下一版本將這個功能做一下改進: 首先添加批量導入功能,畢竟修改數(shù)據(jù)庫有一定的危險性。 其次,過濾規(guī)則不再依附于某個網(wǎng)站欄目,而是將過濾規(guī)則獨立出來,而在建立新的采集項目的時候,加入一條是否使用過濾規(guī)則的判斷。 相信,這樣修改之后可以極大地節(jié)約數(shù)據(jù)庫存儲空間,同時邏輯結構也顯得更加清晰。 本文出自:億恩科技【1tcdy.com】 |