用俠客站群系統(tǒng)對(duì)某健康網(wǎng)保健欄目抓取模塊 |
發(fā)布時(shí)間: 2012/8/24 11:13:28 |
本節(jié)進(jìn)入使用俠客站群系統(tǒng)對(duì)某健康網(wǎng)抓取模塊流程2的制作,采取正則提取內(nèi)容鏈接,在普通教程里,這節(jié)是按視覺提取的,我也這么操作過,但是通過篩選,怎么也弄不出來,只好通過源文件設(shè)置了正則公式才告成功,正則不明白的可以去www.xiake5.com網(wǎng)站看相關(guān)視頻。 找到上節(jié)里提到的入口地址:http://man.xx.net/nxbj/bjcs,咱們進(jìn)去瞅瞅吧:
看到了吧,這些都是文章,成片的文章吶,嘎嘎嘎,抓走,取走,一個(gè)不留,三光政策,還等啥呢,下手吧,找源文件吧:
這里我把源文件和頁(yè)面都調(diào)到了一起 了,這樣更容易看一點(diǎn),呵呵,頁(yè)面上的文章,在源文件里都看到了吧,利用正則,全都提取,在這里我試過其他辦法,就是不行,只有使用正則,才能提取,不知 道是不是因?yàn)槭荍S的問題,利用俠客站點(diǎn)上提供的:俠客正則測(cè)試工具,測(cè)試下正則公式吧:
恩,正則公式提取內(nèi)容鏈接成功,將公式復(fù)制下來后, 在回來的頁(yè)面:
點(diǎn)擊“流程2:獲取內(nèi)容鏈接”,彈出:
選擇“未命名規(guī)則”,彈出
好滴啦,這樣流程2就算提取完了,一步步的保存就可以了,流程3內(nèi)容取得,下回書再說。 本文出自:億恩科技【1tcdy.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |