說(shuō)明:如果您有任何疑問(wèn)或想咨詢(xún)其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732
全網(wǎng)監(jiān)測(cè)海量數(shù)據(jù)按需發(fā)布監(jiān)測(cè)預(yù)警
實(shí)時(shí)把握輿情動(dòng)態(tài)精準(zhǔn)追溯信息源頭
一個(gè)大型的資訊網(wǎng)站在發(fā)表文章時(shí),如果是一條條的文章網(wǎng)上發(fā),這不僅浪費(fèi)時(shí)間,效率還不高,這時(shí)為了提高更新網(wǎng)站的效率,就出現(xiàn)了火車(chē)頭采集器,可是火車(chē)頭采集規(guī)則怎么寫(xiě)呢?接下來(lái)就由小編來(lái)詳細(xì)的介紹吧。
火車(chē)頭采集規(guī)則寫(xiě)法介紹
步驟一:新建一個(gè)文章采集節(jié)點(diǎn)
登錄后臺(tái),依次點(diǎn)擊 采集>>采集節(jié)點(diǎn)管理>>增加新節(jié)點(diǎn)>>選擇普通文章>>確定
步驟二 :填寫(xiě)采集列表規(guī)則
1.節(jié)點(diǎn)名稱(chēng):隨便(注意你要能分清哦,因?yàn)楣?jié)點(diǎn)多了的話,有可能會(huì)搞得自己混亂)
2.目標(biāo)頁(yè)面編碼:看目標(biāo)頁(yè)面的編碼
3.匹配網(wǎng)址:去到采集目標(biāo)列表頁(yè)面,查看它的列表規(guī)則!比如說(shuō)很多網(wǎng)站的列表的第一面跟其它內(nèi)頁(yè)是有很大的差別的,所以我一般不采集目標(biāo)列表的第一頁(yè)!
最好是從第二頁(yè)開(kāi)始(雖然可以找出第一頁(yè),但很多的網(wǎng)站是根本沒(méi)第一頁(yè)的,所以,這里就不說(shuō)怎么找第一頁(yè)了)
4.區(qū)域結(jié)束的HTML:在采集目標(biāo)列表頁(yè)打開(kāi)源代碼!在要采集的文章標(biāo)題后面的附近找一段在本頁(yè)是唯一并且其它要采集的的頁(yè)面也是唯一的html標(biāo)簽!
寫(xiě)好了,點(diǎn)擊保存信息并進(jìn)入下一步!如果寫(xiě)正確了規(guī)則的話,那這些就會(huì)出現(xiàn)一個(gè)有內(nèi)容的網(wǎng)址獲取規(guī)則測(cè)試
再按下一步!進(jìn)入填寫(xiě)采集內(nèi)容規(guī)則
步驟三:采集內(nèi)容規(guī)則
1.文章標(biāo)題:在文章標(biāo)題前后找兩個(gè)標(biāo)簽,能識(shí)別出標(biāo)題的!
2.文章內(nèi)容:在文章內(nèi)容前后找兩個(gè)標(biāo)簽,能識(shí)別出內(nèi)容的!我采集的網(wǎng)站的文章內(nèi)容前后唯一標(biāo)簽是<div class=”content”>…<ul class=”page clearfix”>,所以就寫(xiě)成<div class=”content”>[內(nèi)容]<ul class=”page clearfix”>!
其它的功能,也不用管!這里只分享怎么能采到文章!然后,點(diǎn)擊保存配置并預(yù)覽,如果前面的列表規(guī)則跟內(nèi)容規(guī)則都寫(xiě)對(duì)了的話,那現(xiàn)在就會(huì)預(yù)覽到內(nèi)容了!
點(diǎn)擊僅保存,如果你要馬上采集的話,也可以點(diǎn)擊隔壁的保存并馬上采集!
火車(chē)頭采集規(guī)則導(dǎo)入方法
1.導(dǎo)入規(guī)則方法一
右鍵點(diǎn)擊剛才新建的分組,選擇“導(dǎo)入任務(wù)至該分組”(記?。翰皇恰皩?dǎo)入分組規(guī)則”),在彈出的對(duì)話框中選擇已經(jīng)采集規(guī)則文件(后綴為.ljobx)。
2.導(dǎo)入規(guī)則方法二
也可以選擇剛才新建的分組,然后依次點(diǎn)擊菜單“分組”->“導(dǎo)入任務(wù)至該分組” 在彈出的對(duì)話框中選擇已經(jīng)采集規(guī)則文件(后綴為.ljobx)。
3.導(dǎo)入分組規(guī)則
如果你手上的規(guī)則文件后綴名為“.lgrp”,那么你需要通過(guò)菜單或右鍵快捷菜單選擇“導(dǎo)入分組規(guī)則”,而不是“導(dǎo)入任務(wù)至該分組”。
好了,有關(guān)火車(chē)頭采集規(guī)則寫(xiě)法就介紹到這里了,當(dāng)然想要掌握這個(gè)寫(xiě)法的可不是馬上就能完成的事情,是需要在不斷的實(shí)踐中去掌握和運(yùn)用的,所以想要掌握格則寫(xiě)法的,現(xiàn)在就開(kāi)始練習(xí)吧。如果想了解更多的內(nèi)容,歡迎關(guān)注我們文軍營(yíng)銷(xiāo)的官網(wǎng)。
推薦閱讀
火車(chē)頭采集規(guī)則寫(xiě)法介紹 火車(chē)頭采集規(guī)則如何導(dǎo)入? | 文軍營(yíng)銷(xiāo)點(diǎn)擊僅保存,如果你要馬上采集的話,也可以點(diǎn)擊隔壁的保存并馬上采集! 火車(chē)頭采集規(guī)則導(dǎo)入方法 1.導(dǎo)入規(guī)則方法一 右鍵點(diǎn)擊剛才新建的分組,選擇“導(dǎo)入任務(wù)至該分組”(記住:不是“導(dǎo)入分組規(guī)則”),在彈出的對(duì)話框中選擇已經(jīng)采集規(guī)則文件(后綴為.ljobx)。 2.導(dǎo)入規(guī)則方法二 也可以選擇剛才新建的分組,然后依次點(diǎn)擊菜單“...火車(chē)頭采集器教程步驟 火車(chē)頭采集器使用教程介紹 | 文軍營(yíng)銷(xiāo)1點(diǎn)擊右下角的“網(wǎng)址采集測(cè)試”, 2測(cè)試后,如果網(wǎng)址是這么顯示出來(lái)的,那就是采集成功了。點(diǎn)擊其中一個(gè)網(wǎng)址左邊的“+”符號(hào),可以看到該欄目頁(yè)面采集到的內(nèi)容。 火車(chē)頭采集器教程之?dāng)?shù)據(jù)采集步驟 火車(chē)采集器采集數(shù)據(jù)是分成兩個(gè)步驟的,一是采集數(shù)據(jù),二是發(fā)布數(shù)據(jù)。這兩個(gè)過(guò)程是可以分開(kāi)的。 1、采集數(shù)據(jù),這個(gè)包括采集...火車(chē)頭采集器 火車(chē)頭采集器是什么 | 文軍營(yíng)銷(xiāo)這種方式可以將采集的數(shù)據(jù)發(fā)布到本地的文件中,采集器支持保存成Txt格式、Csv格式和Html格式。 方式三:導(dǎo)入到自定義數(shù)據(jù)庫(kù) 這種方式可以通過(guò)采集器連接到其他數(shù)據(jù)庫(kù)從而將采集的數(shù)據(jù)從軟件內(nèi)置數(shù)據(jù)庫(kù)中導(dǎo)入到其他的數(shù)據(jù)庫(kù)中,采集器支持連接Mysql、Access、Oracle、MSsql數(shù)據(jù)庫(kù)。 方式四:保存為本地Sql文件(Insert語(yǔ)句) ...火車(chē)頭采集器教程步驟 火車(chē)頭采集器使用教程介紹 | 文軍營(yíng)銷(xiāo)1點(diǎn)擊右下角的“網(wǎng)址采集測(cè)試”, 2測(cè)試后,如果網(wǎng)址是這么顯示出來(lái)的,那就是采集成功了。點(diǎn)擊其中一個(gè)網(wǎng)址左邊的“+”符號(hào),可以看到該欄目頁(yè)面采集到的內(nèi)容。 火車(chē)頭采集器教程之?dāng)?shù)據(jù)采集步驟 火車(chē)采集器采集數(shù)據(jù)是分成兩個(gè)步驟的,一是采集數(shù)據(jù),二是發(fā)布數(shù)據(jù)。這兩個(gè)過(guò)程是可以分開(kāi)的。 1、采集數(shù)據(jù),這個(gè)包括采集...火車(chē)頭采集器 火車(chē)頭采集器是什么 | 文軍營(yíng)銷(xiāo)火車(chē)頭采集器的四種保存方法 方式一:Web在線發(fā)布到網(wǎng)站 這種發(fā)布方式類(lèi)似于在網(wǎng)站后臺(tái)手工添加數(shù)據(jù)一樣。采集器將數(shù)據(jù)發(fā)送給網(wǎng)站后臺(tái)程序,由網(wǎng)站后臺(tái)程序去處理數(shù)據(jù)通常后臺(tái)程序講數(shù)據(jù)存入網(wǎng)站數(shù)據(jù)庫(kù)中。 方式二:保存為本地文件 這種方式可以將采集的數(shù)據(jù)發(fā)布到本地的文件中,采集器支持保存成Txt格式、Csv格式和Html格式...
說(shuō)明:如果您有任何疑問(wèn)或想咨詢(xún)其他業(yè)務(wù)請(qǐng)撥打電話 400 685 0732