洞悉互聯(lián)網(wǎng)前沿資訊,探尋網(wǎng)站營(yíng)銷(xiāo)規(guī)律
作者:Smileby陌少羽 | 2019-04-21 10:21 |點(diǎn)擊:
首先這個(gè)規(guī)則采集俠默認(rèn)都是自動(dòng)識(shí)別的,但是自動(dòng)識(shí)別的效果有可能沒(méi)有自己設(shè)置的好,也有可能有的網(wǎng)站采集俠識(shí)別不了,如果標(biāo)題和內(nèi)容采集俠識(shí)別不到那么就什么都采集不到了!所以這里建議是內(nèi)容規(guī)則最好手工設(shè)置,而作者和來(lái)源規(guī)則可以不設(shè)置,也可以到采集俠的高級(jí)設(shè)置菜單里設(shè)置成固定的作者以及來(lái)源。
標(biāo)題、作者、來(lái)源、內(nèi)容和分頁(yè)規(guī)則的寫(xiě)法都是一樣的,懂得其中一項(xiàng)的寫(xiě)法,其他幾項(xiàng)都懂得了,所以這里就以?xún)?nèi)容規(guī)則來(lái)舉例說(shuō)明。
采集俠是怎么根據(jù)你的規(guī)則找到文章內(nèi)容的呢,其實(shí)就是你寫(xiě)個(gè)規(guī)則告訴它文章從哪里開(kāi)始,從哪里結(jié)束,最后寫(xiě)成規(guī)則就是 開(kāi)始的地方的代碼[內(nèi)容]結(jié)束的地方的代碼,
比如我要采集站長(zhǎng)之家優(yōu)化欄目里面的文章,打開(kāi)文章列表中其中一篇,
如:
http://www.chinaz.com/web/2015/0702/418785.shtml
打開(kāi)后,右鍵查看源碼,通過(guò)查看源碼找到文章處,你可以通過(guò)搜索文章中的句子去找文章所在的大概位置
最后我們把前后的代碼做成規(guī)則,就是
<div class="article-detail-bd">[內(nèi)容]</div>
最后點(diǎn)擊測(cè)試,如果測(cè)試成功了點(diǎn)擊保存即可采集
請(qǐng)直接添加技術(shù)總監(jiān)微信聯(lián)系咨詢(xún)