.新建一個采集項目:
1.基本設(shè)置
查看其源代碼 (這里演示的是采集自己的本機上網(wǎng)站),找到用戶登錄的那段代碼:比如動易的有兩種登錄情況:
a.網(wǎng)站首頁,是這里
http://l27.0.0.1/II/UserLogin.asp 填入登錄地址框里就行了;
b.是單獨的用戶登錄窗口,這種就比較方便,直接把瀏覽器上的地址復(fù)制下來,填入登錄地址框就行了(上面第二 個圖).
提交地址: 這里獲取地址的最簡單方法是,在對方網(wǎng)站登錄時隨便輸入一個錯誤的用戶名和密碼,點登錄后,這時一般都會出現(xiàn)一個提示登錄不正確的頁面,把這個頁面的地址復(fù)制下來就行了.
用戶參數(shù)和密碼參數(shù): 參照圖片上的設(shè)置,要改的只是把 "=" 后面改成正確的登錄參數(shù)
失敗信息: 這里是把登錄出錯時的頁面上的信息提示復(fù)制下來,如下圖示例:
/II/Article/ShowClass.asp?ClassID=5&page=2
分頁設(shè)置里的另外兩個設(shè)置 批量生成 已經(jīng)有示例說明,這里不再寫出; 手動添加 是當列表的分頁出現(xiàn)不能設(shè)置的情況下,手工直接在輸入框里添加上列表的每個分頁的鏈接代碼.
鏈接設(shè)置
找到某一個文章標題的鏈接段代碼,如圖示
/II/Article/ShowArticle.asp?ArticleID=65
所以在這步,我們把這個鏈接地址的頭尾分別截取下來,以使系統(tǒng)正確獲取鏈接地址,如下圖示:

3. 分頁設(shè)置 :當正文里出現(xiàn)有分頁的時候,就要用到這個設(shè)置,先看下這篇文章的分頁情況:



2. 文章設(shè)置:設(shè)置將采集的文章的相關(guān)屬性(和添加文章時的設(shè)置一樣)
3. 收費設(shè)置:設(shè)置將采集的文章的收費屬性(和添加文章時的設(shè)置一樣)
新聞熱點
疑難解答
圖片精選