Node.JS有一個request模塊,可以很方便的抓取網頁內容。最簡單的一個示例:
var request = require('request');request('http://www.google.com', function (error, response, body) { if (!error && response.statusCode == 200) {  console.log(body); }})由上例可以看出用request發起一個http請求確實非常簡單,不過唯一的問題就是,request模塊的第三方依賴比較多,導致這個模塊非常地大,要占用好幾M的空間。
其實用node.js原生的http模塊就可以很方便地寫出一個類似的request的功能,只要幾十行即可:
var http = require('http')var url  = require('url')var request = function(reqUrl, data, cb, headers) { var dataType = typeof data if (dataType == 'function') {  headers = cb  cb   = data  rawData = null } else if (dataType == 'object') {  rawData = JSON.stringify(data) } else {  rawData = data } var urlObj = url.parse(reqUrl) var options = {   hostname : urlObj.hostname  , port   : urlObj.port  , path   : urlObj.pathname  , method  : rawData ? 'post' : 'get' } headers && (options.headers = headers) var req = http.request(options, function(res) {  var receives = []  if (res.statusCode !== 200) {   cb && cb(new Error('Request Failed. Status Code: ' + res.statusCode + ' ' + reqUrl))   return  }  res.on('data', function(chunk) {   receives.push(chunk)  })  res.on('end', function() {   var resData = Buffer.concat(receives).toString()   try {    resData = JSON.parse(resData)   } catch (e) { }   cb && cb(null, res, resData)  }) }) req.on('error', function(e) {  cb && cb(e) }) rawData && req.write(rawData) req.end()}module.exports = request使用接口與request模塊是一樣的,比如我們抓取新浪新聞首頁的內容
request('http://news.sina.com.cn', function(err, res, data) { console.log('geted', data)})其次它還支持抓取時附加cookie等header認證信息,如
request('http://news.sina.com.cn', function(err, res, data) { console.log('get with cookie', data)}, { cookie: '_sessionid=1234567890' })對POST的支持
request('http://news.sina.com.cn', { postdata: 'json' }, function(err, res, data) { console.log('get with cookie', data)}, { cookie: '_sessionid=1234567890' })以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持武林網。
新聞熱點
疑難解答