国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 學(xué)院 > 開(kāi)發(fā)設(shè)計(jì) > 正文

Java 根據(jù)關(guān)鍵字抓取google 新聞 網(wǎng)絡(luò)數(shù)據(jù)

2019-11-17 04:02:28
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友
用戶要求統(tǒng)計(jì)所提供關(guān)鍵字在網(wǎng)絡(luò)出現(xiàn)的新聞,下面為一個(gè)測(cè)試的main方法。

package com.net;

import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
* @{#} NetTools.java Create on Nov 18, 2009 4:55:57 PM
*
* Copyright (c) 2009 by ThinkIT
* @author Jack He ,jackhexl@Gmail.com
* @version 1.0
*/

public class NetTools {

PRivate String url = "";// 請(qǐng)求的URL
private String keyWord = "";// 搜索的關(guān)鍵字
private StringBuffer strBuffer = new StringBuffer("");
private List newsList=new ArrayList();//新聞數(shù)組

public static void main(String [] args){
  List list=new ArrayList();
  NetTools nt=new NetTools();
  try {
   list=nt.getNews("", new String[]{"環(huán)保局"});
   for(int i=0;i<list.size();i++){
    System.out.println(list.get(i).toString());
   }
   
  } catch (IOException e) {
   // TODO Auto-generated catch block
   e.printStackTrace();
  }
}
public List getNews(String url,String[] keywords) throws IOException{
  if(url.equals("")||null==url)
   url="http://news.google.cn/news/search?cf=all&scoring=n&pz=1&cf=all&ned=ccn&hl=zh-CN&q=";
  int i=0;
  this.url=url;
  //關(guān)鍵字
  for(;i<keywords.length;i++){
   this.keyword+=keywords[i]+" ";   
  }
  this.url+=java.net.URLEncoder.encode(this.keyword,"UTF-8");// 帶參數(shù)的請(qǐng)求地址
  System.out.println("請(qǐng)求地址為:"+this.url);
  URL requestUrl=new URL(this.url);
  // 打開(kāi)鏈接
  HttpURLConnection connection = (HttpURLConnection) requestUrl.openConnection();
  connection.setRequestProperty("User-Agent", "Mozilla/4.0 (compatible; MSIE 5.0; Windows NT; DigExt)");
  connection.connect();

  InputStream is=connection.getInputStream();
  String content;
        while ((is.read()) != -1)   
        {   
            int all = is.available();   
            byte[] b = new byte[all];   
            is.read(b);   
            strBuffer.append(new String(b, "UTF-8"));   
        }
        if(is!=null) is.close();
        content=strBuffer.toString();
  Pattern regexContent = Pattern.compile("<h2 class=/"title/">*</h2>",
    Pattern.CASE_INSENSITIVE);
  Matcher mcContent = regexContent.matcher(content);
  while (mcContent.find()) {
   String news = mcContent.group();
   newsList.add(news);
  }

  return newsList;
}
}
發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 广水市| 紫阳县| 贵定县| 周至县| 乐清市| 鸡东县| 花莲县| 上林县| 灵宝市| 囊谦县| 丽江市| 额敏县| 宁国市| 永城市| 舞阳县| 平阴县| 保定市| 肇东市| 固镇县| 庆安县| 五台县| 合川市| 晋城| 工布江达县| 长垣县| 新昌县| 玛曲县| 依兰县| 聂荣县| 德格县| 鄯善县| 观塘区| 新邵县| 沐川县| 晋江市| 大厂| 新绛县| 乐安县| 建水县| 阳曲县| 建瓯市|