国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

基于Java的數據采集(二)

2019-11-14 20:50:28
字體:
來源:轉載
供稿:網友
基于java的數據采集(二)

在上一篇文章《基于Java的數據采集(一)》:http://m.survivalescaperooms.com/lichenwei/p/3904715.html

提到了如何如何讀取網頁源代碼,并通過group正則 動態抓取我們所需要的網頁數據

現在來寫下關于數據的存儲,思路很簡單,只需要在我們每次讀取一個數據的時候,把數據存放在臨時變量,然后插入數據庫即可。

《基于Java數據采集入庫(三)》:http://m.survivalescaperooms.com/lichenwei/p/3907007.html

《基于Java數據采集入庫(終結篇)》:http://m.survivalescaperooms.com/lichenwei/p/3910492.html

先來建一個表:

DoMySQL.java(數據庫連接類,并提供插入數據的方法)

 1 package com.lcw.curl; 2  3  4 import java.sql.Connection; 5 import java.sql.DriverManager; 6 import java.sql.SQLException; 7 import java.sql.Statement; 8  9 10 public class DoMySql {11   12     //定義MySql驅動,數據庫地址,數據庫用戶名 密碼, 執行語句和數據庫連接  13     public String driver = "com.mysql.jdbc.Driver";14     public String url = "jdbc:mysql://127.0.0.1:3306/football";15     public String user = "root";16     public String passWord = "";17     public Statement stmt = null;18     public Connection conn = null;19     20     //創建一個插入數據的方法21     public void datatoMySql(String insertSQl) {22 23         try {24             try {25                 Class.forName(driver).newInstance();26             } catch (Exception e) {27             28                 e.PRintStackTrace();29             }30             //創建連接31             conn = DriverManager.getConnection(url, user, password);32             //創建一個 Statement 對象來將 SQL 語句發送到數據庫33             stmt = conn.createStatement();34         } catch (SQLException e) {35             e.printStackTrace();36         }37         try {38             //執行SQL 插入語句39             stmt.executeUpdate(insertSQl);40         } catch (SQLException e) {41             e.printStackTrace();42         }43         try {44             stmt.close();45             conn.close();46         } catch (SQLException e) {47             e.printStackTrace();48         }49     }50     51 }

GetData.java(過濾數據類)

 1 package com.lcw.curl; 2  3 import java.util.regex.Matcher; 4 import java.util.regex.Pattern; 5  6 public class GetData { 7      8     /** 9      * 10      * @param regex 正則表達式11      * @param content 所要匹配的內容12      * @return13      */14     public String getData(String regex,String content){15         Pattern pattern=Pattern.compile(regex, Pattern.CASE_INSENSITIVE);//設定正則表達式,不區分大小寫16         Matcher matcher=pattern.matcher(content);17         if(matcher.find()){18             return matcher.group();19         }else{20             return "";21         }22     }23 24 }

CurlMain.java主程序類:

 1 package com.lcw.curl; 2  3 import java.io.BufferedReader; 4 import java.io.InputStreamReader; 5 import java.net.URL; 6  7 public class CurlMain { 8  9     /**10      * @param args11      */12     public static void main(String[] args) {13 14         try {15             String address = "http://www.footballresults.org/league.php?league=EngDiv1";16             URL url = new URL(address);17             InputStreamReader inputStreamReader = new InputStreamReader(url18                     .openStream(), "utf-8");// 打開地址,以UTF-8編碼的形式返回字節并轉為字符19             BufferedReader bufferedReader = new BufferedReader(20                     inputStreamReader);// 從字符輸入流中讀取文本,緩沖各個字符,從而提供字符、數組和行的高效讀取。21 22             GetData data = new GetData();23             DoMySql mySql = new DoMySql();24             String content = "";// 用來接受每次讀取的行字符25             int flag = 0;// 標志,隊伍信息剛好在日期信息后面,則正則相同,用于分離數據26             String dateRegex = "http://d{1,2}//.//d{1,2}//.//d{4}";// 日期匹配正則表達式27             String teamRegex = ">[^<>]*</a>";// 隊伍匹配正則表達式28             String scoreRegex = ">(//d{1,2}-//d{1,2})</TD>";// 比分正則表達式29             String tempDate="";30             String teama="";31             String teamb="";32             String score="";33             int i = 0;// 記錄信息條數34             String sql = "";35 36             while ((content = bufferedReader.readLine()) != null) {// 每次讀取一行數據37                 // 獲取比賽日期信息38                 String dateInfo = data.getData(dateRegex, content);39                 if (!dateInfo.equals("")) {40                     System.out.println("日期:" + dateInfo);41                     tempDate=dateInfo;42                     flag++;43                 }44                 // 獲取隊伍信息,需先讀到日期信息讓標志符自增45                 String teamInfo = data.getData(teamRegex, content);46                 if (!teamInfo.equals("") && flag == 1) {47                     teama = teamInfo.substring(1, teamInfo48                             .indexOf("</a>"));49                     System.out.println("主隊:" + teama);50                     flag++;51                 } else if (!teamInfo.equals("") && flag == 2) {52                     teamb = teamInfo.substring(1, teamInfo53                             .indexOf("</a>"));54                     System.out.println("客隊:" + teamb);55                     flag = 0;56                 }57                 // 獲取比分信息58                 String scoreInfo = data.getData(scoreRegex, content);59                 if (!scoreInfo.equals("")) {60                     score = scoreInfo.substring(1, scoreInfo61                             .indexOf("</TD>"));62                     System.out.println("比分:" + score);63                     System.out.println();64                     i++;65                     sql = "insert into football(`date`,`teama`,`teamb`,`score`) values('"66                             + tempDate67                             + "','"68                             + teama69                             + "','"70                             + teamb71                             + "','"72                             + score + "')";73                     System.out.println(sql);74                     mySql.datatoMySql(sql);75                 }76 77             }78             bufferedReader.close();79             System.out.println("一共收集到了" + i + "條信息");80         } catch (Exception e) {81             e.printStackTrace();82         }83 84     }85 86 }

看下運行效果圖:

下一篇文章:《基于Java的數據采集(三)》:http://m.survivalescaperooms.com/lichenwei/p/3905370.html


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 青浦区| 丰城市| 景德镇市| 工布江达县| 固阳县| 保靖县| 衡山县| 布尔津县| 泸定县| 三江| 周口市| 伊通| 醴陵市| 宕昌县| 金湖县| 平武县| 望都县| 南部县| 南平市| 玛沁县| 乐安县| 郸城县| 金秀| 宁津县| 桑植县| 石楼县| 精河县| 桂林市| 海晏县| 方正县| 诏安县| 治县。| 三穗县| 大余县| 望谟县| 肃北| 邵东县| 新丰县| 五常市| 苍梧县| 三亚市|