使用Java獲取網(wǎng)頁(yè)源文件,可以使用正則表達(dá)式獲取鏈接地址,因?yàn)檎齽t表達(dá)式不好學(xué)習(xí),所以很多程序員都會(huì)使用JSP抓取網(wǎng)頁(yè)代碼的程序,下面就跟著錯(cuò)新技術(shù)頻道小編的步伐來(lái)了解一下吧!
JSP抓取網(wǎng)頁(yè)代碼的程序
<%@ page contentType="text/html;charset=gb2312"%>
<%??
String sCurrentLine;??
String sTotalString;??
sCurrentLine="";??
sTotalString="";??
java.io.InputStream l_urlStream;??
java.net.URL l_url = new java.net.URL("http://www.163.net/");??
java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection();??
l_connection.connect();??
l_urlStream = l_connection.getInputStream();??
java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream));??
while ((sCurrentLine = l_reader.readLine()) != null)??
{??
sTotalString+=sCurrentLine;??
}??
out.println(sTotalString);??
%>
上文是錯(cuò)新技術(shù)頻道小編為大家整理的JSP抓取網(wǎng)頁(yè)代碼的程序,雖然代碼相對(duì)比較簡(jiǎn)單,但我認(rèn)為根據(jù)這一點(diǎn),我們可以實(shí)現(xiàn)“網(wǎng)頁(yè)爬蟲”的功能。
新聞熱點(diǎn)
疑難解答
圖片精選