`

怎样用Java实现网站数据采集.txt

阅读更多
怎样用Java实现网站数据采集
测试了一下,使用HttpClient读取网页的内容
整个过程分为六步
1. 创建 HttpClient 的实例

2. 创建某种连接方法的实例,在这里是 GetMethod。在 GetMethod 的构造函数中传入待连接的地址

3. 调用第一步中创建好的实例的 execute 方法来执行第二步中创建好的 method 实例

4. 读 response

5. 释放连接。无论执行方法是否成功,都必须释放连接

6. 对得到后的内容进行处理
实现如下:
import java.io.IOException;  
import org.apache.commons.httpclient.*;  
import org.apache.commons.httpclient.methods.GetMethod;  
import org.apache.commons.httpclient.params.HttpMethodParams;  
public class HttpClientTest...{  
  public static void main(String[] args) {  
  //构造HttpClient的实例  
  HttpClient httpClient = new HttpClient();  
  //创建GET方法的实例  
  GetMethod getMethod = new GetMethod("http://www.crazyjava.org");  
  //使用系统提供的默认的恢复策略  
  getMethod.getParams().setParameter(HttpMethodParams.RETRY_HANDLER,  
    new DefaultHttpMethodRetryHandler());  
  try {  
   //执行getMethod  
   int statusCode = httpClient.executeMethod(getMethod);  
   if (statusCode != HttpStatus.SC_OK) {  
    System.err.println("Method failed: " 
      + getMethod.getStatusLine());  
   }  
   //读取内容  
   byte[] responseBody = getMethod.getResponseBoy();  
   //处理内容  
   System.out.println(new String(responseBody));  
  } catch (HttpException e) {  
   //发生异常,可能是协议不对或者返回的内容有问题  
   System.out.println("Please check your provided http address!");  
   e.printStackTrace();  
  } catch (IOException e) {  
   //发生网络异常  
   e.printStackTrace();  
  } finally {  
   //释放连接  
   getMethod.releaseConnection();  
  }  
}  

这样得到的是页面的源代码,再进行处理
分享到:
评论

相关推荐

    用Java实现断点续传.txt

    用Java实现断点续传.txt 用Java实现断点续传.txt 用Java实现断点续传.txt

    基于Java实现的Modbus通信模块电气设备数据采集.pdf

    基于Java实现的Modbus通信模块电气设备数据采集.pdf

    用JAVA实现LDAP的访问.txt

    用JAVA实现LDAP的访问.txt 用JAVA实现LDAP的访问.txt

    JAVA实现Modbus RTU或Modbus TCPIP数据采集.rar

    2.多线程之间为更方便的实现数据共享采用了共享相同内存地址空间的形式,并且是并发运行,导致多个线程可能会同时访问或修改其他线程正在使用的变量值,导致安全性,同时如果线程之间相互等待对方拥有的锁,会出现...

    java实现的数据采集系统.zip

    java实现的数据采集系统

    Java实现坦克大战游戏.zip

    Java实现坦克大战游戏.zipJava实现坦克大战游戏.zipJava实现坦克大战游戏.zip Java实现坦克大战游戏.zipJava实现坦克大战游戏.zipJava实现坦克大战游戏.zip Java实现坦克大战游戏.zipJava实现坦克大战游戏.zipJava...

    Java实现的扫雷游戏.zip

    Java实现的扫雷游戏.zipJava实现的扫雷游戏.zipJava实现的扫雷游戏.zip Java实现的扫雷游戏.zipJava实现的扫雷游戏.zipJava实现的扫雷游戏.zip Java实现的扫雷游戏.zipJava实现的扫雷游戏.zipJava实现的扫雷游戏.zip...

    Java实现贪吃蛇小游戏.zip

    Java实现贪吃蛇小游戏.zipJava实现贪吃蛇小游戏.zipJava实现贪吃蛇小游戏.zip Java实现贪吃蛇小游戏.zipJava实现贪吃蛇小游戏.zipJava实现贪吃蛇小游戏.zip Java实现贪吃蛇小游戏.zipJava实现贪吃蛇小游戏.zipJava...

    JAVA实现小游戏资源.zip

    JAVA实现小游戏资源.zipJAVA实现小游戏资源.zipJAVA实现小游戏资源.zip JAVA实现小游戏资源.zipJAVA实现小游戏资源.zipJAVA实现小游戏资源.zip JAVA实现小游戏资源.zipJAVA实现小游戏资源.zipJAVA实现小游戏资源.zip...

    Java实现大富翁游戏.zip

    Java实现大富翁游戏.zipJava实现大富翁游戏.zipJava实现大富翁游戏.zip Java实现大富翁游戏.zipJava实现大富翁游戏.zipJava实现大富翁游戏.zip Java实现大富翁游戏.zipJava实现大富翁游戏.zipJava实现大富翁游戏.zip...

    Java实现小飞机游戏.zip

    Java实现小飞机游戏.zipJava实现小飞机游戏.zipJava实现小飞机游戏.zip Java实现小飞机游戏.zipJava实现小飞机游戏.zipJava实现小飞机游戏.zip Java实现小飞机游戏.zipJava实现小飞机游戏.zipJava实现小飞机游戏.zip...

    java实现图片加水印.txt

    《java实现图片加水印.txt》里面装的都是给图片加水印的代码和讲解,很好资源哦

    JAVA实现邮件发送.txt

    JAVA实现邮件发送.txt JAVA实现邮件发送.txt JAVA实现邮件发送.txt JAVA实现邮件发送.txt

    树状数组3.java 使用java实现

    树状数组3.java 使用java实现树状数组3.java 使用java实现树状数组3.java 使用java实现树状数组3.java 使用java实现树状数组3.java 使用java实现树状数组3.java 使用java实现树状数组3.java 使用java实现树状数组3....

    使用Java实现数据库编程笔记.txt

    s2使用Java实现数据库编程笔记,简单易懂!

Global site tag (gtag.js) - Google Analytics