通过java获取html网页代码

编程知识 更新时间:2023-04-07 12:59:47

最近这段时间想学爬虫来自己获取数据,因此找了几篇简单的java爬虫教程博客来看。令人失望的是这些爬虫基本都用不了。而复杂的爬虫又不适合初学者。由于我只是想做一个类似于脚本的东西,因此想了想,还是自己动手吧。先从获取html网页代码入手。

import java.io.BufferedReader;  
import java.io.InputStreamReader;  
import java.URL;  


public class webPageResource {  


    public static void main(String[] args) {  
        // TODO Auto-generated method stub  
        webPageResource t6=new webPageResource();  
        String htmls= t6.getPageSource("http://www.no5/browse/specialprice_p2.html","GBK");  
        System.out.println(htmls);  
    }  

    public String getPageSource(String pageUrl,String encoding) {    
        StringBuffer sb = new StringBuffer();    
        try {    
            //构建一URL对象    
            URL url = new URL(pageUrl);    
            //使用openStream得到一输入流并由此构造一个BufferedReader对象    
            BufferedReader in = new BufferedReader(new InputStreamReader(url    
                    .openStream(), encoding));    
            String line;    
            //读取www资源    
            while ((line = in.readLine()) != null) {    
                sb.append(line);    
                sb.append("\n");  
            }    
            in.close();    
        } catch (Exception ex) {    
            System.err.println(ex);    
        }    
        return sb.toString();    
    }   

}  

更多推荐

通过java获取html网页代码

本文发布于:2023-04-07 12:59:00,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/9af70c834ca0c23a6ea87a080b7a2a3d.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:网页代码   java   html

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!

  • 53454文章数
  • 14阅读数
  • 0评论数