当前位置：Gxlcms > PHP教程 > 请教怎么抓取用JS分页的网页内容

请教怎么抓取用JS分页的网页内容

时间：2021-07-01 10:21:17 帮助过：27人阅读

请问如何抓取用JS分页的网页内容
我要抓取一个网站的内容，这个网站分页机制是用js的。具体如下：

[size=10px]

HTML code

下一页

JScript code


    var pageno=1;
    function gogage(pno){
      tbl.firstPage();
      pageno=1;
      for(var i=1; (i < pno||pno==-1)&&i

HTML code



请高手赐教！

------解决方案--------------------
帮忙顶！

------解决方案--------------------
把html页取下来，数据在"#xmldso"指定的位置，也取下来，就是全部内容了。和分页关系不大.

------解决方案--------------------
帮顶！

------解决方案--------------------
利用htmlparser抓取网页内容(一)  
import org.htmlparser.Node;
import org.htmlparser.NodeFilter;
import org.htmlparser.Parser;
import org.htmlparser.filters.TagNameFilter;
import org.htmlparser.tags.TableTag;
import org.htmlparser.util.NodeList;

/**
  * 

  * 标题: 

  * 功能概要: 

  * 版权: cityyouth.cn (c) 2005 

  * 公司:上海城市青年网 

  * 创建时间:2005-12-21 

  * 修改时间: 

  * 修改原因：
  *  
  * @author 张伟
  * @version 1.0
  */
public class TestYahoo {
   public static void testHtml() {
       try {
           String sCurrentLine;
           String sTotalString;
           sCurrentLine = "";
           sTotalString = "";
           java.io.InputStream l_urlStream;
           java.net.URL l_url = new java.net.URL(
                   "http://sports.sina.com.cn/iframe/nba/live/");
           java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url
                   .openConnection();
           l_connection.connect();
           l_urlStream = l_connection.getInputStream();
           java.io.BufferedReader l_reader = new java.io.BufferedReader(
                   new java.io.InputStreamReader(l_urlStream));
           while ((sCurrentLine = l_reader.readLine()) != null) {
               sTotalString += sCurrentLine;
           }
           System.out.println(sTotalString);

           System.out.println("====================");
           String testText = extractText(sTotalString);
           System.out.println(testText);
       } catch (Exception e) {
           e.printStackTrace();
       }

   }

   /**
    * 抽取纯文本信息
    *  
    * @param inputHtml
    * @return
    */
   public static String extractText(String inputHtml) throws Exception {
       StringBuffer text = new StringBuffer();

       Parser parser = Parser.createParser(new String(inputHtml.getBytes(),
               "8859_1"), "8859-1");
       // 遍历所有的节点
       NodeList nodes = parser.extractAllNodesThatMatch(new NodeFilter() {
           public boolean accept(Node node) {
               return true;                     
                        
                            
                                < 上一篇
zendstudio如何用
                            
                            
                                 下一篇 >
php获取下一页下一页url
                            
                        
                    

                        人气教程排行
                    

			
                        
						
 
                                
                                    174次
                                    1
                                   php如何获取跳转前的url                                
                            
							  								  														  
                                
                                    174次
                                    2
                                   php格林威治时间转换成当前时间的方法                                
                            
								  														  								  
                                
                                    174次
                                    3
                                   为什么php不能做大型系统？                                
                            
														  								  							
                                
                                    174次
                                    4
                                   range函数怎么用                                
                            
							  								  							
                                
                                    174次
                                    5
                                   php中计算页面加载时间几种方法总结_PHP教程                                
                            
							  								  							
                                
                                    174次
                                    6
                                   求帮助，关于paypal支付返回值修改订单状态                                
                            
							  								  							
                                
                                    174次
                                    7
                                   typecho怎么配置文章内容页?                                
                            
							  								  							
                                
                                    174次
                                    8
                                   PhpStorm左侧structure不显示文件的方法列表是这么回事？                                
                            
							  								  							
                                
                                    174次
                                    9
                                   查看PHP的环境变量_PHP                                
                            
							  								  							
                                
                                    174次
                                    10
                                   PHP Primary script unknown 解决方法总结                                
                            
							  								  							
                                
                                    174次
                                    11
                                   php的命名空间与自动加载实现方法                                
                            
							  								  							
                                
                                    174次
                                    12
                                   解决laravel 出现ajax请求419(unknown status)的问题                                
                            
							  								  							
                                
                                    173次
                                    13
                                   php 如何删除mysql记录                                
                            
							  								  							
                                
                                    173次
                                    14
                                   PHP如何替换数组中的指定元素                                
                            
							  								  							
                                
                                    173次
                                    15
                                   怎么去除字符串中非汉字、非字母、非数字的字符                                
                            
							  								  							
                                
                                    173次
                                    16
                                   mysql如何一次执行多条SQL语句                                
                            
							  								  							
                                
                                    173次
                                    17
                                   修改header里面的Connection为close解决方法                                
                            
							  								  							
                                
                                    173次
                                    18
                                   PHP基于session.upload_progress 实现文件上传进度显示功能详解                                
                            
							  								  							
                                
                                    173次
                                    19
                                   php5.6.x到php7.0.x特性小结                                
                            
							  								  							
                                
                                    172次
                                    20
                                   php为什么会出现504错误                                
                            

                        
                    

   本站所有资源全部来源于网络，若本站发布的内容侵害到您的隐私或者利益，请联系我们删除！


登录

 










                 
                
                
                
                记住我的登录                            
        忘记密码？ 
  登录 
  




  
    
    
    
  
   
  
    
    
  
    
      
      我已阅读用户协议及版权声明
  
  
注册