搜索资源列表

  1. SubjectSpider_ByKelvenJU

    0下载:
  2. 1、锁定某个主题抓取; 2、能够产生日志文本文件,格式为:时间戳(timestamp)、URL; 3、抓取某一URL时最多允许建立2个连接(注意:本地作网页解析的线程数则不限) 4、遵守文明蜘蛛规则:必须分析robots.txt文件和meta tag有无限制;一个线程抓完一个网页后要sleep 2秒钟; 5、能对HTML网页进行解析,提取出链接URL,能判别提取的URL是否已处理过,不重复解析已crawl过的网页;
  3. 所属分类:JSP源码/Java

    • 发布日期:2008-10-13
    • 文件大小:1.82mb
    • 提供者:祝庆荣
  1. SubjectSpider_ByKelvenJU

    0下载:
  2. 1、锁定某个主题抓取; 2、能够产生日志文本文件,格式为:时间戳(timestamp)、URL; 3、抓取某一URL时最多允许建立2个连接(注意:本地作网页解析的线程数则不限) 4、遵守文明蜘蛛规则:必须分析robots.txt文件和meta tag有无限制;一个线程抓完一个网页后要sleep 2秒钟; 5、能对HTML网页进行解析,提取出链接URL,能判别提取的URL是否已处理过,不重复解析已crawl过的网页;
  3. 所属分类:JSP源码/Java

    • 发布日期:2024-12-22
    • 文件大小:1.82mb
    • 提供者:

源码中国 www.ymcn.org