搜索资源列表
UrlFilter
- <VisualStudioProject> <CSHARP ProjectType = \"Local\" ProductVersion = \"7.10.3077\" SchemaVersion = \"2.0\" ProjectGuid = \"{B272FFDB-13CF-4D27-AE1C-B6CCFB714AC3}\" >
usdsi
- 本程序是用python编写,无需安装。运行Crawler.exe就可以看到效果。 如果不修改配置是抓取新浪科技的内容,修改配置可以抓取指定的网站。 配置文件采用ini的格式. spider_config.ini蜘蛛的配置 1. maxThreads 爬虫的线程数 2. startURL 爬虫开始的URL 3. checkFilter 爬虫只抓取指定的URL(采用正则表达式匹配) 4. urlFilter 爬虫
UrlFilter
- <VisualStudioProject> <CSHARP ProjectType = "Local" ProductVersion = "7.10.3077" SchemaVersion = "2.0" ProjectGuid = "{B272FFDB-13CF-4D27-AE1C-B6CCFB714AC3}" > -<VisualStudioProject>
UrlFilter
- ie 插件,实现对特定的网址的过滤 ATL实现的bho-ie plug-in, the achievement of a specific URL filtering ATL BHO achieved
URLfilter
- 本软件基于MFC开发,在程序界面单击“选择URL库文件”然后选择实例库文件url.txt。然后在“输入待匹配URL”中输入URL规则,例如http://www.huawei.com。之后单击开始匹配,匹配结果将会在最下方的结果栏输出结果。关于URL库文件,需要txt格式,同时库文件中每一行应该为一个url,不应该有空行。 注意该源码使用vs2010编译通过,低版本不保证一定成功-The MFC-based development o