简介
playfish是一个采用java技术,综合应用多个开源java组件实现的网页抓取工具,通过XML配置文件实现高度可定制性与可扩展性的网页抓取工具应用开源jar包包括httpclient(内容读取),dom4j(配置文件解析),jericho(html解析),已经在 war包的lib下。这个项目目前... 更多
其它信息
地区
不详
开发语言
Java
开源组织
无
所属分类
应用工具、 网络爬虫
授权协议
MIT
操作系统
跨平台
收录时间
2023-09-29
软件类型
开源软件
适用人群
未知
时光轴
里程碑1
LOG0
2023
2023-09
轻识收录
评价
0.0(满分 10 分)0 个评分
什么是点评分
全部评价(
0)
推荐率
100%
推荐
pyrailgun网页抓取工具
这是一个非常简单易用的抓取工具怎么使用?首先你需要创建一个对应站点的规则文件比如test.json{"name":"bingsearcher","action":"main","subaction":
pyrailgun网页抓取工具
0
Autorip.shDVD抓取工具
Autorip.sh是一个Linux/Unix下的命令行脚本,用来抓取DVD数据的小工具,主要用来创建高质量的DVD备份,包括所有的字幕、音轨,无需任何配置。
Autorip.shDVD抓取工具
0