add package infos
parent
956d5cb3c8
commit
586d23ef63
@ -0,0 +1,5 @@
|
||||
<html>
|
||||
<body>
|
||||
包括webmagic入口类Spider和一些数据传递的实体类。
|
||||
</body>
|
||||
</html>
|
@ -0,0 +1,5 @@
|
||||
<html>
|
||||
<body>
|
||||
包含了处理页面抽取结果的接口Pipeline和它的几个实现类。
|
||||
</body>
|
||||
</html>
|
@ -0,0 +1,5 @@
|
||||
<html>
|
||||
<body>
|
||||
包含了封装页面处理逻辑的接口PageProcessor和一个实现类SimplePageProcessor。实现PageProcessor即可定制一个自己的爬虫。
|
||||
</body>
|
||||
</html>
|
@ -0,0 +1,5 @@
|
||||
<html>
|
||||
<body>
|
||||
包含url管理和调度的接口Schedular及它的几个实现类。
|
||||
</body>
|
||||
</html>
|
@ -0,0 +1,5 @@
|
||||
<html>
|
||||
<body>
|
||||
提供一些处理链接的静态工具类。
|
||||
</body>
|
||||
</html>
|
Loading…
Reference in New Issue