add package infos

pull/17/head
yihua.huang 12 years ago
parent 956d5cb3c8
commit 586d23ef63

@ -0,0 +1,5 @@
<html>
<body>
包含了页面下载的接口Downloader和实现类HttpClientDownloader该实现类封装了HttpComponent库。
</body>
</html>

@ -0,0 +1,5 @@
<html>
<body>
包括webmagic入口类Spider和一些数据传递的实体类。
</body>
</html>

@ -0,0 +1,5 @@
<html>
<body>
包含了处理页面抽取结果的接口Pipeline和它的几个实现类。
</body>
</html>

@ -0,0 +1,5 @@
<html>
<body>
包含了封装页面处理逻辑的接口PageProcessor和一个实现类SimplePageProcessor。实现PageProcessor即可定制一个自己的爬虫。
</body>
</html>

@ -0,0 +1,5 @@
<html>
<body>
包含url管理和调度的接口Schedular及它的几个实现类。
</body>
</html>

@ -7,7 +7,7 @@ import java.util.List;
* Date: 13-4-20
* Time: 8:02
*/
public interface Selector {
interface Selector {
public String select(String text);

@ -0,0 +1,5 @@
<html>
<body>
提供了便捷抽取页面内容的工具对外核心接口是Selectable内部抽取则是通过实现Selector来定制。
</body>
</html>

@ -0,0 +1,5 @@
<html>
<body>
提供一些处理链接的静态工具类。
</body>
</html>
Loading…
Cancel
Save