You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
webmagic/release-note.md

17 lines
827 B
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

Release Notes
----
*2012-7-25* `version0.1.0`
第一个稳定版本。
修改了若干API使得可扩展性更强为每个任务分配一个ID可以通过ID区分不同任务。
重写了Pipeline接口将抽取结果集包装到ResultItems对象而不是通用一个Page对象便于逻辑分离。
增加下载的重试机制支持gzip支持自定义UA/cookie。
增加多线程抓取功能,只需在初始化的时候指定线程数即可。
增加jquery形式的CSS Selector API可以通过`page.getHtml().$("div.body")`形式抽取元素。
完善了文档,架构说明:[webmagic的设计机制及原理-如何开发一个Java爬虫](http://my.oschina.net/flashsword/blog/145796)Javadoc[http://code4craft.github.io/webmagic/docs](http://code4craft.github.io/webmagic/docs)。