update manual for objectformatter

pull/88/head
yihua.huang
parent ba05227594
commit 9e6d55dbee

@ -395,9 +395,21 @@ webmagic-extension包括注解模块。为什么会有注解方式
* #### 类型转换
webmagic的注解模式直接对抽取结果进行类型转换通过`ObjectFormatter`实现。webmagic内置了基本类型的支持这样抽取结果的字段可以是任意基本类型(需要保证抽取结果能够被转换到对应类型)。
```java
@ExtractBy("//ul[@class='pagehead-actions']/li[1]//a[@class='social-count js-social-count']/text()")
private int star;
```
抽取结果也可以是`java.util.Date`类型,不过需要指定日期格式化的方式:
```java
@Formatter("yyyy-MM-dd HH:mm")
@ExtractBy("//div[@class='BlogStat']/regex('\\d+-\\d+-\\d+\\s+\\d+:\\d+')")
private Date date;
```
你也可以编写一个实现`ObjectFormatter`接口的类,进行自己的类型解析。要使用自己的类,需要调用`ObjectFormatters.put()`对这个类进行注册。
* #### AfterExtractor

Loading…
Cancel
Save