From 9e6d55dbeec35b57de6c7e6bc1f0212e7ba8f353 Mon Sep 17 00:00:00 2001 From: "yihua.huang" Date: Sat, 28 Sep 2013 07:52:32 +0800 Subject: [PATCH] update manual for objectformatter --- user-manual.md | 12 ++++++++++++ 1 file changed, 12 insertions(+) diff --git a/user-manual.md b/user-manual.md index 2127e57b..18988f59 100644 --- a/user-manual.md +++ b/user-manual.md @@ -395,9 +395,21 @@ webmagic-extension包括注解模块。为什么会有注解方式? * #### 类型转换 + webmagic的注解模式直接对抽取结果进行类型转换,通过`ObjectFormatter`实现。webmagic内置了基本类型的支持,这样抽取结果的字段可以是任意基本类型(需要保证抽取结果能够被转换到对应类型)。 + +```java + @ExtractBy("//ul[@class='pagehead-actions']/li[1]//a[@class='social-count js-social-count']/text()") + private int star; +``` +抽取结果也可以是`java.util.Date`类型,不过需要指定日期格式化的方式: + +```java @Formatter("yyyy-MM-dd HH:mm") @ExtractBy("//div[@class='BlogStat']/regex('\\d+-\\d+-\\d+\\s+\\d+:\\d+')") private Date date; +``` + +你也可以编写一个实现`ObjectFormatter`接口的类,进行自己的类型解析。要使用自己的类,需要调用`ObjectFormatters.put()`对这个类进行注册。 * #### AfterExtractor