From 925e955bfd04c3067f573c83681240326c80b892 Mon Sep 17 00:00:00 2001 From: Sun Junyi Date: Thu, 25 Oct 2012 17:24:35 +0800 Subject: [PATCH] quick fix of doc --- README.md | 13 +++++++------ 1 file changed, 7 insertions(+), 6 deletions(-) diff --git a/README.md b/README.md index f858c12..3eef6d0 100644 --- a/README.md +++ b/README.md @@ -58,19 +58,20 @@ Output: * 词典格式和dict.txt一样,一个词占一行;每一行分为两部分,一部分为词语,另一部分为词频,用空格隔开 * 范例: - 云计算 5 - 李小福 2 - 创新办 3 + 云计算 5 + 李小福 2 + 创新办 3 - 之前: 李小福 / 是 / 创新 / 办 / 主任 / 也 / 是 / 云 / 计算 / 方面 / 的 / 专家 / - 加载自定义词库后: 李小福 / 是 / 创新办 / 主任 / 也 / 是 / 云计算 / 方面 / 的 / 专家 / + 之前: 李小福 / 是 / 创新 / 办 / 主任 / 也 / 是 / 云 / 计算 / 方面 / 的 / 专家 / + + 加载自定义词库后: 李小福 / 是 / 创新办 / 主任 / 也 / 是 / 云计算 / 方面 / 的 / 专家 / 功能 3) :关键词提取 ================ * jieba.analyse.extract_tags(sentence,topK) #需要先import jieba.analyse * setence为待提取的文本 -* topK为返回几个权重最大的关键词,默认值为20 +* topK为返回几个TF/IDF权重最大的关键词,默认值为20 代码示例 (关键词提取)