Update README.md

pull/39/head
Sun Junyi 12 years ago
parent 4a9193de4f
commit 9fd2b38293

@ -7,9 +7,12 @@ jieba
Feature Feature
======== ========
* 支持三种分词模式: * 支持三种分词模式:
* 1精确模式试图将句子最精确地切开适合文本分析 *精确模式,试图将句子最精确地切开,适合文本分析;
* 2全模式把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义; *全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;
* 3) 搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。 *搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
* 支持繁体分词
* 支持自定义词典
Python Version Python Version
============== ==============
@ -71,14 +74,17 @@ Output:
* 词典格式和`dict.txt`一样,一个词占一行;每一行分三部分,一部分为词语,另一部分为词频,最后为词性(可省略),用空格隔开 * 词典格式和`dict.txt`一样,一个词占一行;每一行分三部分,一部分为词语,另一部分为词频,最后为词性(可省略),用空格隔开
* 范例: * 范例:
自定义词典https://github.com/fxsjy/jieba/blob/master/test/userdict.txt *自定义词典https://github.com/fxsjy/jieba/blob/master/test/userdict.txt
用法示例https://github.com/fxsjy/jieba/blob/master/test/test_userdict.py
*用法示例https://github.com/fxsjy/jieba/blob/master/test/test_userdict.py
之前: 李小福 / 是 / 创新 / 办 / 主任 / 也 / 是 / 云 / 计算 / 方面 / 的 / 专家 / 之前: 李小福 / 是 / 创新 / 办 / 主任 / 也 / 是 / 云 / 计算 / 方面 / 的 / 专家 /
加载自定义词库后: 李小福 / 是 / 创新办 / 主任 / 也 / 是 / 云计算 / 方面 / 的 / 专家 / 加载自定义词库后: 李小福 / 是 / 创新办 / 主任 / 也 / 是 / 云计算 / 方面 / 的 / 专家 /
* 代码示例:"通过用户自定义词典来增强歧义纠错能力" --- https://github.com/fxsjy/jieba/issues/14 * "通过用户自定义词典来增强歧义纠错能力" --- https://github.com/fxsjy/jieba/issues/14
功能 3) :关键词提取 功能 3) :关键词提取
================ ================

Loading…
Cancel
Save