|
|
|
@ -51,6 +51,8 @@ Output:
|
|
|
|
|
他, 来到, 了, 网易, 杭研, 大厦 (此处,“杭研”并没有在词典中,但是也被Viterbi算法识别出来了)
|
|
|
|
|
|
|
|
|
|
功能 2) :添加自定义词典
|
|
|
|
|
================
|
|
|
|
|
|
|
|
|
|
* 开发者可以指定自己自定义的词典,以便包含jieba词库里没有的词。虽然jieba有新词识别能力,但是自行添加新词可以保证更高的正确率
|
|
|
|
|
* 用法: jieba.load_userdict(file_name) # file_name为自定义词典的路径
|
|
|
|
|
* 词典格式和dict.txt一样,一个词占一行;每一行分为两部分,一部分为词语,另一部分为词频,用空格隔开
|
|
|
|
|