Commit Graph

7 Commits (master)

Author SHA1 Message Date
Fukuball Lin b658ee69cb 讓 jieba 可以自行增加 stop words 語料庫
1. 增加範例 stop words 語料庫
2. 為了讓 jieba 可以切換 stop words 語料庫,新增 set_stop_words 方法,並改寫 extract_tags
3. test 增加 extract_tags_stop_words.py 測試範例
11 years ago
Fukuball Lin 7198d562f1 讓 jieba 可以切換 idf 語料庫
1. 新增繁體中文 idf 語料庫
2. 為了讓 jieba 可以切換 iff 語料庫,新增 get_idf, set_idf_path 方法,並改寫 extract_tags
3. test 增加 extract_tags_idfpath
11 years ago
Sun Junyi 237dc6625e add mix words to extra_dict/dict.txt.big 12 years ago
Sun Junyi b050bfe946 remove some useless words 12 years ago
Sun Junyi a8f902545c fix some bad cases 12 years ago
Herman Schaaf c6098a8657 Add initialize function and lazy initialization 12 years ago
Sun Junyi 8a699cf462 extra dictionary 12 years ago