How to insert a new word into imdict-chinese-analyzer(智能中文分词模块)

这不是一篇讲述Vekou的文章,但和Vekou的关系相当紧密。

在上一篇文章中提到还有一个很重要的问题没有说清楚,其实就是关于Vekou底层所涉及到的中文分词器imdict-chinese-analyzer,如果理解了Vekou 高级使用中谈到Vekou内部是如何工作的以后,就知道如果Vekou遇到一个从来未见过的新词,就算向zhy.dict添加一个这个新词,如果在分词阶段没有把这个词正确划分,Vekou就不能像一个词一样把它读出啦,听上去依然像一个字一个字地读。所以,要让Vekou正确识别一个词,有两个条件必须具备:

  1. 必须让中文分词器划分出这个词,即分词器字典中存在这个词
  2. Vekou中的粤语发音字典中(zhy.dict)也要存在这个词

Continue reading How to insert a new word into imdict-chinese-analyzer(智能中文分词模块)