FAQ
  • Q:Java jdk的版本有什么要求?
  • A:推荐使用1.6或更高版本。

  • Q:如何加载用户词典?
  • A:首先在配置文件中设置On,系统会自动加载。在配置文件中设置Off,系统会自 动将用户词典屏蔽。字典的加载有字符串和文本文件加载两种方式,分别调用ICTCLAS_ImportUserDict()接口和ICTCLAS_ImportUserDictFile()接口即可。

  • Q:用户词典格式是怎样的?
  • A:用户词典格式为:词语@@词性,不同的词语在字符串中用英文的分号隔开,例如:"舟曲县城@@nr;最新动态@@nr"。但在用户词典的文本文件中不同的词语用回车换行隔开。
    用户词典词性的说明:
    1)所用到的词性标注集,与核心词典词性标注集(可以自行指定)一致
    2)如果没有给出词性或者给出的词性不正确,按照名词处理

  • Q:支持的用户自定义词典规模有多大?
  • A:测试过20万的用户词典,分词效率下降10%左右。词典量大时,词典导入可能需要一定时间,服务器配置不同导入时间也会有一定差异。

  • Q:是否支持多线?
  • A:c++、c#、java版本均支持多线程。

  • Q:为什么c#版本应用到webservice无法调试通过?
  • A:需要将Configure.xml的On设置为Off< /Log>,即关闭日志功能。

  • Q:ICTCLAS是否支持北大标注集?如可以如何使用?
  • A:支持,只需要把PKU.map Copy到Data目录下,然后将Configure.xml中的TagSet标签设置为PKU.map。