FAQ
- Q:Java jdk的版本有什么要求?
- A:推荐使用1.6或更高版本。
- Q:如何加载用户词典?
- A:首先在配置文件中设置On,系统会自动加载。在配置文件中设置Off,系统会自
动将用户词典屏蔽。字典的加载有字符串和文本文件加载两种方式,分别调用ICTCLAS_ImportUserDict()接口和ICTCLAS_ImportUserDictFile()接口即可。
- Q:用户词典格式是怎样的?
- A:用户词典格式为:词语@@词性,不同的词语在字符串中用英文的分号隔开,例如:"舟曲县城@@nr;最新动态@@nr"。但在用户词典的文本文件中不同的词语用回车换行隔开。
用户词典词性的说明:
1)所用到的词性标注集,与核心词典词性标注集(可以自行指定)一致
2)如果没有给出词性或者给出的词性不正确,按照名词处理
- Q:支持的用户自定义词典规模有多大?
- A:测试过20万的用户词典,分词效率下降10%左右。词典量大时,词典导入可能需要一定时间,服务器配置不同导入时间也会有一定差异。
- Q:是否支持多线?
- A:c++、c#、java版本均支持多线程。
- Q:为什么c#版本应用到webservice无法调试通过?
- A:需要将Configure.xml的On设置为Off< /Log>,即关闭日志功能。
- Q:ICTCLAS是否支持北大标注集?如可以如何使用?
- A:支持,只需要把PKU.map Copy到Data目录下,然后将Configure.xml中的TagSet标签设置为PKU.map。