当前位置: Coin163 >>

solr使用IK-analyzer及搜狗词库

2013-09-24 | 所属分类:solr IK-analyzer 词库

1、从 http://pinyin.sogou.com/dict/ 下载细胞词库

2、用深蓝词库转换工具(下载地址: https://imewlconverter.googlecode.com/files/imewlconverter_2_0.zip )提取出txt文本

3、用ultraEdit将txt文本另存为无bom utf-8格式并且dos换行

4、在solr的WEB-INF下创建classes目录

5、将utf-8格式的txt词库拷贝到solr的WEB-INF/classes目录

6、在WEB-INF/classes创建IKAnalyzer.cfg.xml,内容如下:

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  

<properties>  

<comment>IK Analyzer 扩展配置</comment>

<!--用户可以在这里配置自己的扩展字典

<entry key="ext_dict">ext.dic;</entry>

-->

<entry key="ext_dict">/mydict.dic;</entry>

<!--用户可以在这里配置自己的扩展停止词字典-->

<entry key="ext_stopwords">stopword.dic;</entry>

</properties>
上一篇:
下一篇:

关于Coin163网站地图

Copyright 2012-2013 Coin163.com ( Coin163 ) All Rights Reserved