Coin163

首页 > 【solr 基础篇二】中文分析器的配置

【solr 基础篇二】中文分析器的配置

2020腾讯云双十一活动,全年最低!!!(领取3500元代金券),
地址https://cloud.tencent.com/act/cps/redirect?redirect=1073

2020阿里云最低价产品入口,含代金券(新老用户有优惠),
入口地址https://www.aliyun.com/minisite/goods

相关推荐:solr4.5部署到tomcat以及solr4.5配置中文分词器mmseg4j

solr4.5部署到tomcat solr默认自带了jetty服务器,但我们习惯了tomcat,我们通过以下步骤将solr部署到tomcat 1、solr.4.5.0.zip解压到指定的目录中,如d:/solr-4.5.0 2、将d:/solr-4.5.0/example/webapps下的solr.war拷贝到tomcat–>weapps中 3、新建文件夹d:

1、什么是分析器? 英文(Analyzer),一个分析器可以检查字段的文本信息,并且产生一个token流。分析器是schema.xml中的元素的一个子元素,schema.xml可以在solr/conf目录下找到或者跟solrconfig.xml在同一目录。 通常使用下,只有solr.TextField类型的字段会专门制定一个分析器。最简单配置的一个分析器的方式是使用元素,制定这个元素的class属性为一个完整的java类名。具体过程如下: 2、具体配置 1)使用IK-Analyzer,把分析器的文件夹上传到服务器 2)把文件夹中的jar包添加到solr工程中 [root@localhost ~/IK Analyzer 2012FF_hf1]#cp IKAnalyzer2012FF_u1.jar /usr/local/solr/tomcat/webapps/solr/WEB-INF/lib/ 3)把IK-Analyzer需

相关推荐:[Nutch]Solr配置自定义的中文分词器mmseg4j

上一篇博文我们有使用LUKE工具来查看使用solrindex产生的索引的具体内容,从里面可以看到,默认的分词很乱,所以这篇博文我们就使用mmseg4j中文分词器。 1. 下载mmseg4j 点击mmseg4j-1.8.5 .zip,进入下载页面。 2. 解压mmseg4j-1.8.5.zip 将下载的mmseg4j-1.

要的扩展词典及停用词词典,配置文件复制到colr工程的classpath [root@localhost ~/IK Analyzer 2012FF_hf1]#cp IKAnalyzer.cfg.xml ext_stopword.dic mydict.dic /usr/local/solr/tomcat/webapps/solr/WEB-INF/classes/ 注:扩展词典及停用词词典集必须是 UTF-8 4)配置fieldType.需要在/usr/local/solr/solrhome/collection1/conf/schema.xml中配置 分析器配置完工之后,我们可以根据业务场景对业务字段进行配置 3、业务字段的配置 判断标准: - 在搜索时是否需要在此字段上进行搜索 eg:姓名,描述等字段 - 后续的业务是否需要用到此字段 eg:商品Id 依旧是在schema.xml中进行配置: 最后字段添加完之后的效果图:

原文

1、什么是分析器? 英文(Analyzer),一个分析器可以检查字段的文本信息,并且产生一个token流。分析器是schema.xml中的元素的一个子元素,schema.xml可以在solr/conf目录下找到或者跟solrconf

------分隔线----------------------------