[3]Solr7.2.1添加自帶的中文分詞 -开发者知识库
新的一個月開始了,寫個blog清醒下
今天寫一下,solr7.2.1版本的添加中文分詞
1.切換到solr的bin 目錄啟動solr
solr.cmd start
2.新建一個Core,名字為BBB
參考:
http://blog.csdn.net/a897180673/article/details/79403952
3.復制jar包到solr 的web app
我們訪問的 127.0.0.1:8983 這個webApp的目錄就在solr-7.2.1\server\solr-webapp下面,要在webApp中使用分詞,所以要把相應的jar添加到webApp的lib中
首先solr7.2.1本身自帶了分析的jar包,在
solr-7.2.1\contrib\analysis-extras\lucene-libs中
把這個紅框中的 文件復制到 solr-7.2.1\server\solr-webapp\webapp\WEB-INF\lib下面
4.配置文件,支持中文分詞
jar包添加了好了,下面就是要配置jar包的信息
切換到剛才新建的Core目錄 BBB
修改他下面的conf目錄下的managed-schema文件
在最下面添加:
<fieldType name="text_ik_zd" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>
添加好了如圖 選中的部分 :
5.webAPP管理界面重啟Core
在webAPP左側選擇Code Admin –>選擇BBB core,然后選擇Reload
見下圖:
6.使用中文分詞
按下圖的箭頭依次單擊,輸入語句
這個時候就可以看到分詞的結果了,
如果不使用這個分詞會怎么樣呢?使用其他內置的分詞 效果並不好:
都分成 一個一個的單獨的漢字了.
最佳答案:
本文经用户投稿或网站收集转载,如有侵权请联系本站。
0条回复