[3]Solr7.2.1添加自帶的中文分詞 -开发者知识库

[3]Solr7.2.1添加自帶的中文分詞 -开发者知识库,第1张

新的一個月開始了,寫個blog清醒下

今天寫一下,solr7.2.1版本的添加中文分詞

1.切換到solr的bin 目錄啟動solr

solr.cmd start

2.新建一個Core,名字為BBB
參考:
http://blog.csdn.net/a897180673/article/details/79403952

3.復制jar包到solr 的web app

我們訪問的 127.0.0.1:8983 這個webApp的目錄就在solr-7.2.1\server\solr-webapp下面,要在webApp中使用分詞,所以要把相應的jar添加到webApp的lib中

首先solr7.2.1本身自帶了分析的jar包,在
solr-7.2.1\contrib\analysis-extras\lucene-libs中

[3]Solr7.2.1添加自帶的中文分詞 -开发者知识库,這里寫圖片描述,第2张

把這個紅框中的 文件復制到 solr-7.2.1\server\solr-webapp\webapp\WEB-INF\lib下面

4.配置文件,支持中文分詞
jar包添加了好了,下面就是要配置jar包的信息
切換到剛才新建的Core目錄 BBB
修改他下面的conf目錄下的managed-schema文件
在最下面添加:

    <fieldType name="text_ik_zd" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>

添加好了如圖 選中的部分 :
[3]Solr7.2.1添加自帶的中文分詞 -开发者知识库,這里寫圖片描述,第3张

5.webAPP管理界面重啟Core
在webAPP左側選擇Code Admin –>選擇BBB core,然后選擇Reload
見下圖:
[3]Solr7.2.1添加自帶的中文分詞 -开发者知识库,這里寫圖片描述,第4张

6.使用中文分詞
按下圖的箭頭依次單擊,輸入語句
[3]Solr7.2.1添加自帶的中文分詞 -开发者知识库,這里寫圖片描述,第5张

這個時候就可以看到分詞的結果了,

如果不使用這個分詞會怎么樣呢?使用其他內置的分詞 效果並不好:

[3]Solr7.2.1添加自帶的中文分詞 -开发者知识库,這里寫圖片描述,第6张

都分成 一個一個的單獨的漢字了.

最佳答案:

本文经用户投稿或网站收集转载,如有侵权请联系本站。

发表评论

0条回复