第一部分:安装Solr配置

基于Lucene的Java搜索引擎服务器
Apache Lucene项目的开源企业搜索平台。其主要功能包括全文检索、命中标示、分面搜索、动态聚类、数据库集成,以及富文本(如Word、PDF)的处理。Solr是高度可扩展的,并提供了分布式搜索和索引复制。Solr是最流行的企业级搜索引擎,Solr4 还增加了NoSQL支持。

下载Solr

1
2
3
4
#官方地址: http://lucene.apache.org/solr/downloads.html
wget https://www.apache.org/dyn/closer.lua/lucene/solr/8.3.0/solr-8.3.0.tgz
tar -zxvf solr-8.3.0.tgz
cd solr-8.3.0/bin

启动测试

1
./solr start -force

Solr相关命令

1
2
3
4
5
6
./solr start –p 端口号   #单机版启动solr服务
./solr restart –p 端口号 #重启solr服务
./solr stop –p 端口号 #关闭solr服务
./solr stop -all #关闭所有solr服务
./solr status #查看solr状态
./solr create –c name #创建一个core实例(core概念后面介绍)

第二部分:配置Solr支持中文词库解析

中文词库下载配置

1
2
# 词库下载地址
https://github.com/magese/ik-analyzer-solr

alt text

Maven仓库地址

1
2
3
4
5
6
<!-- Maven仓库地址 -->
<dependency>
<groupId>com.github.magese</groupId>
<artifactId>ik-analyzer</artifactId>
<version>8.2.0</version>
</dependency>

solr-8.3.0/server/solr/newCore/conf/managed-schema文件里面添加

1
2
3
4
5
6
7
8
9
10
11
<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>

官方测试API地址

1
2
#官方测试API地址:
https://lucene.apache.org/solr/guide/8_1/schema-api.html#modify-the-schema

第三部分:添加core并使用

创建核心 Add Core

alt text

说明:Add Core之前必须使用命令solr-8.3.0/server/solr目录创建newCore,否则会报错

1
2
3
cd solr-8.3.0/server/solr
mkdir newCore
cp -R solr-8.3.0/server/solr/configsets/sample_techproducts_configs/conf /newCore

alt text

第四部分:清除Core搜索数据

清除Solr中数据

1
2
<delete><query>*:*</query></delete>
<commit/>

alt text