用户访问我们的首页,一般都会直接搜索来寻找自己想要购买的商品。
而商品的数量非常多,而且分类繁杂。如果能正确的显示出用户想要的商品,并进行合理的**过滤**,尽快促成交易,是搜索系统要研究的核心。
面对这样复杂的搜索业务和数据量,使用传统数据库搜索就显得力不从心,一般我们都会使用全文检索技术,比如之前大家学习过的Solr。
不过今天,我们要讲的是另一个全文检索技术:Elasticsearch。
## 1.1.简介
### 1.1.1.Elastic
Elastic官网:https://www.elastic.co/cn/
Elastic有一条完整的产品线:Elasticsearch、Kibana、Logstash等,前面说的三个就是大家常说的ELK技术栈。
Elasticsearch官网:https://www.elastic.co/cn/products/elasticsearch
如上所述,Elasticsearch具备以下特点:
- 分布式,无需人工搭建集群(solr就需要人为配置,使用Zookeeper作为注册中心)
- Restful风格,一切API都遵循Rest原则,容易上手
- 近实时搜索,数据更新在Elasticsearch中几乎是完全同步的。
1.1.3.版本
目前Elasticsearch最新的版本是6.2.4,我们就使用这个版本
需要虚拟机JDK1.8及以上
安装完Centos6.5的Base Server版会默认安装OpenJDK,首先需要删除OpenJDK
如果不是root用户需要切换到root用户(su - root)
命令:
```powershell
rpm -qa | grep java
```
显示如下:(有则卸载,没有就不用),注意版本可能会有些不一样,以实际操作的为准。
```powershell
tzdata-java-2013g-1.el6.noarch
java-1.7.0-openjdk-1.7.0.45-2.4.3.3.el6.x86_64
java-1.6.0-openjdk-1.6.0.0-1.66.1.13.0.el6.x86_64
2、卸载openjdk:
(其中参数“tzdata-java-2013j-1.el6.noarch”为上面查看中显示的结果,粘进来就行,如果你显示的不一样,请复制你查询到的结果)
```sh
sudo rpm -e --nodeps tzdata-java-2013g-1.el6.noarch
sudo rpm -e --nodeps java-1.7.0-openjdk-1.7.0.45-2.4.3.3.el6.x86_64
sudo rpm -e --nodeps java-1.6.0-openjdk-1.6.0.0-1.66.1.13.0.el6.x86_64
```
### JDK安装略
## 1.2.安装和配置
为了模拟真实场景,我们将在linux下安装Elasticsearch。
### 1.2.1.新建一个用户leyou
```sh
useradd leyou
```
设置密码:
```
passwd 123321
```
出于安全考虑,elasticsearch默认不允许以root账号运行。
切换用户:
```
su - leyou
```
### 1.2.2.上传安装包,并解压
我们将安装包上传到:/home/leyou目录
![1526465700159](assets/1526465700159.png)
解压缩:
```
tar xvf elasticsearch-6.2.4.tar.gz
```
### 1.2.3.修改配置
> 修改jvm配置
Elasticsearch基于Lucene的,而Lucene底层是java实现,因此我们需要配置jvm参数
vim jvm.options
默认配置如下:
```
-Xms1g
-Xmx1g
```
内存占用太多了,我们调小一些:
```
-Xms512m
-Xmx512m
```
修改elasticsearch.yml
vim elasticsearch.yml
修改数据和日志目录:
```yml
path.data: /home/leyou/elasticsearch/data # 数据目录位置
path.logs: /home/leyou/elasticsearch/logs # 日志目录位置
```
修改绑定的ip:
network.host: 0.0.0.0 # 绑定到0.0.0.0,允许任何ip来访问
默认只允许本机访问,修改为0.0.0.0后则可以远程访问
目前我们是做的单机安装,如果要做集群,只需要在这个配置文件中添加其它节点信息即可。
> elasticsearch.yml的其它可配置信息:
| 属性名 | 说明 |
| ---------------------------------- | ------------------------------------------------------------ |
| cluster.name | 配置elasticsearch的集群名称,默认是elasticsearch。建议修改成一个有意义的名称。 |
| node.name | 节点名,es会默认随机指定一个名字,建议指定一个有意义的名称,方便管理 |
| path.conf | 设置配置文件的存储路径,tar或zip包安装默认在es根目录下的config文件夹,rpm安装默认在/etc/ elasticsearch |
| path.data | 设置索引数据的存储路径,默认是es根目录下的data文件夹,可以设置多个存储路径,用逗号隔开 |
| path.logs | 设置日志文件的存储路径,默认是es根目录下的logs文件夹 |
| path.plugins | 设置插件的存放路径,默认是es根目录下的plugins文件夹 |
| bootstrap.memory_lock | 设置为true可以锁住ES使用的内存,避免内存进行swap |
| network.host | 设置bind_host和publish_host,设置为0.0.0.0允许外网访问 |
| http.port | 设置对外服务的http端口,默认为9200。 |
| transport.tcp.port | 集群结点之间通信端口 |
| discovery.zen.ping.timeout | 设置ES自动发现节点连接超时的时间,默认为3秒,如果网络延迟高可设置大些 |
| discovery.zen.minimum_master_nodes | 主结点数量的最少值 ,此值的公式为:(master_eligible_nodes / 2) + 1 ,比如:有3个符合要求的主结点,那么这里要设置为2 |
原文地址:https://www.cnblogs.com/jacksonxiao/p/11617105.html