文档章节

elasticsearch安装ik中文分词插件

人来疯啊
 人来疯啊
发布于 2016/04/14 21:56
字数 366
阅读 580
收藏 25

在这里我将介绍一下如何给elasticsearch安装ik中文分词插件。  

注意:选择的elasticsearch和ik版本要正确,否则会出现错误。在这里我选择的是elasticsearch1.4.0和ik1.2.9版本。

所需要的文件已上传到百度云盘,请读者自行下载

链接: http://pan.baidu.com/s/1migZtag

密码: 3ym8

步骤1:将elasticsearch-1.4.0.tar.gz解压

步骤2:将解压后的ik文件夹放到config路径下;

            将解压后的httpclient-4.4.1.jar和httpcore-4.4.1.jar放到lib路径下

步骤3:新建plugins文件夹,如果有plugins目录,直接在该目录下新建文件夹analysis-ik,将elasticsearch-analysis-ik-1.2.9.jar放到该路径下

步骤4:在配置文件config/elasticsearch.yml中增加ik的配置,最末尾添加

    index:  
      analysis:                     
        analyzer:        
          ik:  
              alias: [ik_analyzer]  
              type: org.elasticsearch.index.analysis.IkAnalyzerProvider  
          ik_max_word:  
              type: ik  
              use_smart: false  
          ik_smart:  
              type: ik  
              use_smart: true

步骤5:启动bin/elasticsearch.bat

步骤6:检测ik中文是否已成功安装,打开插件 http://localhost:9200/_plugin/head/ ,新建一个索引test

(如果没有安装head插件,也可以用curl命令工具去测试,这里就不多讲啦)

然后在浏览器输入网址http://localhost:9200/test/_analyze?analyzer=ik&pretty=true&text=%E6%88%91%E4%BB%AC%E9%83%BD%E6%98%AF%E5%A5%BD%E5%AD%A9%E5%AD%90,就会看到ik的中文分词效果了

有什么不明白的地方,大家可以一起交流!fighting~~~~~·


© 著作权归作者所有

共有 人打赏支持
人来疯啊
粉丝 6
博文 40
码字总数 6539
作品 0
昌平
程序员
Elasticsearch 安装和配置

安装 elasticsearch 上传 elasticsearch-1.7.3.tar.gz 到 Linux环境 解压缩至 /usr/local 目录,并启动 elasticsearch 启动 elasticsearch 浏览器访问 http://192.168.81.132:9200/ ,出现如下......

o135248
04/16
0
0
Elasticsearch安装IK中文分词插件

一,从github上下载最新的Ik分词源码到本地 git clone https://github.com/medcl/elasticsearch-analysis-ik clone到本地后,将elasticsearch-analysis-ik目录中的 config/ik/ 整个目录拷贝到...

shensuoyao
2015/07/22
0
2
Elasticsearch中文分词研究

一、ES分析器简介 ES是一个实时搜索与数据分析引擎,为了完成搜索功能,必须对原始数据进行分析、拆解,以建立索引,从而实现搜索功能; ES对数据分析、拆解过程如下: 首先,将一块文本分成...

zhaipengfei1231
04/18
0
0
分布式搜索elasticsearch 中文分词集成

对于索引可能最关系的就是分词了 一般对于es 来说默认的smartcn 但效果不是很好 一个是ik的,一个是mmseg的,下面分别介绍下两者的用法,其实都差不多的,先安装插件,命令行: 安装ik插件 ...

空_明
2014/01/23
0
0
ElasticSearch IK分词器安装

Elasticsearch 默认是带分词器了,对英文是按固定的英文的空格,或者“-”进行分词,但是对中文分词是一个一个字进行分词。 分词测试地址: http://localhost:9200/analyze?analyzer=standar...

zchuanzhao
07/10
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

(一)软件测试专题——之Linux常用命令篇01

本文永久更新地址:https://my.oschina.net/bysu/blog/1931063 【若要到岸,请摇船:开源中国 不最醉不龟归】 Linux的历史之类的很多书籍都习惯把它的今生来世,祖宗十八代都扒出来,美其名曰...

不最醉不龟归
20分钟前
3
0
蚂蚁金服Java开发三面

8月20号晚上8点进行了蚂蚁金服Java开发岗的第三面,下面开始: 自我介绍(要求从实践过程以及技术背景角度着重介绍) 实习经历,说说你在公司实习所做的事情,学到了什么 关于你们的交易平台...

edwardGe
27分钟前
7
0
TypeScript基础入门 - 函数 - this(三)

转载 TypeScript基础入门 - 函数 - this(三) 项目实践仓库 https://github.com/durban89/typescript_demo.gittag: 1.2.4 为了保证后面的学习演示需要安装下ts-node,这样后面的每个操作都能...

durban
37分钟前
0
0
Spark core基础

Spark RDD的五大特性 RDD是由一系列的Partition组成的,如果Spark计算的数据是在HDFS上那么partition个数是与block数一致(大多数情况) RDD是有一系列的依赖关系,有利于Spark计算的容错 RDD中每...

张泽立
44分钟前
0
0
如何搭建Keepalived+Nginx+Tomcat高可用负载均衡架构

一.概述 初期的互联网企业由于业务量较小,所以一般单机部署,实现单点访问即可满足业务的需求,这也是最简单的部署方式,但是随着业务的不断扩大,系统的访问量逐渐的上升,单机部署的模式已...

Java大蜗牛
59分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部