文档章节

solr 创建core

木子SMZ
 木子SMZ
发布于 2016/07/14 16:17
字数 901
阅读 11
收藏 0

    core从文件结构的角度来看的话,主要包括一份索引(也可能还包括拼写检查的索引)、一堆配置文件。最主要的配置文件是:solrconfig.xml和schema.xml。solrconfig.xml从 整体上对core进行了配置,例如索引的存放路径、字段的最大长度(maxFiedlLength)、写锁的超时时间 (writeLockTimeout)、锁类型(lockType)、是否压缩索引(useCompoundFile)、内存索引缓冲区大小 (ramBufferSizeMB)、合并因子(mergeFactor)、删除策略、自动提交策略、缓存设置等,它好比是一份组装机器人的说明书,里面 详细描述了各个部件(handler)的参数。schema.xml主要是对索引的配置,例如分词器、字段名称+索引 方法+存储方式+分词方式、唯一标识字段等,它好比是机器人学习的学习方法,机器人主动或被动接受特定数据,按照配置转化成索引,然后通过其部件 (handler)展示出来,例如:search、moreLikeThis、spellCheck、factedSearcher等。

     总而言之,要使用solr首先要创建core,solr提供了非常简单的方法去创建一个core

$ bin/solr create -c <name>   //<name>是core的名称

执行完上面的命令,一个core就创建完成了,现在这个core是默认的配置,真正要投入使用还要修改配置文件。  进入到安装目录的server目录下,这里多说点,server目录可以理解成tomcat的Webapps目录,这个文件里面的文件会被发布出去。进入server文件下的solr文件,可以看到如下结构

框上红框的就是你创建的core(名称跟指定的corename一致)。

进入到core目录下的conf目录,这里最主要的配置文件是solrconfig.xml和managed-schema。

solrconfig.xml配置的是solr运行时的配置,比如版本、数据目录路径、缓存策略、超时时间;

managed-schema配置的是core里面详细的字段,可以简单理解成数据库中表的描述。

 

solrconfig.xml这里不做详细的描述了,具体怎么配置网上一查就有了。managed-schema要多说一点。

managed-schema主要标签有两种,field fieldType

field标签描述core里面的字段,主要属性有name(必须)、type(fieldType类型,必须)、store(是否存储)、 docValues ( 是一种记录doc字段值的一种形式,在例如在结果排序和统计Facet查询时,需要通过docid取字段值的场景下是非常高效的 )、index(是否创建索引)、multiValued(是否是多值)、required(是否必须)

fieldType定义类型,主要属性有name(必须)、class(必须),这两个是最常用的,除了这个还有一些其他的属性,具体用到具体查吧,需要多说一点的是fieldType标签下面还有其他的字标签,说起这些标签就要回到一个问题,这里为什么要定义类型呢?不能是其他数据库里面的那些常用的数据类型吗?别忘了solr是做什么的,solr不是一个高效的数据库,而是一个搜索引擎,solr要做的除了存储数据、索引数据之外还要做分词、同义词、评分等等的配置,这里不做过多详细的描述,等我demo写好之后再聊

© 著作权归作者所有

共有 人打赏支持
木子SMZ
粉丝 2
博文 34
码字总数 22804
作品 0
昌平
程序员
私信 提问
solr7.0 中文分词+拼音分词

资料准备 • solr7.0下载 • IK分词器下载 • 拼音分词器下载 solr文件目录(只讲一下7有些变化的目录) • web目录 : solr7/server/solr_webapp/webapp/ • home目录 : solr7/server/solr • ...

supersyd
2018/03/12
0
0
【Solr】- Tomcat部署

Solr可部署在任何Servlet容器:Tomcat/Jetty Solr部署在Tomcat的步骤 1: 创建Solr Home:磁盘任意位置:d:/temp/solr 2: 部署到tomcat: example/webapps目录下的solr.war部署到tomcat,新sol...

ZeroneLove
02/26
0
0
solr 初探

注:要使用solr 6.0 必须要由java 1.8 及以上的环境 1. 安装solr 从apache 官网下载solr软件包 并解压 tar zxf solr-x.y.z.tgz 我解压到了 /home/kfh/software/solr 目录下 2. 运行 solr 进入...

KongFanhao
2016/07/04
39
0
【Solr】- SolrCloud 基础操作

SolrCloud solr基于Zookeeper协调组件搭建的分布式搜索引擎,具有zookeeper的高可用以及集群的可伸缩性的特点。 SolrCloud结构图 Collection:对应standby模式Solr Core Shard(分片): 对应Col...

ZeroneLove
02/26
0
0
Tomcat+Solr构建企业级搜索引擎

1. 软件版本 solr5.2.1.tgz tomcat-7.0.33.tar.gz 本文略去tomcat的安装,不会的话自行百度一下。 2. 具体步骤 (1)将下载好的solr5.2.1.tgz tomcat-7.0.33.tar.gz 上传至服务器root目录下 [r...

sxguop
2015/12/01
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Confluence 6 升级中的一些常见问题

升级的时候遇到了问题了吗? 如果你想尝试重新进行升级的话,你需要首先重新恢复老的备份。不要尝试再次对 Confluence 进行升级或者在升级失败后重新启动老的 Confluence。 在升级过程中的一...

honeymoose
今天
2
0
C++随笔(四)Nuget打包

首先把自己编译好的包全部准备到一个文件夹 像这样 接下来新建一个文本文档,后缀名叫.nuspec 填写内容 <?xml version="1.0"?><package xmlns="http://schemas.microsoft.com/packaging/201......

Pulsar-V
今天
2
0
再谈使用开源软件搭建数据分析平台

三年前,我写了这篇博客使用开源软件快速搭建数据分析平台, 当时收到了许多的反馈,有50个点赞和300+的收藏。到现在我还能收到一些关于dataplay2的问题。在过去的三年,开源社区和新技术的发...

naughty
今天
10
0
Python3的日期和时间

python 中处理日期时间数据通常使用datetime和time库 因为这两个库中的一些功能有些重复,所以,首先我们来比较一下这两个库的区别,这可以帮助我们在适当的情况下时候合适的库。 在Python文...

编程老陆
今天
2
0
分布式面试整理

并发和并行 并行是两个任务同时进行,而并发呢,则是一会做一个任务一会又切换做另一个任务。 临界区 临界区用来表示一种公共资源或者说是共享数据,可以被多个线程使用,但是每一次,只能有...

群星纪元
今天
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部