问题⼀:
什么是ElasticSearch?
Elasticsearch是⼀个基于Lucene的搜索引擎。它提供了具有HTTP Web界⾯和⽆架构JSON⽂档的分布式,多租户能⼒的全⽂搜索引擎。Elasticsearch是⽤Java开发的,根据Apache许可条款作为开源发布。
问题⼆:
您可以在⽂档上执⾏哪些基本操作? 可以在⽂档中进⾏以下操作:
a.使⽤ELASTICSEARCH索引⽂档内容。 b.使⽤ELASTICSEARCH抓取⽂档内容。 C.使⽤ELASTICSEARCH更新⽂档内容。 d.使⽤ELASTICSEARCH删除⽂档内容。
问题三:
Elasticsearch中的倒排索引是什么?
倒排索引是搜索引擎的核⼼。搜索引擎的主要⽬标是在查找发⽣搜索条件的⽂档时提供快速搜索。倒排索引是⼀种像数据结构⼀样的散列图,可将⽤户从单词导向⽂档或⽹页。它是搜索引擎的核⼼。其主要⽬标是快速搜索从数百万⽂件中查找数据。
⼀般情况下,像下⾯的⼀样,在书中我们已经倒过来索引。根据这个词,我们可以找到这个词所在的页⾯。
请考虑以下列语句:
javainuse是⼀个很好的⽹站 javainuse是很好的⽹站之⼀。
为了索引的⽬的,上述⽂本被标记为单独的术语,并且所有独特术语被存储在索引内,诸如该术语出现在哪个⽂档以及该⽂档中术语位置是什么。 因此,⽂件⽂本的倒排索引如下 :
当您搜索术语⽹站或⽹站时,将针对倒排索引执⾏查询并查找术语,并快速识别出现这些术语的⽂档。
问题四:
ElasticSearch中的集群、节点、索引、⽂档、类型是什么?
群集是⼀个或多个节点(服务器)的集合,它们共同保存您的整个数据,并提供跨所有节点的联合索引和搜索功能。群集由唯⼀名称标识,默认情况下为“elasticsearch”。此名称很重要,因为如果节点设置为按名称加⼊群集,则该节点只能是群集的⼀部分。
节点是属于集群⼀部分的单个服务器。它存储数据并参与群集索引和搜索功能。
索引就像关系数据库中的“数据库”。它有⼀个定义多种类型的映射。索引是逻辑名称空间,映射到⼀个或多个主分⽚,并且可以有零个或多个副本分⽚。 MySQL =>数据库 ElasticSearch =>索引
⽂档类似于关系数据库中的⼀⾏。不同之处在于索引中的每个⽂档可以具有不同的结构(字段),但是对于通⽤字段应该具有相同的数据类型。 MySQL => Databases => Tables => Columns / RowsElasticSearch => Indices => Types =>具有属性的⽂档类型是索引的逻辑类别/分区,其语义完全取决于⽤户。
问题五:
ElasticSearch是否有架构?
ElasticSearch可以有⼀个架构。架构是描述⽂档类型以及如何处理⽂档的不同字段的⼀个或多个字段的描述。Elasticsearch中的架构是⼀种映射,它描述了JSON⽂档中的字段及其数据类型,以及它们应该如何在Lucene索引中进⾏索引。因此,在Elasticsearch术语中,我们通常将此模式称为“映射”。
Elasticsearch具有架构灵活的能⼒,这意味着可以在不明确提供架构的情况下索引⽂档。如果未指定映射,则默认情况下,Elasticsearch会在索引期间检测⽂档中的新字段时动态⽣成⼀个映射。
问题六:
ElasticSearch中的分⽚是什么?
在⼤多数环境中,每个节点都在单独的盒⼦或虚拟机上运⾏。 索引 - 在Elasticsearch中,索引是⽂档的集合。
分⽚ -因为Elasticsearch是⼀个分布式搜索引擎,所以索引通常被分割成分布在多个节点上的被称为分⽚的元素。
问题七:
ElasticSearch中的副本是什么?
⼀个索引被分解成碎⽚以便于分发和扩展。副本是分⽚的副本。⼀个节点是⼀个属于⼀个集群的ElasticSearch的运⾏实例。⼀个集群由⼀个或多个共享相同集群名称的节点组成。
问题⼋:
ElasticSearch中的分析器是什么?
在ElasticSearch中索引数据时,数据由为索引定义的Analyzer在内部进⾏转换。 分析器由⼀个Tokenizer和零个或多个TokenFilter组成。编译器可以在⼀个或多个CharFilter之前。分析模块允许您在逻辑名称下注册分析器,然后可以在映射定义或某些API中引⽤它们。
Elasticsearch附带了许多可以随时使⽤的预建分析器。或者,您可以组合内置的字符过滤器,编译器和过滤器器来创建⾃定义分析器。
问题九:
什么是ElasticSearch中的编译器?
编译器⽤于将字符串分解为术语或标记流。⼀个简单的编译器可能会将字符串拆分为任何遇到空格或标点的地⽅。Elasticsearch有许多内置标记器,可⽤于构建⾃定义分析器。
问题⼗:
什么是ElasticSearch中的过滤器?
数据由Tokenizer处理后,在编制索引之前,过滤器会对其进⾏处理。
问题⼗⼀:
启⽤属性,索引和存储的⽤途是什么?
enabled属性适⽤于各类ElasticSearch特定/创建领域,如index和size。⽤户提供的字段没有“已启⽤”属性。存储意味着数据由Lucene存储,如果询问,将返回这些数据。
存储字段不⼀定是可搜索的。默认情况下,字段不存储,但源⽂件是完整的。因为您希望使⽤默认值(这是有意义的),所以不要设置store属性 该指数属性⽤于搜索。
索引属性只能⽤于搜索。只有索引域可以进⾏搜索。差异的原因是在分析期间对索引字段进⾏了转换,因此如果需要的话,您不能检索原始数据。
转发是对作者最⼤的⽀持!!!
因篇幅问题不能全部显示,请点此查看更多更全内容