Elasticsearch
一共25篇文章
专题:第24期
-
对于 GC 方面,在使用 Elasticsearch 时要注意什么?
参考答案 对于 GC 方面,在使用 Elasticsearch 时需要注意以下 5 点: 倒排词典的索引需要常驻内存,无法 GC,需要监控 data node 上 segmentmemory 增长趋势。 各类缓存,field cache, filter cache, indexing cache, bulk queue 等等,要设置合理的大小,并且要应该根据最坏的情况来看 heap 是否够用,…...- 宝妹儿
- 130
- 0
-
ElasticSearch 中的分片是什么?
参考答案 在大多数环境中,每个节点都在单独的盒子或虚拟机上运行。 索引: 在 Elasticsearch 中,索引是文档的集合。 分片 :因为 Elasticsearch 是一个分布式搜索引擎,所以索引通常被分割成分布在多个节点上,被称为分片的元素。 以上,是 Elasticsearch 搜索面试题【ElasticSearch 中的分片是什么?】的参考答案。 输出,是最好的学习方法。 欢迎在评论区…...- 宝妹儿
- 58
- 0
-
ElasticSearch 中的分析器是什么?
参考答案 在 ElasticSearch 中索引数据时,数据由为索引定义的 Analyzer 在内部进行转换。 分析器由一个 Tokenizer 、和多个 TokenFilter 组成。 编译器可以在1个或多个 CharFilter 之前,分析模块允许在逻辑名称下注册分析器。然后就能在映射定义、或某些 API 中引用它们。 Elasticsearch 附带了许多可以随时使用的预建分析器。我们还可以…...- 宝妹儿
- 54
- 0
-
ElasticSearch 是否有架构?
参考答案 ElasticSearch可以有一个架构,Elasticsearch 中的架构是一种映射。它描述了 JSON 文档中的字段及其数据类型,以及它们应该如何在 Lucene 索引中进行索引。 因此,在 Elasticsearch 术语中,我们通常将此模式称为“映射”。 Elasticsearch 具有架构灵活的能力,这意味着可以在不明确提供架构的情况下索引文档。如果未指定映射,则默认情况下,…...- 宝妹儿
- 46
- 0
-
启用属性,索引和存储的用途是什么?
参考答案 enabled 属性,适用于各类 ElasticSearch 特定/创建领域,例如 index 和 size 。 用户提供的字段没有“已启用”属性,存储意味着数据由 Lucene 存储,如果询问,将返回这些数据。 存储字段不一定是可搜索的。默认情况下,字段不存储,但源文件是完整的。因为您希望使用默认值(这是有意义的),所以不要设置 store 属性该指数属性用于搜索。 索引属性只能用于搜…...- 宝妹儿
- 55
- 0
-
Elasticsearch 在部署时,对 Linux 的设置有哪些优化方法?
参考答案 Elasticsearch 在部署时,对 Linux 的设置优化方法: 64 GB 内存的机器是非常理想的, 32 GB 和 16 GB 机器也很常见,但是,少于 8 GB 就会适得其反。 如果要在更快的 CPU 和更多的核心之间进行选择,选择更多的核心更好,多个内核提供的额外并发,远胜过稍微快一点点的时钟频率。 如果忽略成本,SSD 是一个很好的选择。它将远远超出任何旋转介质。 …...- 宝妹儿
- 50
- 0
-
ElasticSearch 中的编译器是什么?
参考答案 编译器用于将字符串分解为术语或标记流。 一个简单的编译器,可能会将字符串拆分为任何遇到空格、或标点的地方。 Elasticsearch 有许多内置标记器,可用于构建自定义分析器。 以上,是 Elasticsearch 搜索面试题【什么是 ElasticSearch 中的编译器?】的参考答案。 输出,是最好的学习方法。 欢迎在评论区留下你的问题、笔记或知识点补充~ —end—...- 宝妹儿
- 55
- 0
-
ElasticSearch 中的副本是什么?
参考答案 一个索引被分解成碎片,以便于分发和扩展。 副本是分片的副本。 一个节点是属于一个集群的 ElasticSearch 的运行实例。 一个集群由一个或多个共享相同集群名称的节点组成。 以上,是 Elasticsearch 搜索面试题【ElasticSearch 中的副本是什么?】的参考答案。 输出,是最好的学习方法。 欢迎在评论区留下你的问题、笔记或知识点补充~ —end—...- 宝妹儿
- 50
- 0
-
Elasticsearch 索引和关系数据库中的索引,两者有什么区别?
参考答案 数据库中的“索引” 数据库中的“索引”是辅助数据结构,它使WHERE查询和查询变得JOIN快速,并且它们通常存储的值与表中显示的值完全相同。 我们仍然可以具有未建立索引的列,但随后WHERE需要进行全表扫描,这在大型表上比较慢。 ES 中的“索引” ES中的“索引”实际上是文档的示意图集合,类似于关系世界中的数据库。 ES 中可以有不同的“类型”的文档,这与 dbs 中的表非常相似。ES…...- 宝妹儿
- 71
- 0
-
ElasticSearch 分片如何影响索引性能?
参考答案 Q:ElasticSearch 分片如何影响索引性能? 我们要对 ElasticSearch 的单节点集群进行一些基准测试。 现在的情况是: 没有资源问题,资源是免费的(CPU和内存),更多的分片将至少在单个节点中降低索引性能(延迟和吞吐量) 这是一些数字: 使用1个分片进行索引,每分钟索引+ 6K文档 索引5个分片,每分钟索引+ 3K文档 索引20个分片,每分钟索引+ 1K文档 使用批…...- 宝妹儿
- 41
- 0
-
Elasticsearch 对于大数据量(上亿量级)的聚合如何实现?
参考答案 Elasticsearch 提供的首个近似聚合是 cardinality 度量。 关于 cardinality 度量: 它提供一个字段的基数,即该字段的 distinct 或者unique 值的数目。 它是基于 HLL 算法的。HLL 会先对我们的输入作哈希运算,然后根据哈希运算的结果中的 bits 做概率估算,从而得到基数。 其特点是:可配置的精度,用来控制内存的使用(更精确 = 更多…...- 宝妹儿
- 33
- 0
-
Elasticsearch 索引文档的过程?
参考答案 这里的Elasticsearch 索引文档的过程,我们理解为文档写入 ES ,创建索引的过程。 文档写入包含了单文档写入、批量 bulk 写入。这里我们只阐述单文档写入流程。 官方文档中的图例。 第一步:客户写集群某节点写入数据,发送请求。(如果没有指定路由/协调节点,请求的节点扮演路由节点的角色。) 第二步:节点1接受到请求后,使用文档_id来确定文档属于分片0。请求会被转到另外的节点…...- 宝妹儿
- 49
- 0