Elasticsearch

往期专题

一共25篇文章

专题：第24期

Elasticsearch搜索面试题

对于 GC 方面，在使用 Elasticsearch 时要注意什么？

参考答案对于 GC 方面，在使用 Elasticsearch 时需要注意以下 5 点：倒排词典的索引需要常驻内存，无法 GC，需要监控 data node 上 segmentmemory 增长趋势。各类缓存，field cache, filter cache, indexing cache, bulk queue 等等，要设置合理的大小，并且要应该根据最坏的情况来看 heap 是否够用，…...
- 宝妹儿
- 22年12月29日
- 204
- 0
Elasticsearch搜索面试题

ElasticSearch 中的分片是什么？

参考答案在大多数环境中，每个节点都在单独的盒子或虚拟机上运行。索引：在 Elasticsearch 中，索引是文档的集合。分片：因为 Elasticsearch 是一个分布式搜索引擎，所以索引通常被分割成分布在多个节点上，被称为分片的元素。以上，是 Elasticsearch 搜索面试题【ElasticSearch 中的分片是什么？】的参考答案。输出，是最好的学习方法。欢迎在评论区…...
- 宝妹儿
- 22年12月29日
- 119
- 0
Elasticsearch搜索面试题

ElasticSearch 中的分析器是什么？

参考答案在 ElasticSearch 中索引数据时，数据由为索引定义的 Analyzer 在内部进行转换。分析器由一个 Tokenizer 、和多个 TokenFilter 组成。编译器可以在1个或多个 CharFilter 之前，分析模块允许在逻辑名称下注册分析器。然后就能在映射定义、或某些 API 中引用它们。 Elasticsearch 附带了许多可以随时使用的预建分析器。我们还可以…...
- 宝妹儿
- 22年12月29日
- 111
- 0
Elasticsearch搜索面试题

ElasticSearch 是否有架构？

参考答案 ElasticSearch可以有一个架构，Elasticsearch 中的架构是一种映射。它描述了 JSON 文档中的字段及其数据类型，以及它们应该如何在 Lucene 索引中进行索引。因此，在 Elasticsearch 术语中，我们通常将此模式称为“映射”。 Elasticsearch 具有架构灵活的能力，这意味着可以在不明确提供架构的情况下索引文档。如果未指定映射，则默认情况下，…...
- 宝妹儿
- 22年12月29日
- 98
- 0
Elasticsearch搜索面试题

启用属性，索引和存储的用途是什么？

参考答案 enabled 属性，适用于各类 ElasticSearch 特定/创建领域，例如 index 和 size 。用户提供的字段没有“已启用”属性，存储意味着数据由 Lucene 存储，如果询问，将返回这些数据。存储字段不一定是可搜索的。默认情况下，字段不存储，但源文件是完整的。因为您希望使用默认值(这是有意义的)，所以不要设置 store 属性该指数属性用于搜索。索引属性只能用于搜…...
- 宝妹儿
- 22年12月29日
- 139
- 0
Elasticsearch搜索面试题

Elasticsearch 在部署时，对 Linux 的设置有哪些优化方法？

参考答案 Elasticsearch 在部署时，对 Linux 的设置优化方法： 64 GB 内存的机器是非常理想的， 32 GB 和 16 GB 机器也很常见，但是，少于 8 GB 就会适得其反。如果要在更快的 CPU 和更多的核心之间进行选择，选择更多的核心更好，多个内核提供的额外并发，远胜过稍微快一点点的时钟频率。如果忽略成本，SSD 是一个很好的选择。它将远远超出任何旋转介质。 …...
- 宝妹儿
- 22年12月29日
- 127
- 0
Elasticsearch搜索面试题

ElasticSearch 中的编译器是什么？

参考答案编译器用于将字符串分解为术语或标记流。一个简单的编译器，可能会将字符串拆分为任何遇到空格、或标点的地方。 Elasticsearch 有许多内置标记器，可用于构建自定义分析器。以上，是 Elasticsearch 搜索面试题【什么是 ElasticSearch 中的编译器？】的参考答案。输出，是最好的学习方法。欢迎在评论区留下你的问题、笔记或知识点补充~ —end—...
- 宝妹儿
- 22年12月29日
- 115
- 0
Elasticsearch搜索面试题

ElasticSearch 中的副本是什么？

参考答案一个索引被分解成碎片，以便于分发和扩展。副本是分片的副本。一个节点是属于一个集群的 ElasticSearch 的运行实例。一个集群由一个或多个共享相同集群名称的节点组成。以上，是 Elasticsearch 搜索面试题【ElasticSearch 中的副本是什么？】的参考答案。输出，是最好的学习方法。欢迎在评论区留下你的问题、笔记或知识点补充~ —end—...
- 宝妹儿
- 22年12月29日
- 126
- 0
Elasticsearch搜索面试题

Elasticsearch 索引和关系数据库中的索引，两者有什么区别？

参考答案数据库中的“索引” 数据库中的“索引”是辅助数据结构，它使WHERE查询和查询变得JOIN快速，并且它们通常存储的值与表中显示的值完全相同。我们仍然可以具有未建立索引的列，但随后WHERE需要进行全表扫描，这在大型表上比较慢。 ES 中的“索引” ES中的“索引”实际上是文档的示意图集合，类似于关系世界中的数据库。 ES 中可以有不同的“类型”的文档，这与 dbs 中的表非常相似。ES…...
- 宝妹儿
- 22年12月29日
- 135
- 0
Elasticsearch搜索面试题

ElasticSearch 分片如何影响索引性能？

参考答案 Q：ElasticSearch 分片如何影响索引性能？我们要对 ElasticSearch 的单节点集群进行一些基准测试。现在的情况是：没有资源问题，资源是免费的（CPU和内存），更多的分片将至少在单个节点中降低索引性能（延迟和吞吐量）这是一些数字：使用1个分片进行索引，每分钟索引+ 6K文档索引5个分片，每分钟索引+ 3K文档索引20个分片，每分钟索引+ 1K文档使用批…...
- 宝妹儿
- 22年12月29日
- 134
- 0
Elasticsearch搜索面试题

Elasticsearch 对于大数据量（上亿量级）的聚合如何实现？

参考答案 Elasticsearch 提供的首个近似聚合是 cardinality 度量。关于 cardinality 度量：它提供一个字段的基数，即该字段的 distinct 或者unique 值的数目。它是基于 HLL 算法的。HLL 会先对我们的输入作哈希运算，然后根据哈希运算的结果中的 bits 做概率估算，从而得到基数。其特点是：可配置的精度，用来控制内存的使用（更精确＝更多…...
- 宝妹儿
- 22年12月29日
- 105
- 0
Elasticsearch搜索面试题

Elasticsearch 索引文档的过程？

参考答案这里的Elasticsearch 索引文档的过程，我们理解为文档写入 ES ，创建索引的过程。文档写入包含了单文档写入、批量 bulk 写入。这里我们只阐述单文档写入流程。官方文档中的图例。第一步：客户写集群某节点写入数据，发送请求。（如果没有指定路由/协调节点，请求的节点扮演路由节点的角色。）第二步：节点1接受到请求后，使用文档_id来确定文档属于分片0。请求会被转到另外的节点…...
- 宝妹儿
- 22年12月29日
- 119
- 0