参考答案
这里的Elasticsearch 索引文档的过程,我们理解为文档写入 ES ,创建索引的过程。
文档写入包含了单文档写入、批量 bulk 写入。这里我们只阐述单文档写入流程。
官方文档中的图例。
- 第一步:客户写集群某节点写入数据,发送请求。(如果没有指定路由/协调节点,请求的节点扮演路由节点的角色。)
- 第二步:节点1接受到请求后,使用文档_id来确定文档属于分片0。请求会被转到另外的节点,假定节点3。因此分片0的主分片分配到节点3上。
- 第三步:节点3在主分片上执行写操作,如果成功,则将请求并行转发到节点1和节点2的副本分片上,等待结果返回。所有的副本分片都报告成功,节点3将向协调节点(节点1)报告成功,节点1向请求客户端报告写入成功。
这个时候,有的面试官会追问:第二步中的文档,获取分片的过程是怎样的?
- 借助路由算法获取。
- 路由算法就是根据路由和文档 id ,来计算目标的分片 id 的过程。
shard = hash(_routing) % (num_of_primary_shards)
以上,是 Elasticsearch 搜索面试题【Elasticsearch 索引文档的过程?】的参考答案。
输出,是最好的学习方法。
欢迎在评论区留下你的问题、笔记或知识点补充~
—end—