elastic使用什么数据库 • Worktile社区

fiy

Worktile&PingCode市场小伙伴

Elasticsearch是一个分布式、可扩展、实时的搜索和分析引擎，它在内部使用了自定义的数据库存储引擎。它并不使用传统的关系型数据库（如MySQL、PostgreSQL）或NoSQL数据库（如MongoDB、Cassandra）来存储数据。相反，Elasticsearch使用自己的数据存储和检索引擎，它被称为倒排索引。

倒排索引是一种数据结构，可以快速地根据词项来查找文档。它将每个文档中的每个词项与包含该词项的文档进行关联。这样，当用户进行搜索时，Elasticsearch可以快速地找到包含所需词项的文档。

Elasticsearch的数据存储引擎具有以下特点：

分布式存储：Elasticsearch可以在多个节点上分布数据，实现高可用性和横向扩展。
实时性：Elasticsearch可以实时地索引和搜索数据，使用户能够立即获取最新的结果。
强大的全文搜索：Elasticsearch支持全文搜索，可以对文档中的所有字段进行搜索和匹配。
多种数据类型支持：Elasticsearch支持各种数据类型，包括文本、数字、日期等。
强大的查询语言：Elasticsearch提供了丰富的查询语言，可以进行复杂的搜索和过滤操作。

总之，Elasticsearch使用自己的数据存储引擎来存储和检索数据，它的倒排索引结构使其能够快速地进行全文搜索和分析。

1年前 0条评论

worktile

Worktile官方账号

Elasticsearch 使用的是 Lucene 作为底层的搜索引擎，而不是传统的关系型数据库。Lucene 是一个开源的全文搜索引擎库，它提供了强大的搜索和索引功能，被广泛应用于各种搜索应用中。

Elasticsearch 基于分布式架构，可以水平扩展，支持海量数据的存储和搜索。它具有实时性和高可用性的特点，可以快速处理大规模数据。

Elasticsearch 使用 JSON 格式来存储和处理数据，它将数据分为索引（index）、类型（type）和文档（document）三个层次。索引类似于数据库，类型类似于表，文档类似于表中的记录。每个文档都有一个唯一的 ID 标识，可以通过 ID 进行查询和更新。

Elasticsearch 支持全文搜索、模糊搜索、聚合分析等多种搜索和分析功能。它提供了丰富的查询语法和过滤条件，可以根据各种需求进行灵活的查询和过滤。

除了 Lucene，Elasticsearch 还使用了其他的开源技术，如 Apache Lucene、Apache ZooKeeper、Apache Thrift 等，来提供更强大的功能和性能。

总结起来，Elasticsearch 并没有使用传统的关系型数据库，而是使用 Lucene 作为底层的搜索引擎。它具有分布式架构、实时性、高可用性和强大的搜索和分析功能，能够处理大规模的数据。

1年前 0条评论

不及物动词

这个人很懒，什么都没有留下～

Elasticsearch是一个基于开源搜索引擎Lucene的分布式、RESTful的全文搜索和分析引擎。它被广泛应用于日志分析、实时搜索、数据分析等领域。Elasticsearch本身并不使用传统的关系型数据库作为存储，而是使用了自己的数据存储引擎。下面将详细介绍Elasticsearch的数据存储机制。

数据存储机制
Elasticsearch使用一种称为“倒排索引”的数据结构来存储和检索数据。倒排索引是一种将单词映射到其出现位置的索引结构。它将文档中的每个词汇映射到包含该词汇的所有文档的列表中。这种数据结构使得Elasticsearch能够快速地进行全文搜索和分析。
索引
在Elasticsearch中，数据以索引的形式组织。索引可以看作是一个数据库中的表，它包含了一组相关的文档。每个文档是一个包含了多个字段的JSON对象。在创建索引之前，需要先定义索引的映射(mapping)。映射定义了每个字段的数据类型和其他属性，如分词器、索引选项等。
类型
在Elasticsearch的早期版本中，一个索引可以包含多个类型。每个类型可以看作是索引中的一个子集，包含一组具有相似结构的文档。但是从Elasticsearch 7.0版本开始，类型的概念被废弃，一个索引只能包含一个类型。
节点和分片
Elasticsearch是一个分布式系统，数据可以分布在多个节点上。每个节点都是一个独立的服务器，它可以存储一部分数据并执行相关的搜索和分析操作。为了实现高可用性和横向扩展性，Elasticsearch将索引划分为多个分片。每个分片是一个独立的索引，它可以在不同的节点上存储，并且可以进行并行处理。
集群
多个节点组成一个Elasticsearch集群。集群中的每个节点都有一个唯一的名称，并且可以通过名称进行通信和协调。集群中的节点通过Gossip协议进行通信，并使用选举算法来选择主节点。主节点负责管理集群的元数据，如索引和分片的分配、节点的加入和离开等。
数据复制
为了保证数据的可靠性和高可用性，Elasticsearch使用数据复制机制。每个分片可以有多个副本(replica)，副本是原始分片的一份完整拷贝。副本分布在不同的节点上，并且与原始分片保持同步。如果某个节点故障，副本可以接管工作，保证数据的可用性。
数据一致性
当写入数据到Elasticsearch时，数据会首先写入主分片(primary shard)，然后通过复制机制同步到副本分片(replica shard)。只有当主分片和所有副本分片都完成写入操作后，写入操作才会返回成功。这种机制保证了数据的一致性。

总结：
Elasticsearch使用自己的数据存储引擎，采用倒排索引的数据结构进行数据的存储和检索。数据以索引的形式组织，每个索引包含一组相关的文档。索引可以划分为多个分片，分布在不同的节点上实现高可用性和横向扩展性。为了保证数据的可靠性和高可用性，Elasticsearch使用数据复制机制。写入操作必须在所有副本完成后才会返回成功，保证数据的一致性。

1年前 0条评论