Apache Doris: Open Source, Real-Time Analytics and Search Database for the AI Era

Core capabilities

Real-time ingestion and storage

Push-based micro-batch and pull-based streaming data ingestion within a second. Storage engine with real-time upsert, append and pre-aggregation.

Lightning-fast query

Optimize for high-concurrency and high-throughput queries with columnar storage engine, MPP architecture, cost based query optimizer, vectorized execution engine.

Federated querying

Federated querying of data lakes such as Hive, Iceberg and Hudi, and databases such as MySQL and PostgreSQL.

Semi-structured data

Compound data types such as Array, Map and JSON. Variant data type to support auto data type inference of JSON data. NGram bloomfilter and inverted index for text searches.

Elastic architecture

Distributed design for linear scalability. Workload isolation and tiered storage for efficient resource management. Supports shared-nothing clusters as well as separation of storage and compute.

Open ecosystem

Compatible with MySQL protocol and ANSI SQL, easily integrated with BI tools. Provide open data API to be accessible for external compute engines like Spark, Flink and ML/AI.

Unified data warehouse

for various analytics use cases

Real-time analytics

Ad-hoc analysis

Data lakehouse

ELT data processing

Log analytics

Customer data platform

From traditional batch reporting to real-time reporting and dashboards. From internal-facing analytics like traditional BI to customer-facing analytics. From decision support analytics to algorithm-driven real-time decision-making.

Read JD.com story

How ByteDance Solved Billion-Scale Vector Search Problem with Apache Doris 4.0

Apache Doris Up to 34x Faster Than ClickHouse in Real-Time Updates

Fast JSON Analytics in Apache Doris: 100x Faster Than PostgreSQL and MongoDB

Deploying Apache Doris with MinIO: Analytics with Storage-Compute Separation

What is Apache Doris

Core capabilities

Unified data warehouse
for various analytics use cases

Connect with community

Start a real-time analytical journey with Apache Doris

How ByteDance Solved Billion-Scale Vector Search Problem with Apache Doris 4.0

Apache Doris Up to 34x Faster Than ClickHouse in Real-Time Updates

Fast JSON Analytics in Apache Doris: 100x Faster Than PostgreSQL and MongoDB

Deploying Apache Doris with MinIO: Analytics with Storage-Compute Separation

What is Apache Doris

Core capabilities

Unified data warehousefor various analytics use cases

Connect with community

Start a real-time analytical journey with Apache Doris

Unified data warehouse
for various analytics use cases