
リアルタイムMPP分析DB
無料

Apache Dorisは、MPP(超並列処理)アーキテクチャに基づく高性能なリアルタイム分析データベースです。多次元データ分析、アドホッククエリ、高並列ポイントクエリに優れています。複雑なETLパイプラインを必要とする従来のOLAPシステムとは異なり、KafkaやFlinkからのリアルタイムデータ取り込みをサポートし、複雑な結合や集計に対してサブ秒のレイテンシを実現します。独自のベクトル化実行エンジンとコストベースオプティマイザ(CBO)により、ペタバイト規模のデータセットを高いスループットで処理可能であり、AI駆動型分析においてHadoopベースのスタックやレガシーなデータウェアハウスに代わる優れた選択肢となります。
Dorisは、データを行単位ではなくバッチ単位で処理するベクトル化クエリ実行エンジンを採用しています。SIMD(Single Instruction, Multiple Data)CPU命令を活用することで、命令オーバーヘッドを大幅に削減し、キャッシュ局所性を向上させます。このアーキテクチャにより、従来の行ベースエンジンと比較して分析クエリ処理で5倍から10倍のパフォーマンス向上を実現し、最小限のCPUサイクルで大規模データセットの複雑な集計を効率的に処理します。
Stream Load、Broker Load、Routine Loadなど、複数のプロトコルを通じた高スループットなリアルタイムデータ取り込みをサポートします。Apache KafkaやFlinkとネイティブに統合することで、中間バッチ処理レイヤーが不要になります。これにより、ユーザーはデータ到着から数秒以内にクエリを実行でき、従来のETLパイプラインのレイテンシなしで、分析ダッシュボードやAIモデルに常に最新のデータ状態を反映させることが可能です。
Apache DorisのCBOは、複雑な複数テーブルの結合やネストされたサブクエリを処理するように設計されています。データ分布、カーディナリティ、統計情報を分析し、最も効率的な実行計画を自動的に選択します。結合順序や物理演算子を最適化することで、ネットワーク全体でのデータシャッフルを最小限に抑えます。これは、ネットワークI/Oがボトルネックとなりやすい分散MPP環境において、パフォーマンスを維持するために不可欠です。
高並列シナリオ向けに最適化されており、ポイントクエリに対して数千QPS(1秒あたりのクエリ数)をサポートします。特定の列に対して行ストア形式を採用し、専用のキャッシュレイヤーを利用して頻繁なルックアップを即座に処理します。これにより、低レイテンシの応答が求められるユーザー向けアプリケーションに適しており、重いスキャンに重点を置く従来のOLAPシステムと、トランザクション整合性に重点を置くOLTPシステムのギャップを埋めます。
大規模デプロイメントをサポートするため、Workload Groupsを通じた堅牢なリソース分離を提供します。管理者はユーザーやクエリタイプごとにCPUとメモリの制限を定義でき、単一の重い分析クエリが他のユーザーのパフォーマンスを低下させる「ノイジーネイバー」問題を防止します。このきめ細かな制御は、単一の共有クラスタ上で複数の社内チームを管理するSaaSプロバイダーや大企業にとって不可欠です。
マーケティングチームはDorisを使用して、Kafkaからのクリックストリームデータをリアルタイムで取り込みます。アドホックSQLクエリを実行することで、ユーザーのコンバージョンファネルやセッション指標を即座に追跡し、ライブのユーザーインタラクションに基づいたA/Bテストの調整やパーソナライズされたコンテンツ配信を即座に行うことができます。
DevOpsエンジニアはDorisを活用して、膨大なシステムログを集計・検索します。高速なフィルタリングと集計能力により、チームはシステムボトルネックやセキュリティ上の脅威を数秒以内に特定でき、低速でディスク負荷の高いログ管理ツールを置き換えることができます。
データサイエンティストは、機械学習モデルのリアルタイム特徴量ストアとしてDorisを利用します。事前計算された特徴量と生データを格納することで、モデル推論時に低レイテンシで特徴量にアクセスでき、AI予測が常に最新のデータポイントに基づいていることを保証します。
堅牢で低レイテンシなデータパイプラインを構築する必要があります。Dorisは、バッチとストリーミングの両方のデータ取り込みを効率的に処理する単一の統合システムに置き換えることで、複雑なラムダアーキテクチャを簡素化します。
複雑な分析タスクに対して標準SQLをサポートするデータベースを必要としています。Dorisは、特殊な独自クエリ言語を必要とせずに、インタラクティブなダッシュボードやレポートツールに必要なパフォーマンスを提供します。
エンドユーザーにリアルタイムのインサイトを提供する必要があります。Dorisを活用することで、ユーザーベースの拡大に合わせてシームレスに拡張可能な、高性能なユーザー向け分析機能を構築できます。
Apache License 2.0に基づくオープンソース。ライセンス料なしで、あらゆる環境において完全に無料でダウンロード、変更、デプロイが可能です。