Kudu是一个分布式的,具有可扩展性的列式存储管理器,可以对快速变化的数据进行快速分析。
使用场景
- 近实时计算场景
- 时间序列数据的场景
- 预测建模
- 与存量数据共存
- 既有随机读写/访问,又有批量扫描分析的场景(OLAP)
- HTAP混合事务分析处理场景
- Kudu作为持久层与Impala紧密集成的场景
架构
Kudu包含两种类型的组件:
- Master Server:负责管理元数据
元数据包括Tablet Server的服务器信息以及Tablet信息,Master Server通过Raft协议提供高可用性。
- Tablet Server:用来存储Tablets