Appearance
新一代流数据湖存储
数据湖格式、LSM结构、实时更新
主键表支持海量数据实时流式更新,1分钟内实时查询。
定义合并引擎,按你喜欢的方式更新记录。删除重复项以保留最后一行,或部分更新,或聚合记录,或第一行,由你决定。
定义changelog-producer,为合并引擎的更新生成正确且完整的变更日志,简化您的流分析。
附加表(无主键)提供大规模批量和流式处理能力。支持使用 z 顺序排序的压缩。
基于minmax等索引,过滤不相关的文件并提供高性能查询,正在支持更多的索引。
低成本、高可靠性、可扩展元数据、时间旅行和完整模式演进。作为数据湖存储,所有优势均具备。
Local File System
HDFS
Aliyun OSS
S3