[社区]Hudi

Hudi 是一个通用的大数据存储系统,主要特性:摄取和查询引擎之间的快照隔离,包括 Apache Hive、Presto 和 Apache Spark;支持回滚和存储点,可以恢复数据集;自动管理文件大小和布局,以优化查询性能和目录清单;准实时摄取,为查询提供最新数据; 实时数据和列数据的异步压缩。

沃尔玛基于 Apache Hudi 构建 Lakehouse

Hudi新零售大数据
头像不菜的鸟   创建 于 2024年04月01日 阅读次数 27
精彩评论
评论
全部评论