Apache Doris 2.1.4:数据湖仓新飞跃,稳定性能再升级

作者:半吊子全栈工匠2024.08.30 05:19浏览量:13

简介:Apache Doris 2.1.4 版本正式发布,带来多项性能优化与功能提升,特别是在数据湖仓场景下的稳定性与兼容性上取得显著进步,为用户带来更加高效的数据处理体验。

Apache Doris 2.1.4 版本正式发布

在数据技术日新月异的今天,Apache Doris 作为一款高性能的 MPP 分析型数据库,始终致力于为用户提供稳定、高效的数据处理解决方案。近日,Apache Doris 2.1.4 版本正式发布,这一版本在继承前代版本优势的基础上,进行了多项重要的性能优化和功能增强,为数据湖仓场景下的数据处理带来了全新体验。

性能优化与稳定性提升

1. 异步物化视图性能优化
Apache Doris 2.1.4 版本对异步物化视图的性能进行了全面优化。通过透明改写规划,该版本支持单表异步物化视图的透明改写,并优化了AGG_STATE类型聚合滚动的性能。此外,还修复了多个与异步物化视图相关的bug,如构建时指定store_row_column和storage_medium属性不生效的问题,以及异步物化视图引起的备份恢复异常等。这些优化和修复显著提升了异步物化视图的稳定性和可用性。

2. 数据扫描性能提升
针对大数据量场景下的数据扫描性能问题,Apache Doris 2.1.4 版本引入了分批获取Hudi和Hive文件列表的功能。当存在大量数据文件时,这一功能可以显著提升数据扫描性能。据测试,在120万文件场景中,获取文件列表的时间由390秒缩减到46秒,为用户节省了大量时间。

3. 内存使用优化
为了解决之前版本中可能存在的内存使用异常问题,Apache Doris 2.1.4 版本在内存使用方面进行了多项优化。例如,通过更准确地估计segment cache消耗的内存,使得未使用的内存可以更快地被释放。这些优化有助于防止内存泄漏和内存溢出等问题,提高了系统的稳定性和可靠性。

新功能引入

1. 查询优化器增强
Apache Doris 2.1.4 版本中的查询优化器得到了进一步增强。新版本支持了FE火焰图工具,帮助用户更好地理解和优化查询性能。同时,还支持SELECT DISTINCT与聚合操作结合使用,以及无GROUP BY的单表查询重写功能,这些功能为用户提供了更加灵活和强大的查询能力。

2. Lakehouse功能拓展
在数据湖仓场景下,Apache Doris 2.1.4 版本也进行了多项功能拓展。新版本支持了Apache Paimon删除向量的原生读取,以及使用资源在表值函数中的功能。此外,访问控制器与Hive Ranger插件的结合还支持了数据掩码功能,为用户提供了更加安全的数据访问控制手段。

3. 其他新功能
除了上述功能外,Apache Doris 2.1.4 版本还引入了多项实用功能。例如,增加了replace_empty函数和show storage policy using语句的支持;在BE侧支持了JVM监控指标;优化了中文列名创建倒排索引的支持等。这些新功能的引入进一步丰富了Apache Doris的功能集,为用户提供了更多便利。

总结与展望

Apache Doris 2.1.4 版本的发布标志着该数据库在数据湖仓场景下的稳定性和性能又迈上了一个新的台阶。通过多项性能优化和功能增强,新版本为用户提供了更加高效、稳定、安全的数据处理解决方案。未来,Apache Doris 团队将继续致力于技术创新和产品研发,为用户提供更加卓越的数据处理能力。

对于广大用户而言,升级到Apache Doris 2.1.4 版本将是一个明智的选择。通过享受新版本带来的诸多优势和便利,用户可以更加高效地完成数据处理任务,为企业的发展注入更加强劲的动力。