主流云数仓性能对比分析
共 3852字,需浏览 8分钟
·
2020-11-15 03:23
——威尔·杜兰特(哲学家、历史学家)
在性能方面,无论是单进程还是并发方式,Redshift都是表现最好的,Synapse其次。
在并发性能方面,Snowflake和BigQuery似乎没有Redshift和Synapse控制得好。
性价比方面,Redshift和Synapse差不多,BigQuery最贵。
本次测试主要只是性能对比,不涉及功能、安全性、扩展性、高可用、备份、生态等等其它方面,有一定局限性。
Snowflake和BigQuery在市场上的宣传一直都是强调其易用性和易管理性(无需DBA),这方面在本次测试中没有涉及。
本次测试采用的TPC-H模型可能是为了迁就Actian而选择,相对简单,无法完全反映真实环境中的各种复杂负载和ad-hoc查询,另外5并发也相对较低。
当今各云数仓版本迭代都很快,功能上Snowflake、Redshift、Synapse、BigQuery都已经很接近,而且大家都在互相学习,比如存储计算分离、按需弹性扩展、数据共享与交换、对象存储集成等等, 90%的功能大家都雷同,只是在技术细节的实现上各有不同。
Snowflake与其它3家不大相同,它为独立的第三方,有跨云部署的优势。但它底层还需要依赖第三方云厂商的基础架构,比如AWS、GCP、Azure,随着这些厂商自身云数仓服务的发展,这种合作关系可能未来可能会变得越来越微妙。
易用性和易管理性是未来各云数仓的发展重点,Snowflake开了个好头,其它各厂商都紧密跟进,今后可能真的没有DBA这个职业了。
未来云数仓或云数据库,更多的优化可能会与底层专有硬件或网络相结合,比如CPU、GPU、FPGA、专有协议等等,这些是云厂商自研产品的优势,而像Snowflake、Actian、ClickHouse等第三方平台是无法做到的。所以,易用性、通用性和性能本身就是一对矛盾的共同体,客户可以按照自己的实际需求来权衡、选择。
来源:肉眼品世界
版权申明:内容来源网络,版权归原创者所有。除非无法确认,我们都会标明作者及出处,如有侵权烦请告知,我们会立即删除并表示歉意。谢谢!