快手短视频如何支撑 10 亿月活,揭秘快手大数据中台架构!
开发数据服务门槛高
重复开发数据服务
痛点一:开发数据服务门槛高
数据如何交付:业务通常期望使用数据接口方式来使用数据而非数据表,这会更加灵活、解耦、高效。数据开发工程师因此需要建立对应的数据服务。 服务如何开发:数据服务有多种形式,通常要求开发工程师有微服务知识、服务发现注册、高并发等。 权限、可用性问题:开发完数据服务后,需要考虑权限问题,确保数据资源能被安全的访问;此外还需要考虑可用性问题,要以多种手段保障数据访问的稳定性。 运维问题:数据服务本身涉及多种运维问题,如扩容、迁移、下线、接口变更、服务报警等。

痛点二:重复开发数据服务
系统架构
关键技术一:配置即开发
数据源; 数据加速到何处; 接口形态,访问方式; 配置独立的测试环境,访问隔离的测试数据。当配置完毕后,数据服务平台便会根据配置清单,完成接口的自动化生产和部署。生产和部署完毕后,调用方在平台申请服务权限调用。通过自动化生产,达到配置即开发的目的,从而极大的提升效率。
关键技术二:多模式服务形态

关键技术三:高效数据加速


关键技术四:高可用保障

数据同步:对数据资产同步至高速存储的过程进行监控,包括数据质量检测(过滤脏数据)、同步超时或者失败检测等。 服务稳定性:构建一个独立的哨兵服务,来监测每个API的运行指标(如延迟、可用性等),客观的评估健康度。 业务正确性:数据服务需要确保用户访问的数据内容和数据资产表内容是一致的,因此哨兵服务会从数据一致性层面去探查,确保每个API的数据一致性。
对于准在线业务和内部数据系统,基于CH、Druid等多种数据引擎,支持多种灵活查询。数据服务平台支持了多种模式API,很好满足了多元化需求。此外数据服务平台也支持服务权限、API市场等丰富功能,进一步赋能业务。
来源:倪顺 | 数据学堂
推荐阅读:
如有收获,点个在看,诚挚感谢
评论