昨天我面试了一个人
点击上方蓝色字体,选择“设为星标”
回复”面试“获取更多惊喜
基础部分
一个Java对象的内存分配流程是怎么样的?
集群线上JVM的主要参数有哪些?垃圾回收器用的CMS还是G1,为什么选择G1?
业务上多线程如何创建线程池,一些核心的参数设定。Spark是多进程模型还是多线程模型?MapReduce呢?大概讲一下一个Spark任务提交会产生哪些进程和线程?
数据组件部分
产生数据倾斜的根本原因是什么?你是怎么发现产生数据倾斜的以及解决的办法。
Spark如何管理内存的?Spark用到的内存有哪些?以及什么情况下会用到堆外内存?
你了解的任何一个实时计算框架的任务调度是如何做的?
其他
设计一个系统,能承担每天百万级别的任务调度。
Spark的back-pressure限流器怎么实现的?你能自己实现一个限流器吗?说说思路。
Flink CDC我吃定了耶稣也留不住他!| Flink CDC线上问题小盘点
4万字长文 | ClickHouse基础&实践&调优全视角解析
你好,我是王知无,一个大数据领域的硬核原创作者。
做过后端架构、数据中间件、数据平台&架构、算法工程化。
专注大数据领域实时动态&技术提升&个人成长&职场进阶,欢迎关注。
评论