985统计学硕士的腾讯 飞书 抖音 Tiktok 数据分析面经(均已拿offer)

共 3021字,需浏览 7分钟

 ·

2021-10-26 02:58

点击上方 "大数据肌肉猿"关注, 星标一起成长

后台回复【加群】,进入高质量学习交流群

2021年大数据肌肉猿公众号奖励制度

分享学习群里一个同学的数据分析求职经历,他从研一开始学习并提前去腾讯和字节的两个部门(飞书、抖音)实习,最后转正去面试了Tiktok,一下子通过了字节3个产品的面试,可谓是真牛逼!


985统计学硕士,腾讯日常实习(3个月)、字节日常实习(5个月)、暑期实习(3个月),最终21年8月底拿到字节数据分析秋招offer。



由于对数据分析和腾讯有很高的期望,准备入职前,随时投了腾讯的数据分析。因为腾讯需要一些取数机器人,我又做过数仓项目,熟悉hive理论,幸运拿到腾讯数据分析实习。

  • 自我介绍
  • 介绍一下项目,主要负责的工作,完成情况
  • 数据倾斜怎么处理
  • 你对以后的发展方向是怎么想的
  • 你对信息流产品是怎么理解的
  • 你对信息的上下流的数据是怎么过滤的呢
  • 用什么指标去衡量推荐的效果是否有效
  • 若非针对单一用户,是针对推荐的整体类,有什么指标呢
  • 有一个指标是完播率(他是根据我的项目中转化率指标来出的题目),90%的人看了,您觉得它的衡量效果是怎样的
  • 先验估计要答出用户画像,过去的行为数据,本身的用户数据
  • 面试轮数=1
  • 问题


在腾讯实习3个月,无法接受leader的PUA和沦为取数机器人,离职准备下一份数据分析实习。

因为之前做这个数据分析实习,也对这个岗感兴趣,因此离职后20年10月中旬开始往数据分析方向找实习,找了两周。拿了滴滴的offer,但在北京没法去,拒掉了。

  • 讲一讲数据分析框架/理论
  • 讲一讲在实习过程中的AB实验,
  • 对实验组的前后的后验表现进行假设检验
  • 如何保证对照组和实验组平均分开,保证分桶均匀,不影响实验结果
  • 实习时长有多长
  • 实习过程中有什么收获
  • 讲一讲作者生命周期怎么是的流失下降,活跃提升
  • 你觉得算法和业务分析的差异,优劣,为什么选择业务分析
  • 如何定义优质作者,涉及什么指标
  • 你是怎么认为数据分析的,你认为数据分析的前景怎样
  • 取消率下降了,你觉得是什么原因?(从产品的角度去分析)
  • 异动归因:实习过程中如何做?
  • SQL怎样:现在有调查问卷,找出那些评分一样的用户
  • ABtest :
  • 统计:假设检验:了解哪些显著性检验,
  • 算法:psm算法,机器学习算法(如何选择不同的城市做ABtest)
  • 询问方差
  • 放两个对照,两个实验,对照和实验组组内差异较小,那么分桶均匀
  • 实验组放量,增长率可能会缩小
  • 实验组指标表现好就一定是这个策略好吗
  • 怎么保证AB测试的两份数据是相似的,不会影响结果
  • 假如AB放在两个不同的城市,怎么选


本来拿了一个初创公司一面数据的offer,准备入职前,面试字节并offer,最后去了字节飞书实习。

  • 讲一下如何衡量作者的各个时期
  • 讲一下如何衡量内容的质量
  • 讲解一下人货场数据分析模型如何提升内容消费量
  • 内容冷启动折损率的计算口径
  • 讲一个数据埋点,然后相关的数据分析例子
  • 讲一个python相关的数据分析例子
  • 如何设计埋点,指标考察用户是否使用文档产品
  • 讲一下你对飞书的理解
  • 各业务部门对指标计算口径不一致,如何解决
  • 你认为飞书云文档需要什么样的北极星指标
  • 异常数据波动,怎么分析
  • 一道SQL题
  • 对这个岗位的期望
  • 维度建模是否了解
  • AB实验的过程
  • 反问:
  • 异动归因
  • 维度建模
  • 专题分析
  • 实习生主要工作:
  • 盈利模式:产品初始阶段,免费使用,增长期。以提升用户留存率为主
  • 内容创作组内主要目标:优化协同工作,提升用户留存率


因为21年3月份有暑期实习招聘,方便转正,因此从21年3月初开始找暑期实习,3月底拿到了抖音的数据分析暑期实习,阿里和腾讯都挂了。因此在字节实习5个月(20年11月-21年3月)后离职回到学校做中期报告。

  • 介绍一下你做的项目
  • 为什么没法做AB,libra平台可以拿到服务端的数据?
  • AB问题
  • 算法题:n个空盘子:有两种操作 1.给一个盘子一个硬币,2.给所有盘子硬币加倍。给出每个盘子的目标硬币数。问:最少多少个操作可以让n个盘子的硬币数是目标数
  • sql题:
  • AB实验有什么需要重点主要的地方
  • 多个实验开启,如何避免其他实验的影响?
  • 滴滴打车分配订单,做AB实验,会有什么问题?(提示:结合业务场景回答)
  • 如何实施策略解决上述问题?
  • 即使这样分类,也会影响随机性,产生辛普森悖论的问题,如何解决?

  • 简单做个自我介绍
  • 说一下做了什么事情
  • 有去探究转化率偏低的原因吗?推测的结论有数据支撑吗?
  • 在腾讯做了什么?
  • 异动归因的过程是怎样的?
  • ab实验:
  • sql题:分组排序(row_number()、dense_rank())
  • 算法:讲一讲了解的算法
  • 概率题:一段绳子随机折叠、能形成三角形的概率是多少
  • ab实验的统计学逻辑是怎样的?
  • 假设检验中的p值是什么含义?
  • 怎么知道ab实验是有效果的呢?
  • 如何分层抽样?

  • 自我介绍
  • 讲一讲在飞书的项目
  • 讲一讲内容画像
  • 讲一讲腾讯的实习经历
  • 如何ab实验,什么样的推荐策略导致折损率下降
  • 如何区分用户生命周期
  • 如果只用阈值区分的话,用户会在两个周期来回变换吗
  • ab实验
  • 一道简单的算法题(用python写):递推公式——斐波那契数列
  • 有了解过机器学习的算法吗?
  • 如何定义K的数量
  • 分类算法和聚类算法有什么区别
  • a组付费率低于b组付费率;a组的男/女付费高于b组男/女付费,为什么?
  • 同一时间做多组实验,如何排除两组实验策略的影响
  • ab实验,实验组是直播pk体验,但pk体验组可能会连线对战组,导致连线用户数指标失效,如何解决
  • 如果是分类型的放进ab组中,那么实验结束后,如何评价策略的效益?
  • K-means聚类
  • 自我介绍
  • 项目介绍
  • 讲一下流失预警的计算标签
  • 讲解一下数据分析框架
  • 讲一下搭建数据指标体系
  • 讲一下数据波动如何归因
  • 讲一下了解的算法
  • 讲一下平均值、中位数、众数的使用场景
  • ab实验讲一下流程,怎么做的
  • 写一下sql题:各消费分层下各用户的消费总金额
  • 具体如何归因
  • 选择的偏好字段是哪一个?
  • 讲一下算法的原理
  • 为什么选用平均值而不是中位数



为了能够顺利在抖音转正,而且能够有充足的时间准备秋招(9月),我需要9月前预留3个月的时间实习。因此我21年6月-21年9月实习3个月,保证工作天超过60,可以转正。

到8月中旬开始转正,由于我是广州人,想回广州工作,因此跨部门重新面试3轮,在8月底拿到base广州的tiktok数据分析师秋招offer。

  • 项目
  • 如何评估策略效果
  • 功效是多少
  • 如何做流量分配
  • 异常值和缺失值如何处理
  • AUC指标如何计算
  • 如何通过召回率和准确率去评估模型、策略的效果?
  • 开放题:
  • 如何制定流失定义
  • 这个项目流程有没有可以改进的点
  • ab实验
  • 有多个性能点,如何对优先级进行排序
  • 如何计算ROI
  • 会不会有用户间本身的差异导致ROI计算不准确
  • 提示:通过ab实验的思路考虑如何估算ROI
  • 视频的播放渗透率低,可能是推荐效果差或者是作者发表的内容差,如何分析,归因,上策略
  • 为什么说冷启动成功率可以衡量推荐效果
  • 如何制定流失定义
  • 如何处理样本数据,保证模型好的预测效果
  • 如何根据预测模型中特征的重要性,对重要特征进行干预
  • 如何评价策略的效果,举具体例子讲一下
  • 为什么要营收分层
  • 如果效果不显著,不符合预期,你会怎么改进
  • 面试轮数=3

--end--

扫描下方二维码
添加好友,备注【交流
可私聊交流,也可进资源丰富学习群


更文不易,点个“在看”支持一下👇

浏览 40
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报