985统计学硕士的腾讯飞书抖音 Tiktok 数据分析面经(均已拿offer)-轻识

点击上方 "大数据肌肉猿"关注, 星标一起成长

后台回复【加群】，进入高质量学习交流群

2021年大数据肌肉猿公众号奖励制度

分享学习群里一个同学的数据分析求职经历，他从研一开始学习并提前去腾讯和字节的两个部门(飞书、抖音)实习，最后转正去面试了Tiktok，一下子通过了字节3个产品的面试，可谓是真牛逼！

985统计学硕士，腾讯日常实习（3个月）、字节日常实习（5个月）、暑期实习（3个月），最终21年8月底拿到字节数据分析秋招offer。

由于对数据分析和腾讯有很高的期望，准备入职前，随时投了腾讯的数据分析。因为腾讯需要一些取数机器人，我又做过数仓项目，熟悉hive理论，幸运拿到腾讯数据分析实习。

自我介绍
介绍一下项目，主要负责的工作，完成情况
数据倾斜怎么处理
你对以后的发展方向是怎么想的
你对信息流产品是怎么理解的
你对信息的上下流的数据是怎么过滤的呢
用什么指标去衡量推荐的效果是否有效
若非针对单一用户，是针对推荐的整体类，有什么指标呢
有一个指标是完播率（他是根据我的项目中转化率指标来出的题目），90%的人看了，您觉得它的衡量效果是怎样的
先验估计要答出用户画像，过去的行为数据，本身的用户数据
面试轮数=1
问题

在腾讯实习3个月，无法接受leader的PUA和沦为取数机器人，离职准备下一份数据分析实习。

因为之前做这个数据分析实习，也对这个岗感兴趣，因此离职后20年10月中旬开始往数据分析方向找实习，找了两周。拿了滴滴的offer，但在北京没法去，拒掉了。

讲一讲数据分析框架/理论
讲一讲在实习过程中的AB实验，
对实验组的前后的后验表现进行假设检验
如何保证对照组和实验组平均分开，保证分桶均匀，不影响实验结果
实习时长有多长
实习过程中有什么收获
讲一讲作者生命周期怎么是的流失下降，活跃提升
你觉得算法和业务分析的差异，优劣，为什么选择业务分析
如何定义优质作者，涉及什么指标
你是怎么认为数据分析的，你认为数据分析的前景怎样
取消率下降了，你觉得是什么原因？（从产品的角度去分析）
异动归因：实习过程中如何做？
SQL怎样：现在有调查问卷，找出那些评分一样的用户
ABtest ：
统计：假设检验：了解哪些显著性检验，
算法：psm算法，机器学习算法（如何选择不同的城市做ABtest）
询问方差
放两个对照，两个实验，对照和实验组组内差异较小，那么分桶均匀
实验组放量，增长率可能会缩小
实验组指标表现好就一定是这个策略好吗
怎么保证AB测试的两份数据是相似的，不会影响结果
假如AB放在两个不同的城市，怎么选

本来拿了一个初创公司一面数据的offer，准备入职前，面试字节并offer，最后去了字节飞书实习。

讲一下如何衡量作者的各个时期
讲一下如何衡量内容的质量
讲解一下人货场数据分析模型如何提升内容消费量
内容冷启动折损率的计算口径
讲一个数据埋点，然后相关的数据分析例子
讲一个python相关的数据分析例子
如何设计埋点，指标考察用户是否使用文档产品
讲一下你对飞书的理解
各业务部门对指标计算口径不一致，如何解决
你认为飞书云文档需要什么样的北极星指标
异常数据波动，怎么分析
一道SQL题
对这个岗位的期望
维度建模是否了解
AB实验的过程
反问：
异动归因
维度建模
专题分析
实习生主要工作：
盈利模式：产品初始阶段，免费使用，增长期。以提升用户留存率为主
内容创作组内主要目标：优化协同工作，提升用户留存率

因为21年3月份有暑期实习招聘，方便转正，因此从21年3月初开始找暑期实习，3月底拿到了抖音的数据分析暑期实习，阿里和腾讯都挂了。因此在字节实习5个月（20年11月-21年3月）后离职回到学校做中期报告。

介绍一下你做的项目
为什么没法做AB，libra平台可以拿到服务端的数据？
AB问题
算法题：n个空盘子：有两种操作 1.给一个盘子一个硬币，2.给所有盘子硬币加倍。给出每个盘子的目标硬币数。问：最少多少个操作可以让n个盘子的硬币数是目标数
sql题：
AB实验有什么需要重点主要的地方
多个实验开启，如何避免其他实验的影响？
滴滴打车分配订单，做AB实验，会有什么问题？（提示：结合业务场景回答）
如何实施策略解决上述问题？
即使这样分类，也会影响随机性，产生辛普森悖论的问题，如何解决？

简单做个自我介绍
说一下做了什么事情
有去探究转化率偏低的原因吗？推测的结论有数据支撑吗？
在腾讯做了什么？
异动归因的过程是怎样的？
ab实验：
sql题：分组排序（row_number()、dense_rank()）
算法：讲一讲了解的算法
概率题：一段绳子随机折叠、能形成三角形的概率是多少
ab实验的统计学逻辑是怎样的？
假设检验中的p值是什么含义？
怎么知道ab实验是有效果的呢？
如何分层抽样？

自我介绍
讲一讲在飞书的项目
讲一讲内容画像
讲一讲腾讯的实习经历
如何ab实验，什么样的推荐策略导致折损率下降
如何区分用户生命周期
如果只用阈值区分的话，用户会在两个周期来回变换吗
ab实验
一道简单的算法题（用python写）：递推公式——斐波那契数列
有了解过机器学习的算法吗？
如何定义K的数量
分类算法和聚类算法有什么区别
a组付费率低于b组付费率；a组的男/女付费高于b组男/女付费，为什么？
同一时间做多组实验，如何排除两组实验策略的影响
ab实验，实验组是直播pk体验，但pk体验组可能会连线对战组，导致连线用户数指标失效，如何解决
如果是分类型的放进ab组中，那么实验结束后，如何评价策略的效益？
K-means聚类
自我介绍
项目介绍
讲一下流失预警的计算标签
讲解一下数据分析框架
讲一下搭建数据指标体系
讲一下数据波动如何归因
讲一下了解的算法
讲一下平均值、中位数、众数的使用场景
ab实验讲一下流程，怎么做的
写一下sql题：各消费分层下各用户的消费总金额
具体如何归因
选择的偏好字段是哪一个？
讲一下算法的原理
为什么选用平均值而不是中位数

为了能够顺利在抖音转正，而且能够有充足的时间准备秋招（9月），我需要9月前预留3个月的时间实习。因此我21年6月-21年9月实习3个月，保证工作天超过60，可以转正。

到8月中旬开始转正，由于我是广州人，想回广州工作，因此跨部门重新面试3轮，在8月底拿到base广州的tiktok数据分析师秋招offer。

项目
如何评估策略效果
功效是多少
如何做流量分配
异常值和缺失值如何处理
AUC指标如何计算
如何通过召回率和准确率去评估模型、策略的效果？
开放题：
如何制定流失定义
这个项目流程有没有可以改进的点
ab实验
有多个性能点，如何对优先级进行排序
如何计算ROI
会不会有用户间本身的差异导致ROI计算不准确
提示：通过ab实验的思路考虑如何估算ROI
视频的播放渗透率低，可能是推荐效果差或者是作者发表的内容差，如何分析，归因，上策略
为什么说冷启动成功率可以衡量推荐效果
如何制定流失定义
如何处理样本数据，保证模型好的预测效果
如何根据预测模型中特征的重要性，对重要特征进行干预
如何评价策略的效果，举具体例子讲一下
为什么要营收分层
如果效果不显著，不符合预期，你会怎么改进
面试轮数=3

--end--

扫描下方二维码

添加好友，备注【交流】

可私聊交流，也可进资源丰富学习群

更文不易，点个“在看”支持一下👇

985统计学硕士的腾讯 飞书 抖音 Tiktok 数据分析面经(均已拿offer)

985统计学硕士的腾讯飞书抖音 Tiktok 数据分析面经(均已拿offer)