3月31日美团春招推荐算法岗面试题分享!-轻识

公众号福利

👉回复【100题】领取《名企AI面试100题》PDF

👉回复【干货资料】领取NLP、CV、ML等AI方向干货资料

👉回复【往期招聘】查看往期内推招聘

拉至文末，找小助手进群看公开课~

问题1：为什么分类问题损失不使用MSE而使用交叉熵

1、均方误差作为损失函数，这时所构造出来的损失函数是非凸的，不容易求解，容易得到其局部最优解；而交叉熵的损失函数是凸函数；

2、均方误差作为损失函数，求导后，梯度与sigmoid的导数有关，会导致训练慢；而交叉熵的损失函数求导后，梯度就是一个差值，误差大的话更新的就快，误差小的话就更新的慢点。

问题2：BN的作用，除了防止梯度消失这个作用外

（1）加快收敛速度：在深度神经网络中中，如果每层的数据分布都不一样的话，将会导致网络非常难收敛和训练，而如果把每层的数据都在转换在均值为零，方差为1 的状态下，这样每层数据的分布都是一样的训练会比较容易收敛。

（2）控制梯度爆炸防止梯度消失：以sigmoid函数为例，sigmoid函数使得输出在[0,1]之间，实际上当x道了一定的大小，经过sigmoid函数后输出范围就会变得很小。

（3）BN算法防止过拟合：在网络的训练中，BN的使用使得一个minibatch中所有样本都被关联在了一起，因此网络不会从某一个训练样本中生成确定的结果，即同样一个样本的输出不再仅仅取决于样本的本身，也取决于跟这个样本同属一个batch的其他样本，而每次网络都是随机取batch，这样就会使得整个网络不会朝这一个方向使劲学习。一定程度上避免了过拟合。

问题3：训练时出现不收敛的情况怎么办，为什么会出现不收敛

从数据角度：

是否对数据进行了预处理，包括分类标注是否正确，数据是否干净

是否对数据进行了归一化

考虑样本的信息量是否太大，而网络结构是否太简单

考虑标签是否设置正确

从模型角度：

尝试加深网络结构

Learning rate是否合适（太大，会造成不收敛，太小，会造成收敛速度非常慢）

错误初始化网络参数

train loss 不断下降，test loss不断下降，说明网络仍在学习;

train loss 不断下降，test loss趋于不变，说明网络过拟合;

train loss 趋于不变，test loss不断下降，说明数据集100%有问题;

train loss 趋于不变，test loss趋于不变，说明学习遇到瓶颈，需要减小学习率或批量数目;

train loss 不断上升，test loss不断上升，说明网络结构设计不当，训练超参数设置不当，数据集经过清洗等问题。

问题4：LR与决策树的区别

1、逻辑回归通常用于分类问题，决策树可回归、可分类。

2、逻辑回归是线性函数，决策树是非线性函数。

3、逻辑回归的表达式很简单，回归系数就确定了模型。决策树的形式就复杂了，叶子节点的范围+取值。两个模型在使用中都有很强的解释性，银行较喜欢。

4、逻辑回归可用于高维稀疏数据场景，比如ctr预估；决策树变量连续最好，类别变量的话，稀疏性不能太高。

5、逻辑回归的核心是sigmoid函数，具有无限可导的优点，常作为神经网络的激活函数。

6、在集成模型中，随机森林、GBDT以决策树为基模型，Boosting算法也可以用逻辑回归作为基模型。

问题5：有哪些决策树算法

ID3、C4.5、CART树的算法思想

ID3算法的核心是在决策树的每个节点上应用信息增益准则选择特征，递归地构架决策树。

C4.5算法的核心是在生成过程中用信息增益比来选择特征。

CART树算法的核心是在生成过程用基尼指数来选择特征。

基于决策树的算法有随机森林、GBDT、Xgboost等。

问题6：了解哪些行为序列建模方式

参考：https://zhuanlan.zhihu.com/p/138136777

问题7：Leetcode_91题：解码方法

思路：动态规划

class Solution:
def numDecodings(self, s: str) -> int:
n = len(s)
f = [1] + [0] * n
for i in range(1, n + 1):
if s[i - 1] != \'0\':
f[i] += f[i - 1]
if i > 1 and s[i - 2] != \'0\' and int(s[i-2:i]) <= 26:
f[i] += f[i - 2]

return f[n]

问题8：智力题：红蓝颜料比例问题

题目描述：两个桶分别装了一样多的红色和蓝色的颜料。先从蓝色桶里舀一杯倒入红色中，搅拌不均匀。再从有蓝色的红色桶中舀一杯倒入蓝色桶里，问两个桶中蓝：红与红：蓝的大小关系？

第二步舀的时候，因为不均匀，所以无法知道具体有多少比例的红色和蓝色，可以换一个角度来考虑。因为是用的相同大小的杯子，所以两次操作后，两边的桶里的总体颜色是一样多的。假设红色里面混了一部分蓝色的颜料体积为X升，那么就有X升的红色颜料到了蓝色的桶里，所以两边的比例是一样的。

9、智力题：两个人数数，谁先数到20算谁赢。

要求：每次只能数1或者2个数，采取什么策略可以保证必胜，先手和后手都可以选择。

要想获胜的规律就是要抢到19这个数

因为是两个人参与，所以关键数是19，当数到19时，对方就只能数20了，所以可以反推一下，要想获胜的话，在二十个数里，要想方设法地抢到19，16，13，10，7，4，1这几个公差为3的整数，也就是说在这个游戏里，要想获胜的话，就要抢到1这个数，即谁先数谁就获胜。

周四（4月14日）晚8点公开课直播！[风险预测：特征工程与树模型实战]

私我回复"414"进直播群