18张图,直观理解神经网络、流形和拓扑

作者 | Christopher Olah 来源 | Datawhale 翻译 | 刘洋 校对 | 胡燕君(OneFlow)
大约十年前开始,深度神经网络在计算机视觉等领域取得了突破性成果,引起了极大的兴趣和关注。
然而,仍有一些人对此表示忧虑。原因之一是,神经网络是一个黑匣子:如果神经网络训练得很好,可以获得高质量的结果,但很难理解它的工作原理。如果神经网络出现故障,也很难找出问题所在。
虽然要整体理解深层神经网络很难,但可以从低维深层神经网络入手,也就是每层只有几个神经元的网络,它们理解起来要容易得多。我们可以通过可视化方法来理解低维深层神经网络的行为和训练。可视化方法能让我们更直观地了解神经网络的行为,并观察到神经网络和拓扑学之间的联系。
接下来我会谈及许多有趣的事情,包括能够对特定数据集进行分类的神经网络的复杂性下限。





用“权重”矩阵 W 作线性变换
用向量 b 作平移
用 tanh 逐点表示











时,其中一个隐藏单元被激活;当
时,另一个隐藏单元被激活。当前一个隐藏单元被激活而后一个隐藏单元未被激活时,就可以判断出这是属于A的数据点。


是X的同胚。
是特征函数,
将A映射到B。也就是说,
不断从将A映射到自身过渡到将A映射到B。
,因此,
,
。通过函数
相乘。
从特征函数过渡到b平移。
的逐点应用。



推荐阅读
评论
