分类
两个或者三个这些卷积加上子采样层对之后,我们得到了大量的小特征图。每一张图都代表了最初图像中非常复杂的图案可能出现的位置:一个字符串或者一个行人形状的物体。但是,我们需要的不止是一张图——我们需要的是提取出所代表的含义。这一个手写的文字是代表美国第一任总统,George Washington? 是否有行人在前面路上徘徊? 我们需要得到是或者不是的答案。
这不是识别,而是分类。为进行分类,CNN在卷积层之后采用了全连接神经网络层。在第一个神经元层,每一个神经元处理来自最终卷积/子采样层的每一特征图的每一像素值,每一数值与预定的权重相乘,对求和去线性化。实际上,每一神经元的输出现在代表了对整个最初图像的判断。是不是有人写下了文字G. Washington? 路边上的物体会是一个行人吗?
当我们要求图像越来越多的抽象结论时,我们就增加了更多的神经元层。每一层都是全连接的,而某些CNN体系结构在最后一层转换为高斯连接方式。目前为止,层中的神经元相对较少,但是可能会代表非常复杂的判断:这是Washington总统在其第一任期内写下的文字吗? 在我到达交叉路口之前,前面是不是有个要倒下的醉汉?
如果您一直跟踪下去,会发现CNN的每一新帧都会触发雪崩式的计算,大部分计算都需要浮点格式。在输入层,图像中的每一个4*4单元都需要一个小规模的有限冲击响应(FIR)滤波器:16次乘法,一些加法,以及tanh(x)赋值。在输入层,每一特征图都得完成这些。对于新层中的每一特征图,在后续层中,来自前一层的每一个特征图的每一个单元(包括所有叠加的),被送入到卷积引擎中。子采样功能可以使其不会成为一项巨大的工作,但是规模仍然很大。但是在这一级,与评估全连接层的工作相比,这仍然微不足道。
分类
两个或者三个这些卷积加上子采样层对之后,我们得到了大量的小特征图。每一张图都代表了最初图像中非常复杂的图案可能出现的位置:一个字符串或者一个行人形状的物体。但是,我们需要的不止是一张图——我们需要的是提取出所代表的含义。这一个手写的文字是代表美国第一任总统,George Washington? 是否有行人在前面路上徘徊? 我们需要得到是或者不是的答案。
这不是识别,而是分类。为进行分类,CNN在卷积层之后采用了全连接神经网络层。在第一个神经元层,每一个神经元处理来自最终卷积/子采样层的每一特征图的每一像素值,每一数值与预定的权重相乘,对求和去线性化。实际上,每一神经元的输出现在代表了对整个最初图像的判断。是不是有人写下了文字G. Washington? 路边上的物体会是一个行人吗?
当我们要求图像越来越多的抽象结论时,我们就增加了更多的神经元层。每一层都是全连接的,而某些CNN体系结构在最后一层转换为高斯连接方式。目前为止,层中的神经元相对较少,但是可能会代表非常复杂的判断:这是Washington总统在其第一任期内写下的文字吗? 在我到达交叉路口之前,前面是不是有个要倒下的醉汉?
如果您一直跟踪下去,会发现CNN的每一新帧都会触发雪崩式的计算,大部分计算都需要浮点格式。在输入层,图像中的每一个4*4单元都需要一个小规模的有限冲击响应(FIR)滤波器:16次乘法,一些加法,以及tanh(x)赋值。在输入层,每一特征图都得完成这些。对于新层中的每一特征图,在后续层中,来自前一层的每一个特征图的每一个单元(包括所有叠加的),被送入到卷积引擎中。子采样功能可以使其不会成为一项巨大的工作,但是规模仍然很大。但是在这一级,与评估全连接层的工作相比,这仍然微不足道。
举报