深度学习面试题29：GoogLeNet(Inception V3)

      end_point = 'Mixed_6d'

      with tf.variable_scope(end_point):

        with tf.variable_scope('Branch_0'):

          branch_0 = slim.conv2d(net, depth(192), [1, 1], scope='Conv2d_0a_1x1')

        with tf.variable_scope('Branch_1'):

          branch_1 = slim.conv2d(net, depth(160), [1, 1], scope='Conv2d_0a_1x1')

          branch_1 = slim.conv2d(branch_1, depth(160), [1, 7],

                                 scope='Conv2d_0b_1x7')

          branch_1 = slim.conv2d(branch_1, depth(192), [7, 1],

                                 scope='Conv2d_0c_7x1')

        with tf.variable_scope('Branch_2'):

          branch_2 = slim.conv2d(net, depth(160), [1, 1], scope='Conv2d_0a_1x1')

          branch_2 = slim.conv2d(branch_2, depth(160), [7, 1],

                                 scope='Conv2d_0b_7x1')

          branch_2 = slim.conv2d(branch_2, depth(160), [1, 7],

                                 scope='Conv2d_0c_1x7')

          branch_2 = slim.conv2d(branch_2, depth(160), [7, 1],

                                 scope='Conv2d_0d_7x1')

          branch_2 = slim.conv2d(branch_2, depth(192), [1, 7],

                                 scope='Conv2d_0e_1x7')

        with tf.variable_scope('Branch_3'):

          branch_3 = slim.avg_pool2d(net, [3, 3], scope='AvgPool_0a_3x3')

          branch_3 = slim.conv2d(branch_3, depth(192), [1, 1],

                                 scope='Conv2d_0b_1x1')

        net = tf.concat(axis=3, values=[branch_0, branch_1, branch_2, branch_3])

      end_points[end_point] = net

返回目录

重新设计pooling层

有两种减少网络参数的方式：

左边的做法是直接池化，这会降低网络的表现，因为他对特征图进行了压缩，可能这就是网络的瓶颈；

右边的做法是先增加通道数，再池化，这会增加很多计算量。

所以InceptionV3中使用了如下池化方式：

左图和右图是相同的，只不过右图是精简表示的版本

他的做法是一遍卷积，一遍池化，然后将最终结果合并。

这样做既可以减少参数，又可以避免出现表示瓶颈。

返回目录

辅助构造器

去掉了第一个辅助构造器。

返回目录

使用标签平滑

在《深度学习面试题27：非对称卷积(Asymmetric Convolutions)》中已经讲过，它具有防止过拟合的效果。

返回目录

参考资料

Rethinking the Inception Architecture for Computer Vision

GoogLeNet的心路历程（四）

https://www.jianshu.com/p/0cc42b8e6d25

返回目录

深度学习面试题29：GoogLeNet(Inception V3)的相关教程结束。

《深度学习面试题29：GoogLeNet(Inception V3).doc》

下载本文的Word格式文档，以方便收藏与打印。

深度学习面试题29：GoogLeNet(Inception V3)

目录

使用非对称卷积分解大filters

重新设计pooling层

辅助构造器

使用标签平滑

参考资料

深度学习面试题29：GoogLeNet(Inception V3)的相关教程结束。

相关推荐

学习Linux，要把握哪些重点？

深度优先搜索（DFS）和广度优先搜索（BFS）

深度优先搜索（DFS）与广度优先搜索（BFS）的Java实现

深度优先搜索DFS和广度优先搜索BFS简单解析（新手向）

Leetcode之深度+广度优先搜索（DFS+BFS）专题-934. 最短的桥（Shortest Bridge）

深度优先搜索DFS和广度优先搜索BFS简单解析

shell学习总结

SwiftUI学习（一）