问个机器学习问题，卷积神经网络的通道数是怎么定的？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 1679 天前的主题，其中的信息可能已经有所发展或是发生改变。

比如 LeNet 网络，它的通道数是为何这样设计的，有什么依据？
比如：
1. 第一层卷积层的通道为何是 6，按道理图片也就 RGB 三个通道。
2. 第二层卷积层的通道又是 16，这个依据是什么？
3. 在用 mxnet 实现时，卷积核的具体数字定义在何处，比如图像边缘检测，它的卷积核是:
[-1, 0, 1]
[-2, 0, 2]
[-1, 0, 1]
有很多核，有些核用来做边缘检测，有些核用来做高斯模糊。具体可参考： https://blog.csdn.net/chaipp0607/article/details/72236892
但在具体 mxnet 代码中，却未找到这些核的定义。

卷积层

卷积核

通道

mxnet

13 条回复 • 2020-08-05 15:48:09 +08:00

mscb

2020-08-05 11:19:19 +08:00 via Android

当然是炼丹练出来的呀！炼丹师这个俗称可不是开玩笑的，哈哈哈哈，手动🐶

maxxfire

2020-08-05 11:30:14 +08:00

@mscb 啊哈哈，还真有点形象，不过其网络结构一开始就定好了，这就是厉害之处了

jingous

2020-08-05 11:36:42 +08:00

随便定的。默认的分辨率降低一倍，通道数增加一倍。除开始几层外，通道一般都是 2 的 N 次方

jmc891205

2020-08-05 11:54:11 +08:00 via iPhone

这属于 hyperparameter
也要调的

jimliang

2020-08-05 11:58:19 +08:00

不断调参后的相对最优解

labnotok

2020-08-05 12:31:33 +08:00

深度学习的意义就是把特征的提取从手工的构建中解放出来，filter 是由数据和网络的训练决定的，自然不会出现功能确定的 filter 。而且你也很难在某个 filter train 完之后明确说它的作用是什么。filter 与其说是 convolution，直接理解成使用 cross-correlation 层次化提取特征会清晰很多。

运算上讲，channel 数是由上一层 filter 的个数决定的，而不是数据的维度。而你选择多少 filter 是个玄学的问题，稍微有点依据的说法是考虑你 GPU 的 CUDA 数和显存数据宽度，提高运算效率。