每日作业

1、使用卷积神经网络进行手势识别

  • SIGNS数据集介绍

识别图中的手势,以促进从语言障碍者到不懂手语的人的通信。

  • 训练集:1080个图像(64乘64像素)的符号表示从0到5的数字(每个数字180个图像)。
  • 测试集:120张图片(64乘64像素)的符号,表示从0到5的数字(每个数字20张图片)。

  • 使用卷积网络进行识别
    • 设定好固定的网路结构:
    • layer1:
      • conv1:padding 'SAME',8个filters:3 x 3 x 3,strides:1
      • RELU
      • pool1:1:window 2 x 2, sride 2, padding 'SAME'
    • layer2:
      • conv2:16个filters:3 x 3 x 8,strides:1,padding 'SAME'
      • RELU
      • pool1:1:window 2 x 2, sride 2, padding 'SAME'
  • API
    • Z = tf.nn.conv2d(X, W, strides=[1, 1, 1, 1], padding='SAME')
    • A = tf.nn.relu(Z)
    • P = tf.nn.max_pool(A, ksize=[1, 2, 2, 1], strides=[1, 2, 2, 1], padding='SAME')