zeakey/debug_fsds.ipynb

## debug_fsds.ipynb
{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [],
   "source": [
    "from __future__ import division\n",
    "import numpy as np\n",
    "import os, sys\n",
    "from os.path import join\n",
    "sys.path.insert(0, 'caffe/python/')\n",
    "sys.path.insert(0, 'lib')\n",
    "import caffe\n",
    "import matplotlib.pyplot as plt\n",
    "from matplotlib import cm\n",
    "%matplotlib inline\n",
    "caffe.set_mode_gpu()\n",
    "caffe.set_device(1)\n",
    "solver = caffe.SGDSolver('model/fsds_solver.pt')\n",
    "solver.net.copy_from('model/vgg16convs.caffemodel')\n",
    "\n",
    "def upsample_filt(size):\n",
    "    factor = (size + 1) // 2\n",
    "    if size % 2 == 1:\n",
    "        center = factor - 1\n",
    "    else:\n",
    "        center = factor - 0.5\n",
    "    og = np.ogrid[:size, :size]\n",
    "    return (1 - abs(og[0] - center) / factor) * \\\n",
    "           (1 - abs(og[1] - center) / factor)\n",
    "\n",
    "# set parameters s.t. deconvolutional layers compute bilinear interpolation\n",
    "# N.B. this is for deconvolution without groups\n",
    "def interp_surgery(net, layers):\n",
    "    for l in layers:\n",
    "        m, k, h, w = net.params[l][0].data.shape\n",
    "        if m != k:\n",
    "            print 'layer %s input(%d) + output(%d) channels need to be the same'%(l, m,k)\n",
    "            raise \n",
    "        if h != w:\n",
    "            print 'filters need to be square'\n",
    "            raise\n",
    "        filt = upsample_filt(h)\n",
    "        net.params[l][0].data[range(m), range(k), :, :] = filt\n",
    "interp_layers = [k for k in solver.net.params.keys() if 'up' in k]\n",
    "interp_surgery(solver.net, interp_layers)"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## Initial parameters"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "conv1_1 weight mean= -0.00243791 std= 0.206699\n",
      "conv1_1 bias mean= 0.501391 std= 0.32848\n",
      "conv1_2 weight mean= 0.00491225 std= 0.042478\n",
      "conv1_2 bias mean= 0.0585559 std= 0.334784\n",
      "conv2_1 weight mean= 0.000198592 std= 0.0322231\n",
      "conv2_1 bias mean= 0.110862 std= 0.122017\n",
      "conv2_2 weight mean= -0.000280771 std= 0.0235406\n",
      "conv2_2 bias mean= 0.0157631 std= 0.18893\n",
      "conv3_1 weight mean= -0.000125897 std= 0.0173762\n",
      "conv3_1 bias mean= 0.0171437 std= 0.070719\n",
      "conv3_2 weight mean= -0.00023865 std= 0.0123452\n",
      "conv3_2 bias mean= 0.0357958 std= 0.076249\n",
      "conv3_3 weight mean= -0.000670671 std= 0.0126685\n",
      "conv3_3 bias mean= 0.0261699 std= 0.0832692\n",
      "conv4_1 weight mean= -0.000449347 std= 0.0100516\n",
      "conv4_1 bias mean= 0.0204377 std= 0.0537191\n",
      "conv4_2 weight mean= -0.000467314 std= 0.00762439\n",
      "conv4_2 bias mean= 0.0298601 std= 0.0440915\n",
      "conv4_3 weight mean= -0.000809169 std= 0.00795575\n",
      "conv4_3 bias mean= 0.0319183 std= 0.0680846\n",
      "conv5_1 weight mean= -0.000584893 std= 0.00869384\n",
      "conv5_1 bias mean= 0.0457245 std= 0.131329\n",
      "conv5_2 weight mean= -0.000740742 std= 0.00876056\n",
      "conv5_2 bias mean= 0.0498643 std= 0.212884\n",
      "conv5_3 weight mean= -0.00108189 std= 0.00847841\n",
      "conv5_3 bias mean= 0.149864 std= 0.492821\n",
      "score_dsn2 weight mean= 0.0 std= 0.0\n",
      "score_dsn2 bias mean= 0.0 std= 0.0\n",
      "upsample_2 weight mean= 0.125 std= 0.182217\n",
      "upsample_2 bias mean= 0.0 std= 0.0\n",
      "score_dsn3 weight mean= 0.0 std= 0.0\n",
      "score_dsn3 bias mean= 0.0 std= 0.0\n",
      "upsample_4 weight mean= 0.0833333 std= 0.17013\n",
      "upsample_4 bias mean= 0.0 std= 0.0\n",
      "score_dsn4 weight mean= 0.0 std= 0.0\n",
      "score_dsn4 bias mean= 0.0 std= 0.0\n",
      "upsample_8 weight mean= 0.0625 std= 0.153802\n",
      "upsample_8 bias mean= 0.0 std= 0.0\n",
      "score_dsn5 weight mean= 0.0 std= 0.0\n",
      "score_dsn5 bias mean= 0.0 std= 0.0\n",
      "upsample_16 weight mean= 0.05 std= 0.140281\n",
      "upsample_16 bias mean= 0.0 std= 0.0\n",
      "cat0_score weight mean= 0.25 std= 0.0\n",
      "cat0_score bias mean= 0.0 std= 0.0\n",
      "cat1_score weight mean= 0.25 std= 0.0\n",
      "cat1_score bias mean= 0.0 std= 0.0\n",
      "cat2_score weight mean= 0.333 std= 0.0\n",
      "cat2_score bias mean= 0.0 std= 0.0\n",
      "cat3_score weight mean= 0.5 std= 0.0\n",
      "cat3_score bias mean= 0.0 std= 0.0\n",
      "cat4_score weight mean= 1.0 std= 0.0\n",
      "cat4_score bias mean= 0.0 std= 0.0\n"
     ]
    }
   ],
   "source": [
    "for p in solver.net.params:\n",
    "    print p, 'weight mean=', solver.net.params[p][0].data.mean(), 'std=', solver.net.params[p][0].data.std()\n",
    "    if len(solver.net.params) > 1:\n",
    "        print p, 'bias mean=', solver.net.params[p][1].data.mean(), 'std=', solver.net.params[p][1].data.std()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 1st step"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [],
   "source": [
    "solver.step(1)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "----------------------output-------------------------------\n",
      "data data mean= -17.7456 std= 55.3427\n",
      "label data mean= 0.0332219 std= 0.318866\n",
      "data_data_0_split_0 data mean= -17.7456 std= 55.3427\n",
      "data_data_0_split_1 data mean= -17.7456 std= 55.3427\n",
      "data_data_0_split_2 data mean= -17.7456 std= 55.3427\n",
      "data_data_0_split_3 data mean= -17.7456 std= 55.3427\n",
      "data_data_0_split_4 data mean= -17.7456 std= 55.3427\n",
      "label_data_1_split_0 data mean= 0.0332219 std= 0.318866\n",
      "label_data_1_split_1 data mean= 0.0332219 std= 0.318866\n",
      "label_data_1_split_2 data mean= 0.0332219 std= 0.318866\n",
      "label_data_1_split_3 data mean= 0.0332219 std= 0.318866\n",
      "label_data_1_split_4 data mean= 0.0332219 std= 0.318866\n",
      "conv1_1 data mean= 8.60036 std= 25.6672\n",
      "conv1_2 data mean= 45.5761 std= 104.337\n",
      "pool1 data mean= 60.9306 std= 124.432\n",
      "conv2_1 data mean= 78.943 std= 160.413\n",
      "conv2_2 data mean= 88.2864 std= 245.731\n",
      "conv2_2_relu2_2_0_split_0 data mean= 88.2864 std= 245.731\n",
      "conv2_2_relu2_2_0_split_1 data mean= 88.2864 std= 245.731\n",
      "pool2 data mean= 150.029 std= 329.905\n",
      "conv3_1 data mean= 116.975 std= 284.611\n",
      "conv3_2 data mean= 134.873 std= 289.403\n",
      "conv3_3 data mean= 85.3694 std= 266.654\n",
      "conv3_3_relu3_3_0_split_0 data mean= 85.3694 std= 266.654\n",
      "conv3_3_relu3_3_0_split_1 data mean= 85.3694 std= 266.654\n",
      "pool3 data mean= 152.712 std= 367.724\n",
      "conv4_1 data mean= 86.7088 std= 211.117\n",
      "conv4_2 data mean= 53.3881 std= 131.849\n",
      "conv4_3 data mean= 12.1959 std= 55.0997\n",
      "conv4_3_relu4_3_0_split_0 data mean= 12.1959 std= 55.0997\n",
      "conv4_3_relu4_3_0_split_1 data mean= 12.1959 std= 55.0997\n",
      "pool4 data mean= 23.5417 std= 79.1284\n",
      "conv5_1 data mean= 13.1846 std= 37.4016\n",
      "conv5_2 data mean= 5.2716 std= 16.2988\n",
      "conv5_3 data mean= 0.864066 std= 4.67812\n",
      "score_dsn2 data mean= 0.0 std= 0.0\n",
      "upscore_dsn2 data mean= 0.0 std= 0.0\n",
      "crop_dsn2 data mean= 0.0 std= 0.0\n",
      "crop_dsn2_crop_dsn2_0_split_0 data mean= 0.0 std= 0.0\n",
      "crop_dsn2_crop_dsn2_0_split_1 data mean= 0.0 std= 0.0\n",
      "dsn2_loss data mean= 358.337 std= 0.0\n",
      "score_dsn3 data mean= 0.0 std= 0.0\n",
      "upscore_dsn3 data mean= 0.0 std= 0.0\n",
      "crop_dsn3 data mean= 0.0 std= 0.0\n",
      "crop_dsn3_crop_dsn3_0_split_0 data mean= 0.0 std= 0.0\n",
      "crop_dsn3_crop_dsn3_0_split_1 data mean= 0.0 std= 0.0\n",
      "dsn3_loss data mean= 719.402 std= 0.0\n",
      "score_dsn4 data mean= 0.0 std= 0.0\n",
      "upscore_dsn4 data mean= 0.0 std= 0.0\n",
      "crop_dsn4 data mean= 0.0 std= 0.0\n",
      "crop_dsn4_crop_dsn4_0_split_0 data mean= 0.0 std= 0.0\n",
      "crop_dsn4_crop_dsn4_0_split_1 data mean= 0.0 std= 0.0\n",
      "dsn4_loss data mean= 1139.84 std= 0.0\n",
      "score_dsn5 data mean= 0.0 std= 0.0\n",
      "upscore_dsn5 data mean= 0.0 std= 0.0\n",
      "crop_dsn5 data mean= 0.0 std= 0.0\n",
      "crop_dsn5_crop_dsn5_0_split_0 data mean= 0.0 std= 0.0\n",
      "crop_dsn5_crop_dsn5_0_split_1 data mean= 0.0 std= 0.0\n",
      "dsn5_loss data mean= 1948.57 std= 0.0\n",
      "slice2_0 data mean= 0.0 std= 0.0\n",
      "slice2_1 data mean= 0.0 std= 0.0\n",
      "slice3_0 data mean= 0.0 std= 0.0\n",
      "slice3_1 data mean= 0.0 std= 0.0\n",
      "slice3_2 data mean= 0.0 std= 0.0\n",
      "slice4_0 data mean= 0.0 std= 0.0\n",
      "slice4_1 data mean= 0.0 std= 0.0\n",
      "slice4_2 data mean= 0.0 std= 0.0\n",
      "slice4_3 data mean= 0.0 std= 0.0\n",
      "slice5_0 data mean= 0.0 std= 0.0\n",
      "slice5_1 data mean= 0.0 std= 0.0\n",
      "slice5_2 data mean= 0.0 std= 0.0\n",
      "slice5_3 data mean= 0.0 std= 0.0\n",
      "slice5_4 data mean= 0.0 std= 0.0\n",
      "concat0 data mean= 0.0 std= 0.0\n",
      "concat1 data mean= 0.0 std= 0.0\n",
      "concat2 data mean= 0.0 std= 0.0\n",
      "concat3 data mean= 0.0 std= 0.0\n",
      "concat0_score data mean= 0.0 std= 0.0\n",
      "concat1_score data mean= 0.0 std= 0.0\n",
      "concat2_score data mean= 0.0 std= 0.0\n",
      "concat3_score data mean= 0.0 std= 0.0\n",
      "concat4_score data mean= 0.0 std= 0.0\n",
      "concat_fuse data mean= 0.0 std= 0.0\n",
      "fuse_loss data mean= 1948.57 std= 0.0\n",
      "----------------------gradient-------------------------------\n",
      "data diff mean= 0.0 std= 0.0\n",
      "label diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_0 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_1 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_2 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_3 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_4 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_0 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_1 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_2 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_3 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_4 diff mean= 0.0 std= 0.0\n",
      "conv1_1 diff mean= 0.0 std= 0.0\n",
      "conv1_2 diff mean= 0.0 std= 0.0\n",
      "pool1 diff mean= 0.0 std= 0.0\n",
      "conv2_1 diff mean= 0.0 std= 0.0\n",
      "conv2_2 diff mean= 0.0 std= 0.0\n",
      "conv2_2_relu2_2_0_split_0 diff mean= 0.0 std= 0.0\n",
      "conv2_2_relu2_2_0_split_1 diff mean= 0.0 std= 0.0\n",
      "pool2 diff mean= 0.0 std= 0.0\n",
      "conv3_1 diff mean= 0.0 std= 0.0\n",
      "conv3_2 diff mean= 0.0 std= 0.0\n",
      "conv3_3 diff mean= 0.0 std= 0.0\n",
      "conv3_3_relu3_3_0_split_0 diff mean= 0.0 std= 0.0\n",
      "conv3_3_relu3_3_0_split_1 diff mean= 0.0 std= 0.0\n",
      "pool3 diff mean= 0.0 std= 0.0\n",
      "conv4_1 diff mean= 0.0 std= 0.0\n",
      "conv4_2 diff mean= 0.0 std= 0.0\n",
      "conv4_3 diff mean= 0.0 std= 0.0\n",
      "conv4_3_relu4_3_0_split_0 diff mean= 0.0 std= 0.0\n",
      "conv4_3_relu4_3_0_split_1 diff mean= 0.0 std= 0.0\n",
      "pool4 diff mean= 0.0 std= 0.0\n",
      "conv5_1 diff mean= 0.0 std= 0.0\n",
      "conv5_2 diff mean= 0.0 std= 0.0\n",
      "conv5_3 diff mean= 0.0 std= 0.0\n",
      "score_dsn2 diff mean= -0.00243886 std= 0.086988\n",
      "upscore_dsn2 diff mean= -0.000600985 std= 0.0362756\n",
      "crop_dsn2 diff mean= -0.00108017 std= 0.0486273\n",
      "crop_dsn2_crop_dsn2_0_split_0 diff mean= -2.18352e-11 std= 0.0384626\n",
      "crop_dsn2_crop_dsn2_0_split_1 diff mean= -0.00108017 std= 0.0120681\n",
      "dsn2_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn3 diff mean= -0.00252976 std= 0.264299\n",
      "upscore_dsn3 diff mean= -0.000153631 std= 0.038629\n",
      "crop_dsn3 diff mean= -0.000280107 std= 0.0521595\n",
      "crop_dsn3_crop_dsn3_0_split_0 diff mean= -1.01898e-10 std= 0.0408209\n",
      "crop_dsn3_crop_dsn3_0_split_1 diff mean= -0.000280107 std= 0.0123627\n",
      "dsn3_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn4 diff mean= 0.0087819 std= 0.765635\n",
      "upscore_dsn4 diff mean= 0.000129606 std= 0.0407347\n",
      "crop_dsn4 diff mean= 0.000243092 std= 0.0557874\n",
      "crop_dsn4_crop_dsn4_0_split_0 diff mean= -2.94775e-10 std= 0.0420078\n",
      "crop_dsn4_crop_dsn4_0_split_1 diff mean= 0.000243093 std= 0.0148399\n",
      "dsn4_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn5 diff mean= 0.0552589 std= 2.7918\n",
      "upscore_dsn5 diff mean= 0.000193483 std= 0.0504554\n",
      "crop_dsn5 diff mean= 0.000404864 std= 0.0729855\n",
      "crop_dsn5_crop_dsn5_0_split_0 diff mean= -1.83416e-10 std= 0.0470921\n",
      "crop_dsn5_crop_dsn5_0_split_1 diff mean= 0.000404864 std= 0.0286083\n",
      "dsn5_loss diff mean= 1.0 std= 0.0\n",
      "slice2_0 diff mean= -0.00207907 std= 0.00613478\n",
      "slice2_1 diff mean= -8.12663e-05 std= 0.0158634\n",
      "slice3_0 diff mean= -0.00207907 std= 0.00613478\n",
      "slice3_1 diff mean= -8.12663e-05 std= 0.0158634\n",
      "slice3_2 diff mean= 0.00132001 std= 0.0127825\n",
      "slice4_0 diff mean= -0.00207907 std= 0.00613478\n",
      "slice4_1 diff mean= -8.12663e-05 std= 0.0158634\n",
      "slice4_2 diff mean= 0.00132001 std= 0.0127825\n",
      "slice4_3 diff mean= 0.00181269 std= 0.0204717\n",
      "slice5_0 diff mean= -0.00207907 std= 0.00613478\n",
      "slice5_1 diff mean= -8.12663e-05 std= 0.0158634\n",
      "slice5_2 diff mean= 0.00132001 std= 0.0127825\n",
      "slice5_3 diff mean= 0.00181269 std= 0.0204717\n",
      "slice5_4 diff mean= 0.00105195 std= 0.0566635\n",
      "concat0 diff mean= -0.00207907 std= 0.00613478\n",
      "concat1 diff mean= -8.12663e-05 std= 0.0158634\n",
      "concat2 diff mean= 0.00132001 std= 0.0127825\n",
      "concat3 diff mean= 0.00181269 std= 0.0204717\n",
      "concat0_score diff mean= -0.00831626 std= 0.0245391\n",
      "concat1_score diff mean= -0.000325065 std= 0.0634535\n",
      "concat2_score diff mean= 0.00396399 std= 0.038386\n",
      "concat3_score diff mean= 0.00362538 std= 0.0409434\n",
      "concat4_score diff mean= 0.00105195 std= 0.0566635\n",
      "concat_fuse diff mean= -1.83416e-10 std= 0.0470921\n",
      "fuse_loss diff mean= 1.0 std= 0.0\n",
      "----------------------params-------------------------------\n",
      "conv1_1 weight mean= -0.00243791 std= 0.206699\n",
      "conv1_1 bias mean= 0.501391 std= 0.32848\n",
      "conv1_2 weight mean= 0.00491225 std= 0.042478\n",
      "conv1_2 bias mean= 0.0585559 std= 0.334784\n",
      "conv2_1 weight mean= 0.000198592 std= 0.0322231\n",
      "conv2_1 bias mean= 0.110862 std= 0.122017\n",
      "conv2_2 weight mean= -0.000280771 std= 0.0235406\n",
      "conv2_2 bias mean= 0.0157631 std= 0.18893\n",
      "conv3_1 weight mean= -0.000125897 std= 0.0173762\n",
      "conv3_1 bias mean= 0.0171437 std= 0.070719\n",
      "conv3_2 weight mean= -0.00023865 std= 0.0123452\n",
      "conv3_2 bias mean= 0.0357958 std= 0.076249\n",
      "conv3_3 weight mean= -0.000670671 std= 0.0126685\n",
      "conv3_3 bias mean= 0.0261699 std= 0.0832692\n",
      "conv4_1 weight mean= -0.000449347 std= 0.0100516\n",
      "conv4_1 bias mean= 0.0204377 std= 0.0537191\n",
      "conv4_2 weight mean= -0.000467314 std= 0.00762439\n",
      "conv4_2 bias mean= 0.0298601 std= 0.0440915\n",
      "conv4_3 weight mean= -0.000809169 std= 0.00795575\n",
      "conv4_3 bias mean= 0.0319183 std= 0.0680846\n",
      "conv5_1 weight mean= -0.000584893 std= 0.00869384\n",
      "conv5_1 bias mean= 0.0457245 std= 0.131329\n",
      "conv5_2 weight mean= -0.000740742 std= 0.00876056\n",
      "conv5_2 bias mean= 0.0498643 std= 0.212884\n",
      "conv5_3 weight mean= -0.00108189 std= 0.00847841\n",
      "conv5_3 bias mean= 0.149864 std= 0.492821\n",
      "score_dsn2 weight mean= 0.000101814 std= 0.000441367\n",
      "score_dsn2 bias mean= 9.43547e-07 std= 8.72558e-07\n",
      "upsample_2 weight mean= 0.125 std= 0.182217\n",
      "upsample_2 bias mean= 0.0 std= 0.0\n",
      "score_dsn3 weight mean= 2.4012e-05 std= 0.000400413\n",
      "score_dsn3 bias mean= 2.44678e-07 std= 3.34786e-06\n",
      "upsample_4 weight mean= 0.0833333 std= 0.17013\n",
      "upsample_4 bias mean= 0.0 std= 0.0\n",
      "score_dsn4 weight mean= -1.20919e-06 std= 7.15226e-05\n",
      "score_dsn4 bias mean= -2.12346e-07 std= 4.10156e-06\n",
      "upsample_8 weight mean= 0.0625 std= 0.153802\n",
      "upsample_8 bias mean= 0.0 std= 0.0\n",
      "score_dsn5 weight mean= 8.48941e-09 std= 9.08228e-06\n",
      "score_dsn5 bias mean= -3.53657e-07 std= 5.08338e-06\n",
      "upsample_16 weight mean= 0.05 std= 0.140281\n",
      "upsample_16 bias mean= 0.0 std= 0.0\n",
      "cat0_score weight mean= 0.25 std= 0.0\n",
      "cat0_score bias mean= 7.26441e-07 std= 0.0\n",
      "cat1_score weight mean= 0.25 std= 0.0\n",
      "cat1_score bias mean= 2.83947e-08 std= 0.0\n",
      "cat2_score weight mean= 0.333 std= 0.0\n",
      "cat2_score bias mean= -3.46264e-07 std= 0.0\n",
      "cat3_score weight mean= 0.5 std= 0.0\n",
      "cat3_score bias mean= -3.16686e-07 std= 0.0\n",
      "cat4_score weight mean= 1.0 std= 0.0\n",
      "cat4_score bias mean= -9.18904e-08 std= 0.0\n",
      "----------------------param-diff-------------------------------\n",
      "conv1_1 mean= -4.87582e-13 std= 4.13399e-11\n",
      "conv1_2 mean= 9.82449e-13 std= 8.49559e-12\n",
      "conv2_1 mean= 3.97183e-14 std= 6.44462e-12\n",
      "conv2_2 mean= -5.61543e-14 std= 4.70812e-12\n",
      "conv3_1 mean= -2.51794e-14 std= 3.47523e-12\n",
      "conv3_2 mean= -4.773e-14 std= 2.46904e-12\n",
      "conv3_3 mean= -1.34134e-13 std= 2.5337e-12\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "conv4_1 mean= -8.98694e-14 std= 2.01033e-12\n",
      "conv4_2 mean= -9.34629e-14 std= 1.52488e-12\n",
      "conv4_3 mean= -1.61834e-13 std= 1.59115e-12\n",
      "conv5_1 mean= -1.16979e-11 std= 1.73877e-10\n",
      "conv5_2 mean= -1.48148e-11 std= 1.75211e-10\n",
      "conv5_3 mean= -2.16379e-11 std= 1.69568e-10\n",
      "score_dsn2 mean= -0.000101814 std= 0.000441367\n",
      "upsample_2 mean= 0.0 std= 0.0\n",
      "score_dsn3 mean= -2.4012e-05 std= 0.000400413\n",
      "upsample_4 mean= 0.0 std= 0.0\n",
      "score_dsn4 mean= 1.20919e-06 std= 7.15226e-05\n",
      "upsample_8 mean= 0.0 std= 0.0\n",
      "score_dsn5 mean= -8.48941e-09 std= 9.08228e-06\n",
      "upsample_16 mean= 0.0 std= 0.0\n",
      "cat0_score mean= 2.5e-12 std= 0.0\n",
      "cat1_score mean= 2.5e-12 std= 0.0\n",
      "cat2_score mean= 6.66e-13 std= 0.0\n",
      "cat3_score mean= 5e-12 std= 0.0\n",
      "cat4_score mean= 1e-11 std= 0.0\n"
     ]
    }
   ],
   "source": [
    "print '----------------------output-------------------------------'\n",
    "for b in solver.net.blobs:\n",
    "    print b, 'data mean=', solver.net.blobs[b].data.mean(), 'std=', solver.net.blobs[b].data.std()\n",
    "    \n",
    "\n",
    "print '----------------------gradient-------------------------------'\n",
    "for b in solver.net.blobs:\n",
    "    print b, 'diff mean=', solver.net.blobs[b].diff.mean(), 'std=', solver.net.blobs[b].diff.std()\n",
    "\n",
    "\n",
    "print '----------------------params-------------------------------'\n",
    "for p in solver.net.params:\n",
    "    print p, 'weight mean=', solver.net.params[p][0].data.mean(), 'std=', solver.net.params[p][0].data.std()\n",
    "    if len(solver.net.params) > 1:\n",
    "        print p, 'bias mean=', solver.net.params[p][1].data.mean(), 'std=', solver.net.params[p][1].data.std()\n",
    "\n",
    "        \n",
    "print '----------------------param-diff-------------------------------'\n",
    "for p in solver.net.params:\n",
    "    print p, 'mean=', solver.net.params[p][0].diff.mean(), 'std=', solver.net.params[p][0].diff.std()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 2nd step"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [],
   "source": [
    "solver.step(1)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "----------------------output-------------------------------\n",
      "data data mean= -60.5781 std= 47.7821\n",
      "label data mean= 0.0744048 std= 0.438722\n",
      "data_data_0_split_0 data mean= -60.5781 std= 47.7821\n",
      "data_data_0_split_1 data mean= -60.5781 std= 47.7821\n",
      "data_data_0_split_2 data mean= -60.5781 std= 47.7821\n",
      "data_data_0_split_3 data mean= -60.5781 std= 47.7821\n",
      "data_data_0_split_4 data mean= -60.5781 std= 47.7821\n",
      "label_data_1_split_0 data mean= 0.0744048 std= 0.438722\n",
      "label_data_1_split_1 data mean= 0.0744048 std= 0.438722\n",
      "label_data_1_split_2 data mean= 0.0744048 std= 0.438722\n",
      "label_data_1_split_3 data mean= 0.0744048 std= 0.438722\n",
      "label_data_1_split_4 data mean= 0.0744048 std= 0.438722\n",
      "conv1_1 data mean= 11.5286 std= 33.6745\n",
      "conv1_2 data mean= 61.1319 std= 137.905\n",
      "pool1 data mean= 77.9868 std= 156.583\n",
      "conv2_1 data mean= 102.403 std= 200.71\n",
      "conv2_2 data mean= 114.257 std= 320.312\n",
      "conv2_2_relu2_2_0_split_0 data mean= 114.257 std= 320.312\n",
      "conv2_2_relu2_2_0_split_1 data mean= 114.257 std= 320.312\n",
      "pool2 data mean= 190.945 std= 425.021\n",
      "conv3_1 data mean= 158.969 std= 381.43\n",
      "conv3_2 data mean= 183.842 std= 393.794\n",
      "conv3_3 data mean= 116.102 std= 354.756\n",
      "conv3_3_relu3_3_0_split_0 data mean= 116.102 std= 354.756\n",
      "conv3_3_relu3_3_0_split_1 data mean= 116.102 std= 354.756\n",
      "pool3 data mean= 207.438 std= 486.361\n",
      "conv4_1 data mean= 113.314 std= 273.443\n",
      "conv4_2 data mean= 70.3311 std= 169.002\n",
      "conv4_3 data mean= 15.9492 std= 70.664\n",
      "conv4_3_relu4_3_0_split_0 data mean= 15.9492 std= 70.664\n",
      "conv4_3_relu4_3_0_split_1 data mean= 15.9492 std= 70.664\n",
      "pool4 data mean= 30.3596 std= 100.269\n",
      "conv5_1 data mean= 16.962 std= 47.9016\n",
      "conv5_2 data mean= 7.06578 std= 21.8466\n",
      "conv5_3 data mean= 0.813091 std= 5.2585\n",
      "score_dsn2 data mean= 1.69089 std= 6.12283\n",
      "upscore_dsn2 data mean= 1.66156 std= 5.92264\n",
      "crop_dsn2 data mean= 3.00979 std= 7.83611\n",
      "crop_dsn2_crop_dsn2_0_split_0 data mean= 3.00979 std= 7.83611\n",
      "crop_dsn2_crop_dsn2_0_split_1 data mean= 3.00979 std= 7.83611\n",
      "dsn2_loss data mean= 3545.4 std= 0.0\n",
      "score_dsn3 data mean= 0.693853 std= 10.481\n",
      "upscore_dsn3 data mean= 0.670095 std= 10.1237\n",
      "crop_dsn3 data mean= 1.0958 std= 13.5378\n",
      "crop_dsn3_crop_dsn3_0_split_0 data mean= 1.0958 std= 13.5378\n",
      "crop_dsn3_crop_dsn3_0_split_1 data mean= 1.0958 std= 13.5378\n",
      "dsn3_loss data mean= 11223.5 std= 0.0\n",
      "score_dsn4 data mean= -0.011856 std= 0.453913\n",
      "upscore_dsn4 data mean= -0.0110647 std= 0.426566\n",
      "crop_dsn4 data mean= -0.0149567 std= 0.574437\n",
      "crop_dsn4_crop_dsn4_0_split_0 data mean= -0.0149567 std= 0.574437\n",
      "crop_dsn4_crop_dsn4_0_split_1 data mean= -0.0149567 std= 0.574437\n",
      "dsn4_loss data mean= 2128.56 std= 0.0\n",
      "score_dsn5 data mean= -7.93547e-05 std= 0.00386097\n",
      "upscore_dsn5 data mean= -6.95928e-05 std= 0.00348032\n",
      "crop_dsn5 data mean= -8.00677e-05 std= 0.00537696\n",
      "crop_dsn5_crop_dsn5_0_split_0 data mean= -8.00677e-05 std= 0.00537696\n",
      "crop_dsn5_crop_dsn5_0_split_1 data mean= -8.00677e-05 std= 0.00537696\n",
      "dsn5_loss data mean= 2743.47 std= 0.0\n",
      "slice2_0 data mean= -2.80068 std= 3.72891\n",
      "slice2_1 data mean= 8.82025 std= 6.43284\n",
      "slice3_0 data mean= 8.37432 std= 4.56244\n",
      "slice3_1 data mean= 10.3564 std= 8.8465\n",
      "slice3_2 data mean= -15.4433 std= 6.20183\n",
      "slice4_0 data mean= 0.460215 std= 0.204776\n",
      "slice4_1 data mean= 0.484547 std= 0.440523\n",
      "slice4_2 data mean= -0.458288 std= 0.220101\n",
      "slice4_3 data mean= -0.546302 std= 0.285153\n",
      "slice5_0 data mean= 0.00690559 std= 0.00526569\n",
      "slice5_1 data mean= -0.00100864 std= 0.00311551\n",
      "slice5_2 data mean= -0.00384912 std= 0.00300578\n",
      "slice5_3 data mean= -0.00363548 std= 0.00253131\n",
      "slice5_4 data mean= 0.00118731 std= 0.00368346\n",
      "concat0 data mean= 1.51019 std= 5.09472\n",
      "concat1 data mean= 4.91504 std= 7.21962\n",
      "concat2 data mean= -5.30182 std= 8.01851\n",
      "concat3 data mean= -0.274969 std= 0.338055\n",
      "concat0_score data mean= 1.51019 std= 1.70993\n",
      "concat1_score data mean= 4.91504 std= 3.68208\n",
      "concat2_score data mean= -5.29652 std= 2.11618\n",
      "concat3_score data mean= -0.274969 std= 0.143001\n",
      "concat4_score data mean= 0.00118722 std= 0.00368346\n",
      "concat_fuse data mean= 0.170987 std= 3.88333\n",
      "fuse_loss data mean= 8882.55 std= 0.0\n",
      "----------------------gradient-------------------------------\n",
      "data diff mean= 0.0 std= 0.0\n",
      "label diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_0 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_1 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_2 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_3 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_4 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_0 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_1 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_2 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_3 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_4 diff mean= 0.0 std= 0.0\n",
      "conv1_1 diff mean= 7.23052e-05 std= 0.00212146\n",
      "conv1_2 diff mean= 1.41235e-05 std= 0.00110037\n",
      "pool1 diff mean= 3.49179e-05 std= 0.00236713\n",
      "conv2_1 diff mean= 2.1526e-05 std= 0.000595041\n",
      "conv2_2 diff mean= 1.00124e-05 std= 0.00050016\n",
      "conv2_2_relu2_2_0_split_0 diff mean= 2.68122e-07 std= 0.000575418\n",
      "conv2_2_relu2_2_0_split_1 diff mean= 1.65842e-05 std= 5.76423e-05\n",
      "pool2 diff mean= 1.07249e-06 std= 0.00115084\n",
      "conv3_1 diff mean= 2.05766e-05 std= 0.000505109\n",
      "conv3_2 diff mean= 1.18348e-05 std= 0.000445589\n",
      "conv3_3 diff mean= 2.29717e-05 std= 0.00040896\n",
      "conv3_3_relu3_3_0_split_0 diff mean= -5.99449e-07 std= 6.99353e-05\n",
      "conv3_3_relu3_3_0_split_1 diff mean= 5.26069e-05 std= 0.000604088\n",
      "pool3 diff mean= -2.3978e-06 std= 0.000139855\n",
      "conv4_1 diff mean= 2.02405e-06 std= 9.24378e-05\n",
      "conv4_2 diff mean= -3.87482e-07 std= 0.00014699\n",
      "conv4_3 diff mean= 5.85837e-06 std= 0.00019168\n",
      "conv4_3_relu4_3_0_split_0 diff mean= 5.45143e-08 std= 8.30589e-06\n",
      "conv4_3_relu4_3_0_split_1 diff mean= 2.5003e-05 std= 0.000402254\n",
      "pool4 diff mean= 2.03504e-07 std= 1.60469e-05\n",
      "conv5_1 diff mean= -3.0339e-07 std= 1.56625e-05\n",
      "conv5_2 diff mean= -6.39384e-08 std= 2.66511e-05\n",
      "conv5_3 diff mean= -1.89864e-06 std= 4.65337e-05\n",
      "score_dsn2 diff mean= 0.00465618 std= 0.0743387\n",
      "upscore_dsn2 diff mean= 0.00114385 std= 0.0217175\n",
      "crop_dsn2 diff mean= 0.0023756 std= 0.0312509\n",
      "crop_dsn2_crop_dsn2_0_split_0 diff mean= 3.68613e-10 std= 0.0119284\n",
      "crop_dsn2_crop_dsn2_0_split_1 diff mean= 0.0023756 std= 0.0253645\n",
      "dsn2_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn3 diff mean= 0.00625187 std= 0.64222\n",
      "upscore_dsn3 diff mean= 0.000377363 std= 0.0671821\n",
      "crop_dsn3 diff mean= 0.000797432 std= 0.0976593\n",
      "crop_dsn3_crop_dsn3_0_split_0 diff mean= 1.68768e-10 std= 0.0759173\n",
      "crop_dsn3_crop_dsn3_0_split_1 diff mean= 0.000797433 std= 0.026228\n",
      "dsn3_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn4 diff mean= -0.019729 std= 2.11131\n",
      "upscore_dsn4 diff mean= -0.000287691 std= 0.0746432\n",
      "crop_dsn4 diff mean= -0.000629113 std= 0.110379\n",
      "crop_dsn4_crop_dsn4_0_split_0 diff mean= 9.21531e-12 std= 0.0794053\n",
      "crop_dsn4_crop_dsn4_0_split_1 diff mean= -0.000629112 std= 0.0340663\n",
      "dsn4_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn5 diff mean= -0.10817 std= 5.21045\n",
      "upscore_dsn5 diff mean= -0.00037056 std= 0.0659001\n",
      "crop_dsn5 diff mean= -0.000923994 std= 0.104059\n",
      "crop_dsn5_crop_dsn5_0_split_0 diff mean= 4.12846e-10 std= 0.0726825\n",
      "crop_dsn5_crop_dsn5_0_split_1 diff mean= -0.000923994 std= 0.0391864\n",
      "dsn5_loss diff mean= 1.0 std= 0.0\n",
      "slice2_0 diff mean= -0.00448339 std= 0.0166479\n",
      "slice2_1 diff mean= 0.00923459 std= 0.0302568\n",
      "slice3_0 diff mean= -0.00448339 std= 0.0166479\n",
      "slice3_1 diff mean= 0.00923459 std= 0.0302568\n",
      "slice3_2 diff mean= -0.00235891 std= 0.0276056\n",
      "slice4_0 diff mean= -0.00448339 std= 0.0166479\n",
      "slice4_1 diff mean= 0.00923459 std= 0.0302568\n",
      "slice4_2 diff mean= -0.00235891 std= 0.0276056\n",
      "slice4_3 diff mean= -0.00490875 std= 0.0505362\n",
      "slice5_0 diff mean= -0.00448339 std= 0.0166479\n",
      "slice5_1 diff mean= 0.00923459 std= 0.0302568\n",
      "slice5_2 diff mean= -0.00235891 std= 0.0276056\n",
      "slice5_3 diff mean= -0.00490875 std= 0.0505362\n",
      "slice5_4 diff mean= -0.00210352 std= 0.0550826\n",
      "concat0 diff mean= -0.00448339 std= 0.0166479\n",
      "concat1 diff mean= 0.00923459 std= 0.0302568\n",
      "concat2 diff mean= -0.00235891 std= 0.0276056\n",
      "concat3 diff mean= -0.00490875 std= 0.0505362\n",
      "concat0_score diff mean= -0.0179335 std= 0.0665915\n",
      "concat1_score diff mean= 0.0369384 std= 0.121027\n",
      "concat2_score diff mean= -0.00708381 std= 0.0828997\n",
      "concat3_score diff mean= -0.0098175 std= 0.101072\n",
      "concat4_score diff mean= -0.00210352 std= 0.0550826\n",
      "concat_fuse diff mean= 6.26641e-10 std= 0.0905992\n",
      "fuse_loss diff mean= 1.0 std= 0.0\n",
      "----------------------params-------------------------------\n",
      "conv1_1 weight mean= -0.00222625 std= 0.206637\n",
      "conv1_1 bias mean= 0.501384 std= 0.328478\n",
      "conv1_2 weight mean= 0.00489145 std= 0.0424658\n",
      "conv1_2 bias mean= 0.0585544 std= 0.334783\n",
      "conv2_1 weight mean= 0.000144752 std= 0.0322141\n",
      "conv2_1 bias mean= 0.110861 std= 0.122017\n",
      "conv2_2 weight mean= -0.000316153 std= 0.0235339\n",
      "conv2_2 bias mean= 0.0157628 std= 0.18893\n",
      "conv3_1 weight mean= -0.000153391 std= 0.0173731\n",
      "conv3_1 bias mean= 0.0171436 std= 0.0707189\n",
      "conv3_2 weight mean= -0.000250196 std= 0.012343\n",
      "conv3_2 bias mean= 0.0357957 std= 0.076249\n",
      "conv3_3 weight mean= -0.000693932 std= 0.0126652\n",
      "conv3_3 bias mean= 0.0261698 std= 0.0832692\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "conv4_1 weight mean= -0.000449964 std= 0.0100516\n",
      "conv4_1 bias mean= 0.0204377 std= 0.0537191\n",
      "conv4_2 weight mean= -0.000467256 std= 0.00762436\n",
      "conv4_2 bias mean= 0.0298601 std= 0.0440915\n",
      "conv4_3 weight mean= -0.000809657 std= 0.00795567\n",
      "conv4_3 bias mean= 0.0319183 std= 0.0680846\n",
      "conv5_1 weight mean= -0.000584621 std= 0.00869389\n",
      "conv5_1 bias mean= 0.0457245 std= 0.131329\n",
      "conv5_2 weight mean= -0.000740703 std= 0.00876059\n",
      "conv5_2 bias mean= 0.0498643 std= 0.212884\n",
      "conv5_3 weight mean= -0.00108149 std= 0.00847849\n",
      "conv5_3 bias mean= 0.149864 std= 0.492821\n",
      "score_dsn2 weight mean= 3.78079e-05 std= 0.00107459\n",
      "score_dsn2 bias mean= 5.63506e-07 std= 1.12358e-05\n",
      "upsample_2 weight mean= 0.125 std= 0.182217\n",
      "upsample_2 bias mean= 0.0 std= 0.0\n",
      "score_dsn3 weight mean= 3.92005e-06 std= 0.0010003\n",
      "score_dsn3 bias mean= 5.22653e-08 std= 9.74625e-06\n",
      "upsample_4 weight mean= 0.0833333 std= 0.17013\n",
      "upsample_4 bias mean= 0.0 std= 0.0\n",
      "score_dsn4 weight mean= 3.33703e-06 std= 0.000203712\n",
      "score_dsn4 bias mean= -7.79304e-08 std= 1.13231e-05\n",
      "upsample_8 weight mean= 0.0625 std= 0.153802\n",
      "upsample_8 bias mean= 0.0 std= 0.0\n",
      "score_dsn5 weight mean= 7.05874e-07 std= 2.48914e-05\n",
      "score_dsn5 bias mean= -1.93836e-07 std= 1.50885e-05\n",
      "upsample_16 weight mean= 0.05 std= 0.140281\n",
      "upsample_16 bias mean= 0.0 std= 0.0\n",
      "cat0_score weight mean= 0.250006 std= 7.62038e-05\n",
      "cat0_score bias mean= 2.30819e-06 std= 0.0\n",
      "cat1_score weight mean= 0.249651 std= 0.000335047\n",
      "cat1_score bias mean= -1.85739e-06 std= 0.0\n",
      "cat2_score weight mean= 0.332987 std= 1.80971e-05\n",
      "cat2_score bias mean= -2.91357e-07 std= 0.0\n",
      "cat3_score weight mean= 0.499996 std= 4.11272e-06\n",
      "cat3_score bias mean= -9.37062e-08 std= 0.0\n",
      "cat4_score weight mean= 1.0 std= 0.0\n",
      "cat4_score bias mean= -6.57472e-08 std= 0.0\n",
      "----------------------param-diff-------------------------------\n",
      "conv1_1 mean= -0.000211661 std= 0.000297576\n",
      "conv1_2 mean= 2.07924e-05 std= 0.000156512\n",
      "conv2_1 mean= 5.38395e-05 std= 0.000182328\n",
      "conv2_2 mean= 3.53812e-05 std= 0.000149731\n",
      "conv3_1 mean= 2.74938e-05 std= 0.000113345\n",
      "conv3_2 mean= 1.15466e-05 std= 7.4817e-05\n",
      "conv3_3 mean= 2.32616e-05 std= 6.23528e-05\n",
      "conv4_1 mean= 6.17032e-07 std= 4.22629e-06\n",
      "conv4_2 mean= -5.90003e-08 std= 3.36282e-06\n",
      "conv4_3 mean= 4.87793e-07 std= 2.78906e-06\n",
      "conv5_1 mean= -2.72024e-07 std= 6.16577e-06\n",
      "conv5_2 mean= -3.90692e-08 std= 4.86479e-06\n",
      "conv5_3 mean= -4.08366e-07 std= 3.76607e-06\n",
      "score_dsn2 mean= 6.40059e-05 std= 0.00106119\n",
      "upsample_2 mean= 0.0 std= 0.0\n",
      "score_dsn3 mean= 2.00919e-05 std= 0.000978987\n",
      "upsample_4 mean= 0.0 std= 0.0\n",
      "score_dsn4 mean= -4.54622e-06 std= 0.000182138\n",
      "upsample_8 mean= 0.0 std= 0.0\n",
      "score_dsn5 mean= -6.97384e-07 std= 1.85223e-05\n",
      "upsample_16 mean= 0.0 std= 0.0\n",
      "cat0_score mean= -5.60332e-06 std= 7.62054e-05\n",
      "cat1_score mean= 0.000349079 std= 0.000335046\n",
      "cat2_score mean= 1.34943e-05 std= 1.80913e-05\n",
      "cat3_score mean= 4.19812e-06 std= 4.12008e-06\n",
      "cat4_score mean= -4.90865e-08 std= 0.0\n"
     ]
    }
   ],
   "source": [
    "print '----------------------output-------------------------------'\n",
    "for b in solver.net.blobs:\n",
    "    print b, 'data mean=', solver.net.blobs[b].data.mean(), 'std=', solver.net.blobs[b].data.std()\n",
    "    \n",
    "\n",
    "print '----------------------gradient-------------------------------'\n",
    "for b in solver.net.blobs:\n",
    "    print b, 'diff mean=', solver.net.blobs[b].diff.mean(), 'std=', solver.net.blobs[b].diff.std()\n",
    "\n",
    "\n",
    "print '----------------------params-------------------------------'\n",
    "for p in solver.net.params:\n",
    "    print p, 'weight mean=', solver.net.params[p][0].data.mean(), 'std=', solver.net.params[p][0].data.std()\n",
    "    if len(solver.net.params) > 1:\n",
    "        print p, 'bias mean=', solver.net.params[p][1].data.mean(), 'std=', solver.net.params[p][1].data.std()\n",
    "\n",
    "        \n",
    "print '----------------------param-diff-------------------------------'\n",
    "for p in solver.net.params:\n",
    "    print p, 'mean=', solver.net.params[p][0].diff.mean(), 'std=', solver.net.params[p][0].diff.std()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 3rd step"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [],
   "source": [
    "solver.step(1)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "----------------------output-------------------------------\n",
      "data data mean= -25.2325 std= 47.9276\n",
      "label data mean= 0.0256975 std= 0.272534\n",
      "data_data_0_split_0 data mean= -25.2325 std= 47.9276\n",
      "data_data_0_split_1 data mean= -25.2325 std= 47.9276\n",
      "data_data_0_split_2 data mean= -25.2325 std= 47.9276\n",
      "data_data_0_split_3 data mean= -25.2325 std= 47.9276\n",
      "data_data_0_split_4 data mean= -25.2325 std= 47.9276\n",
      "label_data_1_split_0 data mean= 0.0256975 std= 0.272534\n",
      "label_data_1_split_1 data mean= 0.0256975 std= 0.272534\n",
      "label_data_1_split_2 data mean= 0.0256975 std= 0.272534\n",
      "label_data_1_split_3 data mean= 0.0256975 std= 0.272534\n",
      "label_data_1_split_4 data mean= 0.0256975 std= 0.272534\n",
      "conv1_1 data mean= 16.9157 std= 36.7505\n",
      "conv1_2 data mean= 86.1918 std= 147.572\n",
      "pool1 data mean= 138.297 std= 188.786\n",
      "conv2_1 data mean= 157.612 std= 260.968\n",
      "conv2_2 data mean= 171.853 std= 373.704\n",
      "conv2_2_relu2_2_0_split_0 data mean= 171.853 std= 373.704\n",
      "conv2_2_relu2_2_0_split_1 data mean= 171.853 std= 373.704\n",
      "pool2 data mean= 318.969 std= 508.283\n",
      "conv3_1 data mean= 189.929 std= 402.591\n",
      "conv3_2 data mean= 188.352 std= 381.217\n",
      "conv3_3 data mean= 103.348 std= 315.18\n",
      "conv3_3_relu3_3_0_split_0 data mean= 103.348 std= 315.18\n",
      "conv3_3_relu3_3_0_split_1 data mean= 103.348 std= 315.18\n",
      "pool3 data mean= 195.311 std= 438.236\n",
      "conv4_1 data mean= 98.7408 std= 236.528\n",
      "conv4_2 data mean= 50.3674 std= 130.639\n",
      "conv4_3 data mean= 10.6858 std= 48.7762\n",
      "conv4_3_relu4_3_0_split_0 data mean= 10.6858 std= 48.7762\n",
      "conv4_3_relu4_3_0_split_1 data mean= 10.6858 std= 48.7762\n",
      "pool4 data mean= 21.4346 std= 70.2618\n",
      "conv5_1 data mean= 11.5815 std= 33.9736\n",
      "conv5_2 data mean= 4.38899 std= 14.6146\n",
      "conv5_3 data mean= 0.655857 std= 3.67502\n",
      "score_dsn2 data mean= 1.34166 std= 18.2677\n",
      "upscore_dsn2 data mean= 1.33026 std= 17.9088\n",
      "crop_dsn2 data mean= 1.79187 std= 20.701\n",
      "crop_dsn2_crop_dsn2_0_split_0 data mean= 1.79187 std= 20.701\n",
      "crop_dsn2_crop_dsn2_0_split_1 data mean= 1.79187 std= 20.701\n",
      "dsn2_loss data mean= 2563.7 std= 0.0\n",
      "score_dsn3 data mean= -0.0864712 std= 23.6833\n",
      "upscore_dsn3 data mean= -0.0850133 std= 23.277\n",
      "crop_dsn3 data mean= -0.120555 std= 26.546\n",
      "crop_dsn3_crop_dsn3_0_split_0 data mean= -0.120555 std= 26.546\n",
      "crop_dsn3_crop_dsn3_0_split_1 data mean= -0.120555 std= 26.546\n",
      "dsn3_loss data mean= 27207.5 std= 0.0\n",
      "score_dsn4 data mean= 0.0108242 std= 0.688274\n",
      "upscore_dsn4 data mean= 0.0104655 std= 0.658098\n",
      "crop_dsn4 data mean= 0.0156144 std= 0.723526\n",
      "crop_dsn4_crop_dsn4_0_split_0 data mean= 0.0156144 std= 0.723526\n",
      "crop_dsn4_crop_dsn4_0_split_1 data mean= 0.0156144 std= 0.723526\n",
      "dsn4_loss data mean= 3163.98 std= 0.0\n",
      "score_dsn5 data mean= 0.000121929 std= 0.00573909\n",
      "upscore_dsn5 data mean= 0.000114045 std= 0.00533985\n",
      "crop_dsn5 data mean= 0.000207208 std= 0.00618833\n",
      "crop_dsn5_crop_dsn5_0_split_0 data mean= 0.000207208 std= 0.00618833\n",
      "crop_dsn5_crop_dsn5_0_split_1 data mean= 0.000207208 std= 0.00618833\n",
      "dsn5_loss data mean= 4877.22 std= 0.0\n",
      "slice2_0 data mean= 21.1094 std= 7.18336\n",
      "slice2_1 data mean= -17.5257 std= 7.68934\n",
      "slice3_0 data mean= 30.0124 std= 11.0912\n",
      "slice3_1 data mean= -29.771 std= 13.457\n",
      "slice3_2 data mean= -0.603006 std= 4.75208\n",
      "slice4_0 data mean= 1.01607 std= 0.412055\n",
      "slice4_1 data mean= -0.687778 std= 0.463798\n",
      "slice4_2 data mean= -0.265756 std= 0.191684\n",
      "slice4_3 data mean= -8.26348e-05 std= 0.311805\n",
      "slice5_0 data mean= 0.00916279 std= 0.0059182\n",
      "slice5_1 data mean= -0.00354905 std= 0.00497089\n",
      "slice5_2 data mean= -0.00294073 std= 0.0023191\n",
      "slice5_3 data mean= -0.000996972 std= 0.00247016\n",
      "slice5_4 data mean= -0.000639996 std= 0.00372469\n",
      "concat0 data mean= 13.0368 std= 14.5115\n",
      "concat1 data mean= -11.997 std= 14.6514\n",
      "concat2 data mean= -0.290568 std= 2.75681\n",
      "concat3 data mean= -0.000539804 std= 0.220487\n",
      "concat0_score data mean= 13.0381 std= 3.99512\n",
      "concat1_score data mean= -11.9639 std= 4.58858\n",
      "concat2_score data mean= -0.290253 std= 1.61015\n",
      "concat3_score data mean= -0.000539895 std= 0.156193\n",
      "concat4_score data mean= -0.000640062 std= 0.00372469\n",
      "concat_fuse data mean= 0.156546 std= 8.39905\n",
      "fuse_loss data mean= 23339.2 std= 0.0\n",
      "----------------------gradient-------------------------------\n",
      "data diff mean= 0.0 std= 0.0\n",
      "label diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_0 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_1 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_2 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_3 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_4 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_0 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_1 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_2 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_3 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_4 diff mean= 0.0 std= 0.0\n",
      "conv1_1 diff mean= 5.67065e-05 std= 0.00134611\n",
      "conv1_2 diff mean= 9.63415e-06 std= 0.000727449\n",
      "pool1 diff mean= 1.84192e-05 std= 0.00156511\n",
      "conv2_1 diff mean= 1.05018e-05 std= 0.00040706\n",
      "conv2_2 diff mean= 4.51609e-06 std= 0.000343263\n",
      "conv2_2_relu2_2_0_split_0 diff mean= -2.07354e-06 std= 0.000391952\n",
      "conv2_2_relu2_2_0_split_1 diff mean= 6.1839e-06 std= 0.00010301\n",
      "pool2 diff mean= -8.25716e-06 std= 0.00078212\n",
      "conv3_1 diff mean= 1.06017e-05 std= 0.000326383\n",
      "conv3_2 diff mean= 7.06732e-06 std= 0.000316746\n",
      "conv3_3 diff mean= 1.96189e-05 std= 0.000333196\n",
      "conv3_3_relu3_3_0_split_0 diff mean= -2.17466e-07 std= 3.71148e-05\n",
      "conv3_3_relu3_3_0_split_1 diff mean= 7.2668e-05 std= 0.000606691\n",
      "pool3 diff mean= -8.62848e-07 std= 7.3926e-05\n",
      "conv4_1 diff mean= 6.19026e-07 std= 4.7289e-05\n",
      "conv4_2 diff mean= 9.49164e-08 std= 8.15432e-05\n",
      "conv4_3 diff mean= 3.46403e-06 std= 0.00015839\n",
      "conv4_3_relu4_3_0_split_0 diff mean= 1.27362e-08 std= 5.69021e-06\n",
      "conv4_3_relu4_3_0_split_1 diff mean= 1.81088e-05 std= 0.000394947\n",
      "pool4 diff mean= 5.0945e-08 std= 1.13803e-05\n",
      "conv5_1 diff mean= -1.91496e-07 std= 1.13632e-05\n",
      "conv5_2 diff mean= 2.06336e-09 std= 2.13216e-05\n",
      "conv5_3 diff mean= -1.4625e-06 std= 4.57189e-05\n",
      "score_dsn2 diff mean= 0.00333511 std= 0.0533529\n",
      "upscore_dsn2 diff mean= 0.000826694 std= 0.0241525\n",
      "crop_dsn2 diff mean= 0.00114728 std= 0.0284462\n",
      "crop_dsn2_crop_dsn2_0_split_0 diff mean= -5.98024e-12 std= 0.0183954\n",
      "crop_dsn2_crop_dsn2_0_split_1 diff mean= 0.00114728 std= 0.0174186\n",
      "dsn2_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn3 diff mean= 0.00353378 std= 0.396242\n",
      "upscore_dsn3 diff mean= 0.000217142 std= 0.0600094\n",
      "crop_dsn3 diff mean= 0.000305269 std= 0.071152\n",
      "crop_dsn3_crop_dsn3_0_split_0 diff mean= -1.11612e-10 std= 0.0546904\n",
      "crop_dsn3_crop_dsn3_0_split_1 diff mean= 0.000305268 std= 0.0188468\n",
      "dsn3_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn4 diff mean= -0.00860395 std= 0.98974\n",
      "upscore_dsn4 diff mean= -0.000129982 std= 0.0553765\n",
      "crop_dsn4 diff mean= -0.000187325 std= 0.0664786\n",
      "crop_dsn4_crop_dsn4_0_split_0 diff mean= 2.5416e-11 std= 0.0459544\n",
      "crop_dsn4_crop_dsn4_0_split_1 diff mean= -0.000187325 std= 0.021735\n",
      "dsn4_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn5 diff mean= -0.0902456 std= 2.63354\n",
      "upscore_dsn5 diff mean= -0.000329729 std= 0.0515891\n",
      "crop_dsn5 diff mean= -0.000491206 std= 0.0629661\n",
      "crop_dsn5_crop_dsn5_0_split_0 diff mean= -1.17213e-10 std= 0.0390461\n",
      "crop_dsn5_crop_dsn5_0_split_1 diff mean= -0.000491206 std= 0.0267581\n",
      "dsn5_loss diff mean= 1.0 std= 0.0\n",
      "slice2_0 diff mean= 0.00237819 std= 0.0241481\n",
      "slice2_1 diff mean= -8.36378e-05 std= 0.0045445\n",
      "slice3_0 diff mean= 0.00238024 std= 0.0241689\n",
      "slice3_1 diff mean= -8.3584e-05 std= 0.00454157\n",
      "slice3_2 diff mean= -0.00138085 std= 0.0212966\n",
      "slice4_0 diff mean= 0.00237924 std= 0.0241588\n",
      "slice4_1 diff mean= -8.38257e-05 std= 0.00455471\n",
      "slice4_2 diff mean= -0.00138101 std= 0.021299\n",
      "slice4_3 diff mean= -0.00166371 std= 0.0286599\n",
      "slice5_0 diff mean= 0.00237916 std= 0.0241579\n",
      "slice5_1 diff mean= -8.38386e-05 std= 0.00455541\n",
      "slice5_2 diff mean= -0.00138101 std= 0.0212991\n",
      "slice5_3 diff mean= -0.00166374 std= 0.0286604\n",
      "slice5_4 diff mean= -0.0017066 std= 0.0410915\n",
      "concat0 diff mean= 0.00237921 std= 0.0241584\n",
      "concat1 diff mean= -8.37215e-05 std= 0.00454905\n",
      "concat2 diff mean= -0.00138096 std= 0.0212982\n",
      "concat3 diff mean= -0.00166373 std= 0.0286601\n",
      "concat0_score diff mean= 0.00951661 std= 0.0966316\n",
      "concat1_score diff mean= -0.000335354 std= 0.0182216\n",
      "concat2_score diff mean= -0.00414718 std= 0.0639612\n",
      "concat3_score diff mean= -0.00332748 std= 0.0573208\n",
      "concat4_score diff mean= -0.0017066 std= 0.0410915\n",
      "concat_fuse diff mean= 9.15755e-11 std= 0.0614114\n",
      "fuse_loss diff mean= 1.0 std= 0.0\n",
      "----------------------params-------------------------------\n",
      "conv1_1 weight mean= -0.0020152 std= 0.206433\n",
      "conv1_1 bias mean= 0.501352 std= 0.328467\n",
      "conv1_2 weight mean= 0.00481928 std= 0.0424281\n",
      "conv1_2 bias mean= 0.0585489 std= 0.334777\n",
      "conv2_1 weight mean= -2.2997e-05 std= 0.0321879\n",
      "conv2_1 bias mean= 0.110859 std= 0.122015\n",
      "conv2_2 weight mean= -0.000417006 std= 0.023515\n",
      "conv2_2 bias mean= 0.0157621 std= 0.188929\n",
      "conv3_1 weight mean= -0.000242199 std= 0.0173646\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "conv3_1 bias mean= 0.0171432 std= 0.0707185\n",
      "conv3_2 weight mean= -0.000287413 std= 0.0123363\n",
      "conv3_2 bias mean= 0.0357954 std= 0.0762487\n",
      "conv3_3 weight mean= -0.000789632 std= 0.0126533\n",
      "conv3_3 bias mean= 0.0261691 std= 0.0832691\n",
      "conv4_1 weight mean= -0.000450978 std= 0.0100514\n",
      "conv4_1 bias mean= 0.0204377 std= 0.0537191\n",
      "conv4_2 weight mean= -0.000467251 std= 0.00762429\n",
      "conv4_2 bias mean= 0.0298601 std= 0.0440915\n",
      "conv4_3 weight mean= -0.000810939 std= 0.00795547\n",
      "conv4_3 bias mean= 0.0319183 std= 0.0680846\n",
      "conv5_1 weight mean= -0.00058397 std= 0.00869399\n",
      "conv5_1 bias mean= 0.0457246 std= 0.131329\n",
      "conv5_2 weight mean= -0.000740647 std= 0.00876064\n",
      "conv5_2 bias mean= 0.0498643 std= 0.212884\n",
      "conv5_3 weight mean= -0.00108062 std= 0.00847865\n",
      "conv5_3 bias mean= 0.149864 std= 0.492822\n",
      "score_dsn2 weight mean= -0.000486201 std= 0.00158816\n",
      "score_dsn2 bias mean= -3.43768e-06 std= 1.5559e-05\n",
      "upsample_2 weight mean= 0.125 std= 0.182217\n",
      "upsample_2 bias mean= 0.0 std= 0.0\n",
      "score_dsn3 weight mean= -9.65364e-05 std= 0.00233762\n",
      "score_dsn3 bias mean= -1.09453e-06 std= 1.41796e-05\n",
      "upsample_4 weight mean= 0.0833333 std= 0.17013\n",
      "upsample_4 bias mean= 0.0 std= 0.0\n",
      "score_dsn4 weight mean= 1.50115e-05 std= 0.000426175\n",
      "score_dsn4 bias mean= 6.40502e-07 std= 1.58704e-05\n",
      "upsample_8 weight mean= 0.0625 std= 0.153802\n",
      "upsample_8 bias mean= 0.0 std= 0.0\n",
      "score_dsn5 weight mean= 2.17156e-06 std= 4.46614e-05\n",
      "score_dsn5 bias mean= 1.51667e-06 std= 2.90422e-05\n",
      "upsample_16 weight mean= 0.05 std= 0.140281\n",
      "upsample_16 bias mean= 0.0 std= 0.0\n",
      "cat0_score weight mean= 0.248815 std= 0.00117645\n",
      "cat0_score bias mean= 6.96515e-07 std= 0.0\n",
      "cat1_score weight mean= 0.249292 std= 0.000682115\n",
      "cat1_score bias mean= -3.44764e-06 std= 0.0\n",
      "cat2_score weight mean= 0.332988 std= 1.39033e-05\n",
      "cat2_score bias mean= 1.08077e-06 std= 0.0\n",
      "cat3_score weight mean= 0.499995 std= 4.72369e-06\n",
      "cat3_score bias mean= 1.16825e-06 std= 0.0\n",
      "cat4_score weight mean= 1.0 std= 0.0\n",
      "cat4_score bias mean= 5.02088e-07 std= 0.0\n",
      "----------------------param-diff-------------------------------\n",
      "conv1_1 mean= -0.000211054 std= 0.000632546\n",
      "conv1_2 mean= 7.21696e-05 std= 0.000341389\n",
      "conv2_1 mean= 0.000167749 std= 0.000484684\n",
      "conv2_2 mean= 0.000100853 std= 0.000381156\n",
      "conv3_1 mean= 8.88079e-05 std= 0.000300484\n",
      "conv3_2 mean= 3.72164e-05 std= 0.000189022\n",
      "conv3_3 mean= 9.57e-05 std= 0.000127408\n",
      "conv4_1 mean= 1.01407e-06 std= 7.71091e-06\n",
      "conv4_2 mean= -4.34005e-09 std= 6.42801e-06\n",
      "conv4_3 mean= 1.28205e-06 std= 5.77535e-06\n",
      "conv5_1 mean= -6.51165e-07 std= 9.72857e-06\n",
      "conv5_2 mean= -5.60424e-08 std= 8.74125e-06\n",
      "conv5_3 mean= -8.6778e-07 std= 6.74048e-06\n",
      "score_dsn2 mean= 0.000524009 std= 0.000610351\n",
      "upsample_2 mean= 0.0 std= 0.0\n",
      "score_dsn3 mean= 0.000100456 std= 0.00198044\n",
      "upsample_4 mean= 0.0 std= 0.0\n",
      "score_dsn4 mean= -1.16744e-05 std= 0.000293277\n",
      "upsample_8 mean= 0.0 std= 0.0\n",
      "score_dsn5 mean= -1.46568e-06 std= 2.31702e-05\n",
      "upsample_16 mean= 0.0 std= 0.0\n",
      "cat0_score mean= 0.00119012 std= 0.00119617\n",
      "cat1_score mean= 0.000358439 std= 0.000347182\n",
      "cat2_score mean= -1.79439e-06 std= 4.37826e-06\n",
      "cat3_score mean= 6.74126e-07 std= 6.21421e-07\n",
      "cat4_score mean= -7.86109e-08 std= 0.0\n"
     ]
    }
   ],
   "source": [
    "print '----------------------output-------------------------------'\n",
    "for b in solver.net.blobs:\n",
    "    print b, 'data mean=', solver.net.blobs[b].data.mean(), 'std=', solver.net.blobs[b].data.std()\n",
    "    \n",
    "\n",
    "print '----------------------gradient-------------------------------'\n",
    "for b in solver.net.blobs:\n",
    "    print b, 'diff mean=', solver.net.blobs[b].diff.mean(), 'std=', solver.net.blobs[b].diff.std()\n",
    "\n",
    "\n",
    "print '----------------------params-------------------------------'\n",
    "for p in solver.net.params:\n",
    "    print p, 'weight mean=', solver.net.params[p][0].data.mean(), 'std=', solver.net.params[p][0].data.std()\n",
    "    if len(solver.net.params) > 1:\n",
    "        print p, 'bias mean=', solver.net.params[p][1].data.mean(), 'std=', solver.net.params[p][1].data.std()\n",
    "\n",
    "        \n",
    "print '----------------------param-diff-------------------------------'\n",
    "for p in solver.net.params:\n",
    "    print p, 'mean=', solver.net.params[p][0].diff.mean(), 'std=', solver.net.params[p][0].diff.std()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 4th step"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 9,
   "metadata": {},
   "outputs": [],
   "source": [
    "solver.step(1)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 10,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "----------------------output-------------------------------\n",
      "data data mean= -41.6021 std= 69.4978\n",
      "label data mean= 0.121445 std= 0.578889\n",
      "data_data_0_split_0 data mean= -41.6021 std= 69.4978\n",
      "data_data_0_split_1 data mean= -41.6021 std= 69.4978\n",
      "data_data_0_split_2 data mean= -41.6021 std= 69.4978\n",
      "data_data_0_split_3 data mean= -41.6021 std= 69.4978\n",
      "data_data_0_split_4 data mean= -41.6021 std= 69.4978\n",
      "label_data_1_split_0 data mean= 0.121445 std= 0.578889\n",
      "label_data_1_split_1 data mean= 0.121445 std= 0.578889\n",
      "label_data_1_split_2 data mean= 0.121445 std= 0.578889\n",
      "label_data_1_split_3 data mean= 0.121445 std= 0.578889\n",
      "label_data_1_split_4 data mean= 0.121445 std= 0.578889\n",
      "conv1_1 data mean= 11.7038 std= 33.7781\n",
      "conv1_2 data mean= 62.3054 std= 133.385\n",
      "pool1 data mean= 80.9895 std= 155.92\n",
      "conv2_1 data mean= 98.9516 std= 200.168\n",
      "conv2_2 data mean= 99.7519 std= 285.677\n",
      "conv2_2_relu2_2_0_split_0 data mean= 99.7519 std= 285.677\n",
      "conv2_2_relu2_2_0_split_1 data mean= 99.7519 std= 285.677\n",
      "pool2 data mean= 172.451 std= 388.91\n",
      "conv3_1 data mean= 127.573 std= 333.641\n",
      "conv3_2 data mean= 123.288 std= 303.843\n",
      "conv3_3 data mean= 49.4205 std= 196.961\n",
      "conv3_3_relu3_3_0_split_0 data mean= 49.4205 std= 196.961\n",
      "conv3_3_relu3_3_0_split_1 data mean= 49.4205 std= 196.961\n",
      "pool3 data mean= 88.3367 std= 272.051\n",
      "conv4_1 data mean= 52.9612 std= 134.822\n",
      "conv4_2 data mean= 27.1649 std= 72.2139\n",
      "conv4_3 data mean= 6.18844 std= 26.695\n",
      "conv4_3_relu4_3_0_split_0 data mean= 6.18844 std= 26.695\n",
      "conv4_3_relu4_3_0_split_1 data mean= 6.18844 std= 26.695\n",
      "pool4 data mean= 12.2487 std= 38.5868\n",
      "conv5_1 data mean= 6.23861 std= 17.8035\n",
      "conv5_2 data mean= 2.59293 std= 8.11714\n",
      "conv5_3 data mean= 0.40864 std= 2.2568\n",
      "score_dsn2 data mean= -7.06262 std= 20.4279\n",
      "upscore_dsn2 data mean= -6.94838 std= 20.0124\n",
      "crop_dsn2 data mean= -12.3411 std= 25.947\n",
      "crop_dsn2_crop_dsn2_0_split_0 data mean= -12.3411 std= 25.947\n",
      "crop_dsn2_crop_dsn2_0_split_1 data mean= -12.3411 std= 25.947\n",
      "dsn2_loss data mean= 31088.7 std= 0.0\n",
      "score_dsn3 data mean= -2.34249 std= 27.6635\n",
      "upscore_dsn3 data mean= -2.26805 std= 26.8957\n",
      "crop_dsn3 data mean= -3.85263 std= 36.8763\n",
      "crop_dsn3_crop_dsn3_0_split_0 data mean= -3.85263 std= 36.8763\n",
      "crop_dsn3_crop_dsn3_0_split_1 data mean= -3.85263 std= 36.8763\n",
      "dsn3_loss data mean= 92855.8 std= 0.0\n",
      "score_dsn4 data mean= 0.0417307 std= 0.726375\n",
      "upscore_dsn4 data mean= 0.0391547 std= 0.679855\n",
      "crop_dsn4 data mean= 0.0695023 std= 0.896646\n",
      "crop_dsn4_crop_dsn4_0_split_0 data mean= 0.0695023 std= 0.896646\n",
      "crop_dsn4_crop_dsn4_0_split_1 data mean= 0.0695023 std= 0.896646\n",
      "dsn4_loss data mean= 3832.46 std= 0.0\n",
      "score_dsn5 data mean= 0.000436751 std= 0.00677814\n",
      "upscore_dsn5 data mean= 0.000385277 std= 0.00615035\n",
      "crop_dsn5 data mean= 0.000807517 std= 0.00849697\n",
      "crop_dsn5_crop_dsn5_0_split_0 data mean= 0.000807517 std= 0.00849697\n",
      "crop_dsn5_crop_dsn5_0_split_1 data mean= 0.000807517 std= 0.00849697\n",
      "dsn5_loss data mean= 5001.69 std= 0.0\n",
      "slice2_0 data mean= 11.017 std= 8.39613\n",
      "slice2_1 data mean= -35.6991 std= 13.5943\n",
      "slice3_0 data mean= -17.9525 std= 12.1413\n",
      "slice3_1 data mean= -36.9857 std= 12.4537\n",
      "slice3_2 data mean= 43.3803 std= 15.7964\n",
      "slice4_0 data mean= 0.386496 std= 0.356185\n",
      "slice4_1 data mean= -1.2791 std= 0.432658\n",
      "slice4_2 data mean= 0.424507 std= 0.317013\n",
      "slice4_3 data mean= 0.746108 std= 0.546164\n",
      "slice5_0 data mean= 0.0121504 std= 0.00652192\n",
      "slice5_1 data mean= -0.00884431 std= 0.00688097\n",
      "slice5_2 data mean= -0.00156731 std= 0.00149094\n",
      "slice5_3 data mean= 0.00245507 std= 0.00526458\n",
      "slice5_4 data mean= -0.000156281 std= 0.00317304\n",
      "concat0 data mean= -1.63422 std= 12.759\n",
      "concat1 data mean= -18.4932 std= 20.1004\n",
      "concat2 data mean= 14.6011 std= 22.3016\n",
      "concat3 data mean= 0.374281 std= 0.536112\n",
      "concat0_score data mean= -1.60756 std= 4.27352\n",
      "concat1_score data mean= -18.3928 std= 5.56731\n",
      "concat2_score data mean= 14.5851 std= 5.26739\n",
      "concat3_score data mean= 0.374275 std= 0.274226\n",
      "concat4_score data mean= -0.000155779 std= 0.00317304\n",
      "concat_fuse data mean= -1.00822 std= 11.187\n",
      "fuse_loss data mean= 50933.5 std= 0.0\n",
      "----------------------gradient-------------------------------\n",
      "data diff mean= 0.0 std= 0.0\n",
      "label diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_0 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_1 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_2 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_3 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_4 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_0 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_1 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_2 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_3 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_4 diff mean= 0.0 std= 0.0\n",
      "conv1_1 diff mean= 0.000731529 std= 0.0119659\n",
      "conv1_2 diff mean= 8.63155e-05 std= 0.00556412\n",
      "pool1 diff mean= -0.000118018 std= 0.0122704\n",
      "conv2_1 diff mean= 0.000145647 std= 0.00319915\n",
      "conv2_2 diff mean= 0.00010837 std= 0.00281904\n",
      "conv2_2_relu2_2_0_split_0 diff mean= 8.60515e-06 std= 0.00347802\n",
      "conv2_2_relu2_2_0_split_1 diff mean= 5.22038e-05 std= 0.000996678\n",
      "pool2 diff mean= 3.40896e-05 std= 0.00692245\n",
      "conv3_1 diff mean= 0.000117065 std= 0.00270894\n",
      "conv3_2 diff mean= 6.53793e-05 std= 0.00244248\n",
      "conv3_3 diff mean= 0.000309723 std= 0.00273818\n",
      "conv3_3_relu3_3_0_split_0 diff mean= -3.72737e-06 std= 0.000222463\n",
      "conv3_3_relu3_3_0_split_1 diff mean= 0.00141641 std= 0.00595787\n",
      "pool3 diff mean= -1.47133e-05 std= 0.000441805\n",
      "conv4_1 diff mean= 6.12499e-06 std= 0.000278198\n",
      "conv4_2 diff mean= -3.1668e-06 std= 0.000488765\n",
      "conv4_3 diff mean= 3.30186e-05 std= 0.000963551\n",
      "conv4_3_relu4_3_0_split_0 diff mean= 1.03217e-06 std= 8.05396e-05\n",
      "conv4_3_relu4_3_0_split_1 diff mean= 0.000272077 std= 0.00262004\n",
      "pool4 diff mean= 4.1287e-06 std= 0.000161039\n",
      "conv5_1 diff mean= -4.51095e-06 std= 0.000157535\n",
      "conv5_2 diff mean= 3.34268e-06 std= 0.000272716\n",
      "conv5_3 diff mean= -2.58271e-05 std= 0.000396427\n",
      "score_dsn2 diff mean= -0.0162183 std= 0.312759\n",
      "upscore_dsn2 diff mean= -0.00398901 std= 0.0987336\n",
      "crop_dsn2 diff mean= -0.00788364 std= 0.138691\n",
      "crop_dsn2_crop_dsn2_0_split_0 diff mean= 2.40039e-10 std= 0.123094\n",
      "crop_dsn2_crop_dsn2_0_split_1 diff mean= -0.00788364 std= 0.0212278\n",
      "dsn2_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn3 diff mean= 0.0342176 std= 1.06179\n",
      "upscore_dsn3 diff mean= 0.00207064 std= 0.0950698\n",
      "crop_dsn3 diff mean= 0.00419861 std= 0.135343\n",
      "crop_dsn3_crop_dsn3_0_split_0 diff mean= -2.24036e-09 std= 0.101844\n",
      "crop_dsn3_crop_dsn3_0_split_1 diff mean= 0.00419861 std= 0.0410027\n",
      "dsn3_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn4 diff mean= 0.0548188 std= 2.60181\n",
      "upscore_dsn4 diff mean= 0.000803671 std= 0.0828835\n",
      "crop_dsn4 diff mean= 0.00170403 std= 0.120683\n",
      "crop_dsn4_crop_dsn4_0_split_0 diff mean= -6.00097e-10 std= 0.0894912\n",
      "crop_dsn4_crop_dsn4_0_split_1 diff mean= 0.00170403 std= 0.0440907\n",
      "dsn4_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn5 diff mean= -0.089045 std= 8.67992\n",
      "upscore_dsn5 diff mean= -0.000306838 std= 0.0905676\n",
      "crop_dsn5 diff mean= -0.000691986 std= 0.136008\n",
      "crop_dsn5_crop_dsn5_0_split_0 diff mean= -6.96113e-10 std= 0.0885888\n",
      "crop_dsn5_crop_dsn5_0_split_1 diff mean= -0.000691987 std= 0.0592047\n",
      "dsn5_loss diff mean= 1.0 std= 0.0\n",
      "slice2_0 diff mean= -0.012078 std= 0.0030401\n",
      "slice2_1 diff mean= -0.00368926 std= 0.0292714\n",
      "slice3_0 diff mean= -0.0120427 std= 0.00303121\n",
      "slice3_1 diff mean= -0.0036839 std= 0.0292289\n",
      "slice3_2 diff mean= 0.0283224 std= 0.0572038\n",
      "slice4_0 diff mean= -0.0121704 std= 0.00306335\n",
      "slice4_1 diff mean= -0.00370587 std= 0.0294032\n",
      "slice4_2 diff mean= 0.0283247 std= 0.0572086\n",
      "slice4_3 diff mean= -0.00563235 std= 0.0514291\n",
      "slice5_0 diff mean= -0.0121739 std= 0.00306423\n",
      "slice5_1 diff mean= -0.003707 std= 0.0294121\n",
      "slice5_2 diff mean= 0.0283251 std= 0.0572092\n",
      "slice5_3 diff mean= -0.00563246 std= 0.05143\n",
      "slice5_4 diff mean= -0.0102716 std= 0.0981553\n",
      "concat0 diff mean= -0.0121162 std= 0.00305029\n",
      "concat1 diff mean= -0.00369651 std= 0.029329\n",
      "concat2 diff mean= 0.0283241 std= 0.0572072\n",
      "concat3 diff mean= -0.00563241 std= 0.0514296\n",
      "concat0_score diff mean= -0.0486957 std= 0.012257\n",
      "concat1_score diff mean= -0.014828 std= 0.117648\n",
      "concat2_score diff mean= 0.0850602 std= 0.171799\n",
      "concat3_score diff mean= -0.0112649 std= 0.10286\n",
      "concat4_score diff mean= -0.0102716 std= 0.0981553\n",
      "concat_fuse diff mean= -6.62343e-10 std= 0.121474\n",
      "fuse_loss diff mean= 1.0 std= 0.0\n",
      "----------------------params-------------------------------\n",
      "conv1_1 weight mean= 0.000435923 std= 0.205815\n",
      "conv1_1 bias mean= 0.501233 std= 0.328407\n",
      "conv1_2 weight mean= 0.00460115 std= 0.0423029\n",
      "conv1_2 bias mean= 0.0585333 std= 0.334758\n",
      "conv2_1 weight mean= -0.000536942 std= 0.0321115\n",
      "conv2_1 bias mean= 0.110853 std= 0.122012\n",
      "conv2_2 weight mean= -0.00083533 std= 0.0234793\n",
      "conv2_2 bias mean= 0.0157581 std= 0.188925\n",
      "conv3_1 weight mean= -0.000463998 std= 0.0173659\n",
      "conv3_1 bias mean= 0.0171419 std= 0.0707179\n",
      "conv3_2 weight mean= -0.000386573 std= 0.0123431\n",
      "conv3_2 bias mean= 0.0357947 std= 0.0762482\n",
      "conv3_3 weight mean= -0.0011178 std= 0.0126328\n",
      "conv3_3 bias mean= 0.0261661 std= 0.0832684\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "conv4_1 weight mean= -0.000452549 std= 0.0100512\n",
      "conv4_1 bias mean= 0.0204377 std= 0.0537191\n",
      "conv4_2 weight mean= -0.000467025 std= 0.00762419\n",
      "conv4_2 bias mean= 0.0298601 std= 0.0440914\n",
      "conv4_3 weight mean= -0.00081328 std= 0.00795512\n",
      "conv4_3 bias mean= 0.0319182 std= 0.0680846\n",
      "conv5_1 weight mean= -0.000581908 std= 0.00869433\n",
      "conv5_1 bias mean= 0.0457248 std= 0.13133\n",
      "conv5_2 weight mean= -0.00074117 std= 0.0087608\n",
      "conv5_2 bias mean= 0.0498642 std= 0.212886\n",
      "conv5_3 weight mean= -0.00107738 std= 0.00847925\n",
      "conv5_3 bias mean= 0.149866 std= 0.492825\n",
      "score_dsn2 weight mean= -0.000493698 std= 0.00179098\n",
      "score_dsn2 bias mean= -2.02727e-06 std= 1.23628e-05\n",
      "upsample_2 weight mean= 0.125 std= 0.182217\n",
      "upsample_2 bias mean= 0.0 std= 0.0\n",
      "score_dsn3 weight mean= -0.000273404 std= 0.00378\n",
      "score_dsn3 bias mean= -4.79562e-06 std= 1.23636e-05\n",
      "upsample_4 weight mean= 0.0833333 std= 0.17013\n",
      "upsample_4 bias mean= 0.0 std= 0.0\n",
      "score_dsn4 weight mean= 2.13666e-05 std= 0.000667243\n",
      "score_dsn4 bias mean= 2.03873e-07 std= 2.55234e-05\n",
      "upsample_8 weight mean= 0.0625 std= 0.153802\n",
      "upsample_8 bias mean= 0.0 std= 0.0\n",
      "score_dsn5 weight mean= 3.99488e-06 std= 6.76884e-05\n",
      "score_dsn5 bias mean= 3.496e-06 std= 5.4871e-05\n",
      "upsample_16 weight mean= 0.05 std= 0.140281\n",
      "upsample_16 bias mean= 0.0 std= 0.0\n",
      "cat0_score weight mean= 0.247605 std= 0.00269863\n",
      "cat0_score bias mean= 2.3415e-06 std= 0.0\n",
      "cat1_score weight mean= 0.248391 std= 0.00155658\n",
      "cat1_score bias mean= -3.93627e-06 std= 0.0\n",
      "cat2_score weight mean= 0.332621 std= 0.000523321\n",
      "cat2_score bias mean= -3.09142e-06 std= 0.0\n",
      "cat3_score weight mean= 0.500003 std= 3.487e-06\n",
      "cat3_score bias mean= 3.0201e-06 std= 0.0\n",
      "cat4_score weight mean= 1.0 std= 0.0\n",
      "cat4_score bias mean= 1.66609e-06 std= 0.0\n",
      "----------------------param-diff-------------------------------\n",
      "conv1_1 mean= -0.00245112 std= 0.00489976\n",
      "conv1_2 mean= 0.000218139 std= 0.000868276\n",
      "conv2_1 mean= 0.000513945 std= 0.00120269\n",
      "conv2_2 mean= 0.000418324 std= 0.0013382\n",
      "conv3_1 mean= 0.000221799 std= 0.00115777\n",
      "conv3_2 mean= 9.91603e-05 std= 0.00091802\n",
      "conv3_3 mean= 0.000328166 std= 0.000799777\n",
      "conv4_1 mean= 1.57042e-06 std= 1.37637e-05\n",
      "conv4_2 mean= -2.26601e-07 std= 1.22435e-05\n",
      "conv4_3 mean= 2.34078e-06 std= 1.01993e-05\n",
      "conv5_1 mean= -2.06214e-06 std= 2.93479e-05\n",
      "conv5_2 mean= 5.22795e-07 std= 2.7155e-05\n",
      "conv5_3 mean= -3.23659e-06 std= 2.12457e-05\n",
      "score_dsn2 mean= 7.49718e-06 std= 0.00110523\n",
      "upsample_2 mean= 0.0 std= 0.0\n",
      "score_dsn3 mean= 0.000176867 std= 0.00229227\n",
      "upsample_4 mean= 0.0 std= 0.0\n",
      "score_dsn4 mean= -6.35516e-06 std= 0.000265697\n",
      "upsample_8 mean= 0.0 std= 0.0\n",
      "score_dsn5 mean= -1.82332e-06 std= 2.61318e-05\n",
      "upsample_16 mean= 0.0 std= 0.0\n",
      "cat0_score mean= 0.0012102 std= 0.00161503\n",
      "cat1_score mean= 0.000901352 std= 0.000875852\n",
      "cat2_score mean= 0.00036686 std= 0.000509474\n",
      "cat3_score mean= -8.28686e-06 std= 8.20952e-06\n",
      "cat4_score mean= -8.81165e-08 std= 0.0\n"
     ]
    }
   ],
   "source": [
    "print '----------------------output-------------------------------'\n",
    "for b in solver.net.blobs:\n",
    "    print b, 'data mean=', solver.net.blobs[b].data.mean(), 'std=', solver.net.blobs[b].data.std()\n",
    "    \n",
    "\n",
    "print '----------------------gradient-------------------------------'\n",
    "for b in solver.net.blobs:\n",
    "    print b, 'diff mean=', solver.net.blobs[b].diff.mean(), 'std=', solver.net.blobs[b].diff.std()\n",
    "\n",
    "\n",
    "print '----------------------params-------------------------------'\n",
    "for p in solver.net.params:\n",
    "    print p, 'weight mean=', solver.net.params[p][0].data.mean(), 'std=', solver.net.params[p][0].data.std()\n",
    "    if len(solver.net.params) > 1:\n",
    "        print p, 'bias mean=', solver.net.params[p][1].data.mean(), 'std=', solver.net.params[p][1].data.std()\n",
    "\n",
    "        \n",
    "print '----------------------param-diff-------------------------------'\n",
    "for p in solver.net.params:\n",
    "    print p, 'mean=', solver.net.params[p][0].diff.mean(), 'std=', solver.net.params[p][0].diff.std()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 5th step"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 11,
   "metadata": {},
   "outputs": [],
   "source": [
    "solver.step(1)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 12,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "----------------------output-------------------------------\n",
      "data data mean= -16.9641 std= 56.7023\n",
      "label data mean= 0.0902484 std= 0.438551\n",
      "data_data_0_split_0 data mean= -16.9641 std= 56.7023\n",
      "data_data_0_split_1 data mean= -16.9641 std= 56.7023\n",
      "data_data_0_split_2 data mean= -16.9641 std= 56.7023\n",
      "data_data_0_split_3 data mean= -16.9641 std= 56.7023\n",
      "data_data_0_split_4 data mean= -16.9641 std= 56.7023\n",
      "label_data_1_split_0 data mean= 0.0902484 std= 0.438551\n",
      "label_data_1_split_1 data mean= 0.0902484 std= 0.438551\n",
      "label_data_1_split_2 data mean= 0.0902484 std= 0.438551\n",
      "label_data_1_split_3 data mean= 0.0902484 std= 0.438551\n",
      "label_data_1_split_4 data mean= 0.0902484 std= 0.438551\n",
      "conv1_1 data mean= 10.0002 std= 28.7214\n",
      "conv1_2 data mean= 49.904 std= 121.8\n",
      "pool1 data mean= 70.5571 std= 150.694\n",
      "conv2_1 data mean= 73.1146 std= 187.039\n",
      "conv2_2 data mean= 76.6251 std= 245.678\n",
      "conv2_2_relu2_2_0_split_0 data mean= 76.6251 std= 245.678\n",
      "conv2_2_relu2_2_0_split_1 data mean= 76.6251 std= 245.678\n",
      "pool2 data mean= 126.229 std= 331.161\n",
      "conv3_1 data mean= 109.506 std= 313.211\n",
      "conv3_2 data mean= 113.342 std= 403.314\n",
      "conv3_3 data mean= 41.1505 std= 259.214\n",
      "conv3_3_relu3_3_0_split_0 data mean= 41.1505 std= 259.214\n",
      "conv3_3_relu3_3_0_split_1 data mean= 41.1505 std= 259.214\n",
      "pool3 data mean= 52.1171 std= 293.595\n",
      "conv4_1 data mean= 52.133 std= 142.965\n",
      "conv4_2 data mean= 17.6792 std= 57.6909\n",
      "conv4_3 data mean= 3.38689 std= 17.1527\n",
      "conv4_3_relu4_3_0_split_0 data mean= 3.38689 std= 17.1527\n",
      "conv4_3_relu4_3_0_split_1 data mean= 3.38689 std= 17.1527\n",
      "pool4 data mean= 4.81122 std= 20.2566\n",
      "conv5_1 data mean= 2.93741 std= 8.70166\n",
      "conv5_2 data mean= 0.885994 std= 3.0925\n",
      "conv5_3 data mean= 0.0975706 std= 0.631531\n",
      "score_dsn2 data mean= -5.00384 std= 10.9672\n",
      "upscore_dsn2 data mean= -4.90979 std= 10.4222\n",
      "crop_dsn2 data mean= -9.83928 std= 13.6374\n",
      "crop_dsn2_crop_dsn2_0_split_0 data mean= -9.83928 std= 13.6374\n",
      "crop_dsn2_crop_dsn2_0_split_1 data mean= -9.83928 std= 13.6374\n",
      "dsn2_loss data mean= 5056.63 std= 0.0\n",
      "score_dsn3 data mean= -7.93881 std= 68.8149\n",
      "upscore_dsn3 data mean= -7.64654 std= 67.3469\n",
      "crop_dsn3 data mean= -15.089 std= 98.4724\n",
      "crop_dsn3_crop_dsn3_0_split_0 data mean= -15.089 std= 98.4724\n",
      "crop_dsn3_crop_dsn3_0_split_1 data mean= -15.089 std= 98.4724\n",
      "dsn3_loss data mean= 39654.0 std= 0.0\n",
      "score_dsn4 data mean= 0.00449749 std= 0.498601\n",
      "upscore_dsn4 data mean= 0.00417542 std= 0.46966\n",
      "crop_dsn4 data mean= -0.00433315 std= 0.571275\n",
      "crop_dsn4_crop_dsn4_0_split_0 data mean= -0.00433315 std= 0.571275\n",
      "crop_dsn4_crop_dsn4_0_split_1 data mean= -0.00433315 std= 0.571275\n",
      "dsn4_loss data mean= 2526.53 std= 0.0\n",
      "score_dsn5 data mean= 0.000135682 std= 0.0036746\n",
      "upscore_dsn5 data mean= 0.000117465 std= 0.00318094\n",
      "crop_dsn5 data mean= 9.78691e-05 std= 0.00328907\n",
      "crop_dsn5_crop_dsn5_0_split_0 data mean= 9.78691e-05 std= 0.00328907\n",
      "crop_dsn5_crop_dsn5_0_split_1 data mean= 9.78691e-05 std= 0.00328907\n",
      "dsn5_loss data mean= 2951.92 std= 0.0\n",
      "slice2_0 data mean= -17.967 std= 12.6668\n",
      "slice2_1 data mean= -1.7116 std= 8.91017\n",
      "slice3_0 data mean= 54.6845 std= 18.8813\n",
      "slice3_1 data mean= 45.505 std= 17.9221\n",
      "slice3_2 data mean= -145.457 std= 53.638\n",
      "slice4_0 data mean= 0.858512 std= 0.222545\n",
      "slice4_1 data mean= -0.389487 std= 0.130368\n",
      "slice4_2 data mean= -0.555969 std= 0.158521\n",
      "slice4_3 data mean= 0.0696123 std= 0.105609\n",
      "slice5_0 data mean= 0.00646299 std= 0.00151912\n",
      "slice5_1 data mean= -0.00182028 std= 0.000559246\n",
      "slice5_2 data mean= -0.00136019 std= 0.000467718\n",
      "slice5_3 data mean= -0.00134339 std= 0.000436099\n",
      "slice5_4 data mean= -0.00144978 std= 0.000517781\n",
      "concat0 data mean= 9.39562 std= 29.4866\n",
      "concat1 data mean= 10.8505 std= 22.38\n",
      "concat2 data mean= -48.6713 std= 75.1184\n",
      "concat3 data mean= 0.0341344 std= 0.0826767\n",
      "concat0_score data mean= 9.0831 std= 3.84942\n",
      "concat1_score data mean= 10.698 std= 5.14534\n",
      "concat2_score data mean= -48.4599 std= 17.8389\n",
      "concat3_score data mean= 0.0341379 std= 0.0527745\n",
      "concat4_score data mean= -0.00144812 std= 0.000517781\n",
      "concat_fuse data mean= -5.72922 std= 23.4125\n",
      "fuse_loss data mean= 40873.9 std= 0.0\n",
      "----------------------gradient-------------------------------\n",
      "data diff mean= 0.0 std= 0.0\n",
      "label diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_0 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_1 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_2 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_3 diff mean= 0.0 std= 0.0\n",
      "data_data_0_split_4 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_0 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_1 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_2 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_3 diff mean= 0.0 std= 0.0\n",
      "label_data_1_split_4 diff mean= 0.0 std= 0.0\n",
      "conv1_1 diff mean= 0.000462074 std= 0.00777924\n",
      "conv1_2 diff mean= 3.73749e-05 std= 0.00422044\n",
      "pool1 diff mean= 5.70776e-05 std= 0.00945\n",
      "conv2_1 diff mean= 0.000171282 std= 0.00260547\n",
      "conv2_2 diff mean= 0.000121941 std= 0.00258865\n",
      "conv2_2_relu2_2_0_split_0 diff mean= 9.58983e-05 std= 0.00368457\n",
      "conv2_2_relu2_2_0_split_1 diff mean= -1.14937e-05 std= 0.000366614\n",
      "pool2 diff mean= 0.000379234 std= 0.00731981\n",
      "conv3_1 diff mean= 0.000219887 std= 0.00270696\n",
      "conv3_2 diff mean= 0.000112336 std= 0.00217149\n",
      "conv3_3 diff mean= 7.34386e-05 std= 0.00319241\n",
      "conv3_3_relu3_3_0_split_0 diff mean= 6.8289e-07 std= 0.000151217\n",
      "conv3_3_relu3_3_0_split_1 diff mean= -0.00042842 std= 0.00860832\n",
      "pool3 diff mean= 2.73156e-06 std= 0.000302424\n",
      "conv4_1 diff mean= 1.78309e-07 std= 0.000174382\n",
      "conv4_2 diff mean= 2.04437e-07 std= 0.000299827\n",
      "conv4_3 diff mean= -2.32527e-06 std= 0.000811387\n",
      "conv4_3_relu4_3_0_split_0 diff mean= 3.49875e-07 std= 2.38439e-05\n",
      "conv4_3_relu4_3_0_split_1 diff mean= -0.000177079 std= 0.00372651\n",
      "pool4 diff mean= 1.35834e-06 std= 4.69666e-05\n",
      "conv5_1 diff mean= -1.47784e-06 std= 4.12788e-05\n",
      "conv5_2 diff mean= 1.52465e-06 std= 8.10692e-05\n",
      "conv5_3 diff mean= -1.51159e-05 std= 0.000257633\n",
      "score_dsn2 diff mean= 0.00695975 std= 0.111181\n",
      "upscore_dsn2 diff mean= 0.00170723 std= 0.0387924\n",
      "crop_dsn2 diff mean= 0.00384703 std= 0.0581615\n",
      "crop_dsn2_crop_dsn2_0_split_0 diff mean= -2.18038e-10 std= 0.0376752\n",
      "crop_dsn2_crop_dsn2_0_split_1 diff mean= 0.00384703 std= 0.0322208\n",
      "dsn2_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn3 diff mean= 0.00223425 std= 1.00635\n",
      "upscore_dsn3 diff mean= 0.0001345 std= 0.109589\n",
      "crop_dsn3 diff mean= 0.000312296 std= 0.166989\n",
      "crop_dsn3_crop_dsn3_0_split_0 diff mean= -4.89629e-10 std= 0.142553\n",
      "crop_dsn3_crop_dsn3_0_split_1 diff mean= 0.000312297 std= 0.0375771\n",
      "dsn3_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn4 diff mean= -0.0313156 std= 2.33063\n",
      "upscore_dsn4 diff mean= -0.000454266 std= 0.0907029\n",
      "crop_dsn4 diff mean= -0.0010943 std= 0.140775\n",
      "crop_dsn4_crop_dsn4_0_split_0 diff mean= -2.52465e-10 std= 0.108832\n",
      "crop_dsn4_crop_dsn4_0_split_1 diff mean= -0.0010943 std= 0.0414187\n",
      "dsn4_loss diff mean= 1.0 std= 0.0\n",
      "score_dsn5 diff mean= -0.096769 std= 5.87843\n",
      "upscore_dsn5 diff mean= -0.000327253 std= 0.0703181\n",
      "crop_dsn5 diff mean= -0.000870995 std= 0.114716\n",
      "crop_dsn5_crop_dsn5_0_split_0 diff mean= 0.0 std= 0.0841276\n",
      "crop_dsn5_crop_dsn5_0_split_1 diff mean= -0.000870995 std= 0.0370553\n",
      "dsn5_loss diff mean= 1.0 std= 0.0\n",
      "slice2_0 diff mean= -0.00436179 std= 0.0186172\n",
      "slice2_1 diff mean= 0.0120558 std= 0.0399374\n",
      "slice3_0 diff mean= -0.00429441 std= 0.0183296\n",
      "slice3_1 diff mean= 0.0120256 std= 0.0398372\n",
      "slice3_2 diff mean= -0.00679429 std= 0.0458718\n",
      "slice4_0 diff mean= -0.00440953 std= 0.0188209\n",
      "slice4_1 diff mean= 0.0121876 std= 0.040374\n",
      "slice4_2 diff mean= -0.00681684 std= 0.046024\n",
      "slice4_3 diff mean= -0.00533845 std= 0.0502133\n",
      "slice5_0 diff mean= -0.00441158 std= 0.0188297\n",
      "slice5_1 diff mean= 0.0121943 std= 0.0403962\n",
      "slice5_2 diff mean= -0.00681719 std= 0.0460264\n",
      "slice5_3 diff mean= -0.00533837 std= 0.0502126\n",
      "slice5_4 diff mean= 1.7835e-05 std= 4.63757e-05\n",
      "concat0 diff mean= -0.00436933 std= 0.0186505\n",
      "concat1 diff mean= 0.0121158 std= 0.040137\n",
      "concat2 diff mean= -0.00680944 std= 0.0459741\n",
      "concat3 diff mean= -0.00533841 std= 0.050213\n",
      "concat0_score diff mean= -0.0176463 std= 0.0753188\n",
      "concat1_score diff mean= 0.0487773 std= 0.161585\n",
      "concat2_score diff mean= -0.020472 std= 0.138217\n",
      "concat3_score diff mean= -0.0106767 std= 0.100425\n",
      "concat4_score diff mean= 1.7835e-05 std= 4.63757e-05\n",
      "concat_fuse diff mean= -5.59027e-10 std= 0.11331\n",
      "fuse_loss diff mean= 1.0 std= 0.0\n",
      "----------------------params-------------------------------\n",
      "conv1_1 weight mean= 0.00235337 std= 0.204881\n",
      "conv1_1 bias mean= 0.501084 std= 0.328335\n",
      "conv1_2 weight mean= 0.00433964 std= 0.0421059\n",
      "conv1_2 bias mean= 0.0585158 std= 0.334731\n",
      "conv2_1 weight mean= -0.001384 std= 0.032009\n",
      "conv2_1 bias mean= 0.110844 std= 0.122008\n",
      "conv2_2 weight mean= -0.00148957 std= 0.0234545\n",
      "conv2_2 bias mean= 0.0157517 std= 0.188925\n",
      "conv3_1 weight mean= -0.000884818 std= 0.0174017\n",
      "conv3_1 bias mean= 0.0171394 std= 0.0707178\n",
      "conv3_2 weight mean= -0.000565795 std= 0.0123955\n",
      "conv3_2 bias mean= 0.0357933 std= 0.0762483\n",
      "conv3_3 weight mean= -0.00147277 std= 0.0126821\n",
      "conv3_3 bias mean= 0.0261629 std= 0.0832679\n",
      "conv4_1 weight mean= -0.000454035 std= 0.0100509\n",
      "conv4_1 bias mean= 0.0204377 std= 0.0537191\n",
      "conv4_2 weight mean= -0.000466825 std= 0.00762411\n",
      "conv4_2 bias mean= 0.0298601 std= 0.0440914\n",
      "conv4_3 weight mean= -0.000815425 std= 0.0079548\n",
      "conv4_3 bias mean= 0.0319181 std= 0.0680846\n",
      "conv5_1 weight mean= -0.000579931 std= 0.00869474\n",
      "conv5_1 bias mean= 0.0457251 std= 0.131331\n",
      "conv5_2 weight mean= -0.000741724 std= 0.008761\n",
      "conv5_2 bias mean= 0.049864 std= 0.212888\n",
      "conv5_3 weight mean= -0.00107425 std= 0.00847987\n",
      "conv5_3 bias mean= 0.149868 std= 0.49283\n",
      "score_dsn2 weight mean= -0.00067402 std= 0.00218196\n",
      "score_dsn2 bias mean= -2.35642e-06 std= 1.67417e-05\n",
      "upsample_2 weight mean= 0.125 std= 0.182217\n",
      "upsample_2 bias mean= 0.0 std= 0.0\n",
      "score_dsn3 weight mean= -0.000438969 std= 0.0052449\n",
      "score_dsn3 bias mean= -8.25637e-06 std= 1.70669e-05\n",
      "upsample_4 weight mean= 0.0833333 std= 0.17013\n",
      "upsample_4 bias mean= 0.0 std= 0.0\n",
      "score_dsn4 weight mean= 2.81747e-05 std= 0.000895352\n",
      "score_dsn4 bias mean= 2.65609e-07 std= 3.64222e-05\n",
      "upsample_8 weight mean= 0.0625 std= 0.153802\n",
      "upsample_8 bias mean= 0.0 std= 0.0\n",
      "score_dsn5 weight mean= 5.64941e-06 std= 9.01782e-05\n",
      "score_dsn5 bias mean= 5.63931e-06 std= 8.44674e-05\n",
      "upsample_16 weight mean= 0.05 std= 0.140281\n",
      "upsample_16 bias mean= 0.0 std= 0.0\n",
      "cat0_score weight mean= 0.246629 std= 0.00376214\n",
      "cat0_score bias mean= 4.55522e-06 std= 0.0\n",
      "cat1_score weight mean= 0.246781 std= 0.00338722\n",
      "cat1_score bias mean= -6.40284e-06 std= 0.0\n",
      "cat2_score weight mean= 0.331995 std= 0.00139886\n",
      "cat2_score bias mean= -5.99573e-06 std= 0.0\n",
      "cat3_score weight mean= 0.500011 std= 1.09076e-05\n",
      "cat3_score bias mean= 5.1304e-06 std= 0.0\n",
      "cat4_score weight mean= 1.0 std= 0.0\n",
      "cat4_score bias mean= 2.71295e-06 std= 0.0\n",
      "----------------------param-diff-------------------------------\n",
      "conv1_1 mean= -0.00191745 std= 0.00472567\n",
      "conv1_2 mean= 0.000261507 std= 0.000991195\n",
      "conv2_1 mean= 0.000847062 std= 0.00127975\n",
      "conv2_2 mean= 0.000654241 std= 0.00123758\n",
      "conv3_1 mean= 0.00042082 std= 0.00114621\n",
      "conv3_2 mean= 0.000179222 std= 0.00100574\n",
      "conv3_3 mean= 0.000354969 std= 0.00135177\n",
      "conv4_1 mean= 1.48684e-06 std= 1.516e-05\n",
      "conv4_2 mean= -1.99621e-07 std= 1.30247e-05\n"
     ]
    },
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "conv4_3 mean= 2.14515e-06 std= 1.04782e-05\n",
      "conv5_1 mean= -1.97709e-06 std= 2.77073e-05\n",
      "conv5_2 mean= 5.54248e-07 std= 2.57174e-05\n",
      "conv5_3 mean= -3.13185e-06 std= 2.07499e-05\n",
      "score_dsn2 mean= 0.000180322 std= 0.000829279\n",
      "upsample_2 mean= 0.0 std= 0.0\n",
      "score_dsn3 mean= 0.000165565 std= 0.0021929\n",
      "upsample_4 mean= 0.0 std= 0.0\n",
      "score_dsn4 mean= -6.8081e-06 std= 0.000241789\n",
      "upsample_8 mean= 0.0 std= 0.0\n",
      "score_dsn5 mean= -1.65453e-06 std= 2.38796e-05\n",
      "upsample_16 mean= 0.0 std= 0.0\n",
      "cat0_score mean= 0.000976048 std= 0.00106612\n",
      "cat1_score mean= 0.0016098 std= 0.00191737\n",
      "cat2_score mean= 0.000626527 std= 0.000875546\n",
      "cat3_score mean= -7.48085e-06 std= 7.42747e-06\n",
      "cat4_score mean= -7.93143e-08 std= 0.0\n"
     ]
    }
   ],
   "source": [
    "print '----------------------output-------------------------------'\n",
    "for b in solver.net.blobs:\n",
    "    print b, 'data mean=', solver.net.blobs[b].data.mean(), 'std=', solver.net.blobs[b].data.std()\n",
    "    \n",
    "\n",
    "print '----------------------gradient-------------------------------'\n",
    "for b in solver.net.blobs:\n",
    "    print b, 'diff mean=', solver.net.blobs[b].diff.mean(), 'std=', solver.net.blobs[b].diff.std()\n",
    "\n",
    "\n",
    "print '----------------------params-------------------------------'\n",
    "for p in solver.net.params:\n",
    "    print p, 'weight mean=', solver.net.params[p][0].data.mean(), 'std=', solver.net.params[p][0].data.std()\n",
    "    if len(solver.net.params) > 1:\n",
    "        print p, 'bias mean=', solver.net.params[p][1].data.mean(), 'std=', solver.net.params[p][1].data.std()\n",
    "\n",
    "        \n",
    "print '----------------------param-diff-------------------------------'\n",
    "for p in solver.net.params:\n",
    "    print p, 'mean=', solver.net.params[p][0].diff.mean(), 'std=', solver.net.params[p][0].diff.std()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 2",
   "language": "python",
   "name": "python2"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 2
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython2",
   "version": "2.7.6"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}

## fsds_solver.pt
base_lr: 9.99999997475e-07
display: 10
max_iter: 15000
lr_policy: "step"
gamma: 0.10000000149
momentum: 0.899999976158
weight_decay: 0.000199999994948
stepsize: 5000
snapshot: 1000
snapshot_prefix: "snapshot/fsds"
random_seed: 831486
debug_info: false
net: "model/fsds_train.pt"
iter_size: 1
type: "SGD"

## fsds_train.pt
layer {
  name: "data"
  type: "Python"
  top: "data"
  top: "label"
  python_param {
    module: "pylayer"
    layer: "FSDSDataLayer"
    param_str: "{\'shuffle\': False, \'source\': \'list_shuffled.txt\', \'phase\': \'train\', \'ignore_label\': -1, \'root\': \'data/SK-LARGE/\', \'mean\': (104.00699, 116.66877, 122.67892)}"
  }
}
layer {
  name: "conv1_1"
  type: "Convolution"
  bottom: "data"
  top: "conv1_1"
  param {
    lr_mult: 1.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 2.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 64
    pad: 35
    kernel_size: 3
  }
}
layer {
  name: "relu1_1"
  type: "ReLU"
  bottom: "conv1_1"
  top: "conv1_1"
}
layer {
  name: "conv1_2"
  type: "Convolution"
  bottom: "conv1_1"
  top: "conv1_2"
  param {
    lr_mult: 1.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 2.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 64
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu1_2"
  type: "ReLU"
  bottom: "conv1_2"
  top: "conv1_2"
}
layer {
  name: "pool1"
  type: "Pooling"
  bottom: "conv1_2"
  top: "pool1"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "conv2_1"
  type: "Convolution"
  bottom: "pool1"
  top: "conv2_1"
  param {
    lr_mult: 1.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 2.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 128
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu2_1"
  type: "ReLU"
  bottom: "conv2_1"
  top: "conv2_1"
}
layer {
  name: "conv2_2"
  type: "Convolution"
  bottom: "conv2_1"
  top: "conv2_2"
  param {
    lr_mult: 1.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 2.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 128
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu2_2"
  type: "ReLU"
  bottom: "conv2_2"
  top: "conv2_2"
}
layer {
  name: "pool2"
  type: "Pooling"
  bottom: "conv2_2"
  top: "pool2"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "conv3_1"
  type: "Convolution"
  bottom: "pool2"
  top: "conv3_1"
  param {
    lr_mult: 1.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 2.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 256
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu3_1"
  type: "ReLU"
  bottom: "conv3_1"
  top: "conv3_1"
}
layer {
  name: "conv3_2"
  type: "Convolution"
  bottom: "conv3_1"
  top: "conv3_2"
  param {
    lr_mult: 1.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 2.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 256
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu3_2"
  type: "ReLU"
  bottom: "conv3_2"
  top: "conv3_2"
}
layer {
  name: "conv3_3"
  type: "Convolution"
  bottom: "conv3_2"
  top: "conv3_3"
  param {
    lr_mult: 1.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 2.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 256
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu3_3"
  type: "ReLU"
  bottom: "conv3_3"
  top: "conv3_3"
}
layer {
  name: "pool3"
  type: "Pooling"
  bottom: "conv3_3"
  top: "pool3"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "conv4_1"
  type: "Convolution"
  bottom: "pool3"
  top: "conv4_1"
  param {
    lr_mult: 1.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 2.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 512
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu4_1"
  type: "ReLU"
  bottom: "conv4_1"
  top: "conv4_1"
}
layer {
  name: "conv4_2"
  type: "Convolution"
  bottom: "conv4_1"
  top: "conv4_2"
  param {
    lr_mult: 1.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 2.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 512
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu4_2"
  type: "ReLU"
  bottom: "conv4_2"
  top: "conv4_2"
}
layer {
  name: "conv4_3"
  type: "Convolution"
  bottom: "conv4_2"
  top: "conv4_3"
  param {
    lr_mult: 1.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 2.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 512
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu4_3"
  type: "ReLU"
  bottom: "conv4_3"
  top: "conv4_3"
}
layer {
  name: "pool4"
  type: "Pooling"
  bottom: "conv4_3"
  top: "pool4"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "conv5_1"
  type: "Convolution"
  bottom: "pool4"
  top: "conv5_1"
  param {
    lr_mult: 100.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 200.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 512
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu5_1"
  type: "ReLU"
  bottom: "conv5_1"
  top: "conv5_1"
}
layer {
  name: "conv5_2"
  type: "Convolution"
  bottom: "conv5_1"
  top: "conv5_2"
  param {
    lr_mult: 100.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 200.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 512
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu5_2"
  type: "ReLU"
  bottom: "conv5_2"
  top: "conv5_2"
}
layer {
  name: "conv5_3"
  type: "Convolution"
  bottom: "conv5_2"
  top: "conv5_3"
  param {
    lr_mult: 100.0
    decay_mult: 1.0
  }
  param {
    lr_mult: 200.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 512
    pad: 1
    kernel_size: 3
  }
}
layer {
  name: "relu5_3"
  type: "ReLU"
  bottom: "conv5_3"
  top: "conv5_3"
}
layer {
  name: "score_dsn2"
  type: "Convolution"
  bottom: "conv2_2"
  top: "score_dsn2"
  param {
    lr_mult: 0.00999999977648
    decay_mult: 1.0
  }
  param {
    lr_mult: 0.019999999553
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 2
    kernel_size: 1
    weight_filler {
      type: "constant"
      value: 0.0
    }
  }
}
layer {
  name: "upsample_2"
  type: "Deconvolution"
  bottom: "score_dsn2"
  top: "upscore_dsn2"
  param {
    lr_mult: 0.0
    decay_mult: 0.0
  }
  param {
    lr_mult: 0.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 2
    kernel_size: 4
    stride: 2
  }
}
layer {
  name: "crop_dsn2"
  type: "Crop"
  bottom: "upscore_dsn2"
  bottom: "data"
  top: "crop_dsn2"
  crop_param {
    axis: 2
    offset: 35
  }
}
layer {
  name: "loss2"
  type: "BalanceSoftmaxWithLoss"
  bottom: "crop_dsn2"
  bottom: "label"
  top: "dsn2_loss"
  loss_param {
    ignore_label: -1
    normalize: false
  }
}
layer {
  name: "score_dsn3"
  type: "Convolution"
  bottom: "conv3_3"
  top: "score_dsn3"
  param {
    lr_mult: 0.00999999977648
    decay_mult: 1.0
  }
  param {
    lr_mult: 0.019999999553
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 3
    kernel_size: 1
    weight_filler {
      type: "constant"
      value: 0.0
    }
  }
}
layer {
  name: "upsample_4"
  type: "Deconvolution"
  bottom: "score_dsn3"
  top: "upscore_dsn3"
  param {
    lr_mult: 0.0
    decay_mult: 0.0
  }
  param {
    lr_mult: 0.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 3
    kernel_size: 8
    stride: 4
  }
}
layer {
  name: "crop_dsn3"
  type: "Crop"
  bottom: "upscore_dsn3"
  bottom: "data"
  top: "crop_dsn3"
  crop_param {
    axis: 2
    offset: 36
  }
}
layer {
  name: "loss3"
  type: "BalanceSoftmaxWithLoss"
  bottom: "crop_dsn3"
  bottom: "label"
  top: "dsn3_loss"
  loss_param {
    ignore_label: -1
    normalize: false
  }
}
layer {
  name: "score_dsn4"
  type: "Convolution"
  bottom: "conv4_3"
  top: "score_dsn4"
  param {
    lr_mult: 0.00999999977648
    decay_mult: 1.0
  }
  param {
    lr_mult: 0.019999999553
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 4
    kernel_size: 1
    weight_filler {
      type: "constant"
      value: 0.0
    }
  }
}
layer {
  name: "upsample_8"
  type: "Deconvolution"
  bottom: "score_dsn4"
  top: "upscore_dsn4"
  param {
    lr_mult: 0.0
    decay_mult: 0.0
  }
  param {
    lr_mult: 0.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 4
    kernel_size: 16
    stride: 8
  }
}
layer {
  name: "crop_dsn4"
  type: "Crop"
  bottom: "upscore_dsn4"
  bottom: "data"
  top: "crop_dsn4"
  crop_param {
    axis: 2
    offset: 38
  }
}
layer {
  name: "loss4"
  type: "BalanceSoftmaxWithLoss"
  bottom: "crop_dsn4"
  bottom: "label"
  top: "dsn4_loss"
  loss_param {
    ignore_label: -1
    normalize: false
  }
}
layer {
  name: "score_dsn5"
  type: "Convolution"
  bottom: "conv5_3"
  top: "score_dsn5"
  param {
    lr_mult: 0.00999999977648
    decay_mult: 1.0
  }
  param {
    lr_mult: 0.019999999553
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 5
    kernel_size: 1
    weight_filler {
      type: "constant"
      value: 0.0
    }
  }
}
layer {
  name: "upsample_16"
  type: "Deconvolution"
  bottom: "score_dsn5"
  top: "upscore_dsn5"
  param {
    lr_mult: 0.0
    decay_mult: 0.0
  }
  param {
    lr_mult: 0.0
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 5
    kernel_size: 32
    stride: 16
  }
}
layer {
  name: "crop_dsn5"
  type: "Crop"
  bottom: "upscore_dsn5"
  bottom: "data"
  top: "crop_dsn5"
  crop_param {
    axis: 2
    offset: 42
  }
}
layer {
  name: "loss5"
  type: "BalanceSoftmaxWithLoss"
  bottom: "crop_dsn5"
  bottom: "label"
  top: "dsn5_loss"
  loss_param {
    ignore_label: -1
    normalize: false
  }
}
layer {
  name: "slice2"
  type: "Slice"
  bottom: "crop_dsn2"
  top: "slice2_0"
  top: "slice2_1"
  slice_param {
    slice_point: 1
    axis: 1
  }
}
layer {
  name: "slice3"
  type: "Slice"
  bottom: "crop_dsn3"
  top: "slice3_0"
  top: "slice3_1"
  top: "slice3_2"
  slice_param {
    slice_point: 1
    slice_point: 2
    axis: 1
  }
}
layer {
  name: "slice4"
  type: "Slice"
  bottom: "crop_dsn4"
  top: "slice4_0"
  top: "slice4_1"
  top: "slice4_2"
  top: "slice4_3"
  slice_param {
    slice_point: 1
    slice_point: 2
    slice_point: 3
    axis: 1
  }
}
layer {
  name: "slice5"
  type: "Slice"
  bottom: "crop_dsn5"
  top: "slice5_0"
  top: "slice5_1"
  top: "slice5_2"
  top: "slice5_3"
  top: "slice5_4"
  slice_param {
    slice_point: 1
    slice_point: 2
    slice_point: 3
    slice_point: 4
    axis: 1
  }
}
layer {
  name: "concat0"
  type: "Concat"
  bottom: "slice2_0"
  bottom: "slice3_0"
  bottom: "slice4_0"
  bottom: "slice5_0"
  top: "concat0"
  concat_param {
    concat_dim: 1
  }
}
layer {
  name: "concat1"
  type: "Concat"
  bottom: "slice2_1"
  bottom: "slice3_1"
  bottom: "slice4_1"
  bottom: "slice5_1"
  top: "concat1"
  concat_param {
    concat_dim: 1
  }
}
layer {
  name: "concat2"
  type: "Concat"
  bottom: "slice3_2"
  bottom: "slice4_2"
  bottom: "slice5_2"
  top: "concat2"
  concat_param {
    concat_dim: 1
  }
}
layer {
  name: "concat3"
  type: "Concat"
  bottom: "slice4_3"
  bottom: "slice5_3"
  top: "concat3"
  concat_param {
    concat_dim: 1
  }
}
layer {
  name: "cat0_score"
  type: "Convolution"
  bottom: "concat0"
  top: "concat0_score"
  param {
    lr_mult: 0.0500000007451
    decay_mult: 1.0
  }
  param {
    lr_mult: 0.00200000009499
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 1
    kernel_size: 1
    weight_filler {
      type: "constant"
      value: 0.25
    }
  }
}
layer {
  name: "cat1_score"
  type: "Convolution"
  bottom: "concat1"
  top: "concat1_score"
  param {
    lr_mult: 0.0500000007451
    decay_mult: 1.0
  }
  param {
    lr_mult: 0.00200000009499
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 1
    kernel_size: 1
    weight_filler {
      type: "constant"
      value: 0.25
    }
  }
}
layer {
  name: "cat2_score"
  type: "Convolution"
  bottom: "concat2"
  top: "concat2_score"
  param {
    lr_mult: 0.00999999977648
    decay_mult: 1.0
  }
  param {
    lr_mult: 0.00200000009499
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 1
    kernel_size: 1
    weight_filler {
      type: "constant"
      value: 0.333000004292
    }
  }
}
layer {
  name: "cat3_score"
  type: "Convolution"
  bottom: "concat3"
  top: "concat3_score"
  param {
    lr_mult: 0.0500000007451
    decay_mult: 1.0
  }
  param {
    lr_mult: 0.00200000009499
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 1
    kernel_size: 1
    weight_filler {
      type: "constant"
      value: 0.5
    }
  }
}
layer {
  name: "cat4_score"
  type: "Convolution"
  bottom: "slice5_4"
  top: "concat4_score"
  param {
    lr_mult: 0.0500000007451
    decay_mult: 1.0
  }
  param {
    lr_mult: 0.00200000009499
    decay_mult: 0.0
  }
  convolution_param {
    num_output: 1
    kernel_size: 1
    weight_filler {
      type: "constant"
      value: 1.0
    }
  }
}
layer {
  name: "concat_fuse"
  type: "Concat"
  bottom: "concat0_score"
  bottom: "concat1_score"
  bottom: "concat2_score"
  bottom: "concat3_score"
  bottom: "concat4_score"
  top: "concat_fuse"
  concat_param {
    concat_dim: 1
  }
}
layer {
  name: "loss"
  type: "BalanceSoftmaxWithLoss"
  bottom: "concat_fuse"
  bottom: "label"
  top: "fuse_loss"
  loss_param {
    ignore_label: -1
    normalize: false
  }
}
	base_lr: 9.99999997475e-07
	display: 10
	max_iter: 15000
	lr_policy: "step"
	gamma: 0.10000000149
	momentum: 0.899999976158
	weight_decay: 0.000199999994948
	stepsize: 5000
	snapshot: 1000
	snapshot_prefix: "snapshot/fsds"
	random_seed: 831486
	debug_info: false
	net: "model/fsds_train.pt"
	iter_size: 1
	type: "SGD"
	layer {
	name: "data"
	type: "Python"
	top: "data"
	top: "label"
	python_param {
	module: "pylayer"
	layer: "FSDSDataLayer"
	param_str: "{\'shuffle\': False, \'source\': \'list_shuffled.txt\', \'phase\': \'train\', \'ignore_label\': -1, \'root\': \'data/SK-LARGE/\', \'mean\': (104.00699, 116.66877, 122.67892)}"
	}
	}
	layer {
	name: "conv1_1"
	type: "Convolution"
	bottom: "data"
	top: "conv1_1"
	param {
	lr_mult: 1.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 2.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 64
	pad: 35
	kernel_size: 3
	}
	}
	layer {
	name: "relu1_1"
	type: "ReLU"
	bottom: "conv1_1"
	top: "conv1_1"
	}
	layer {
	name: "conv1_2"
	type: "Convolution"
	bottom: "conv1_1"
	top: "conv1_2"
	param {
	lr_mult: 1.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 2.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 64
	pad: 1
	kernel_size: 3
	}
	}
	layer {
	name: "relu1_2"
	type: "ReLU"
	bottom: "conv1_2"
	top: "conv1_2"
	}
	layer {
	name: "pool1"
	type: "Pooling"
	bottom: "conv1_2"
	top: "pool1"
	pooling_param {
	pool: MAX
	kernel_size: 2
	stride: 2
	}
	}
	layer {
	name: "conv2_1"
	type: "Convolution"
	bottom: "pool1"
	top: "conv2_1"
	param {
	lr_mult: 1.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 2.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 128
	pad: 1
	kernel_size: 3
	}
	}
	layer {
	name: "relu2_1"
	type: "ReLU"
	bottom: "conv2_1"
	top: "conv2_1"
	}
	layer {
	name: "conv2_2"
	type: "Convolution"
	bottom: "conv2_1"
	top: "conv2_2"
	param {
	lr_mult: 1.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 2.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 128
	pad: 1
	kernel_size: 3
	}
	}
	layer {
	name: "relu2_2"
	type: "ReLU"
	bottom: "conv2_2"
	top: "conv2_2"
	}
	layer {
	name: "pool2"
	type: "Pooling"
	bottom: "conv2_2"
	top: "pool2"
	pooling_param {
	pool: MAX
	kernel_size: 2
	stride: 2
	}
	}
	layer {
	name: "conv3_1"
	type: "Convolution"
	bottom: "pool2"
	top: "conv3_1"
	param {
	lr_mult: 1.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 2.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 256
	pad: 1
	kernel_size: 3
	}
	}
	layer {
	name: "relu3_1"
	type: "ReLU"
	bottom: "conv3_1"
	top: "conv3_1"
	}
	layer {
	name: "conv3_2"
	type: "Convolution"
	bottom: "conv3_1"
	top: "conv3_2"
	param {
	lr_mult: 1.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 2.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 256
	pad: 1
	kernel_size: 3
	}
	}
	layer {
	name: "relu3_2"
	type: "ReLU"
	bottom: "conv3_2"
	top: "conv3_2"
	}
	layer {
	name: "conv3_3"
	type: "Convolution"
	bottom: "conv3_2"
	top: "conv3_3"
	param {
	lr_mult: 1.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 2.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 256
	pad: 1
	kernel_size: 3
	}
	}
	layer {
	name: "relu3_3"
	type: "ReLU"
	bottom: "conv3_3"
	top: "conv3_3"
	}
	layer {
	name: "pool3"
	type: "Pooling"
	bottom: "conv3_3"
	top: "pool3"
	pooling_param {
	pool: MAX
	kernel_size: 2
	stride: 2
	}
	}
	layer {
	name: "conv4_1"
	type: "Convolution"
	bottom: "pool3"
	top: "conv4_1"
	param {
	lr_mult: 1.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 2.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 512
	pad: 1
	kernel_size: 3
	}
	}
	layer {
	name: "relu4_1"
	type: "ReLU"
	bottom: "conv4_1"
	top: "conv4_1"
	}
	layer {
	name: "conv4_2"
	type: "Convolution"
	bottom: "conv4_1"
	top: "conv4_2"
	param {
	lr_mult: 1.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 2.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 512
	pad: 1
	kernel_size: 3
	}
	}
	layer {
	name: "relu4_2"
	type: "ReLU"
	bottom: "conv4_2"
	top: "conv4_2"
	}
	layer {
	name: "conv4_3"
	type: "Convolution"
	bottom: "conv4_2"
	top: "conv4_3"
	param {
	lr_mult: 1.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 2.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 512
	pad: 1
	kernel_size: 3
	}
	}
	layer {
	name: "relu4_3"
	type: "ReLU"
	bottom: "conv4_3"
	top: "conv4_3"
	}
	layer {
	name: "pool4"
	type: "Pooling"
	bottom: "conv4_3"
	top: "pool4"
	pooling_param {
	pool: MAX
	kernel_size: 2
	stride: 2
	}
	}
	layer {
	name: "conv5_1"
	type: "Convolution"
	bottom: "pool4"
	top: "conv5_1"
	param {
	lr_mult: 100.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 200.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 512
	pad: 1
	kernel_size: 3
	}
	}
	layer {
	name: "relu5_1"
	type: "ReLU"
	bottom: "conv5_1"
	top: "conv5_1"
	}
	layer {
	name: "conv5_2"
	type: "Convolution"
	bottom: "conv5_1"
	top: "conv5_2"
	param {
	lr_mult: 100.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 200.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 512
	pad: 1
	kernel_size: 3
	}
	}
	layer {
	name: "relu5_2"
	type: "ReLU"
	bottom: "conv5_2"
	top: "conv5_2"
	}
	layer {
	name: "conv5_3"
	type: "Convolution"
	bottom: "conv5_2"
	top: "conv5_3"
	param {
	lr_mult: 100.0
	decay_mult: 1.0
	}
	param {
	lr_mult: 200.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 512
	pad: 1
	kernel_size: 3
	}
	}
	layer {
	name: "relu5_3"
	type: "ReLU"
	bottom: "conv5_3"
	top: "conv5_3"
	}
	layer {
	name: "score_dsn2"
	type: "Convolution"
	bottom: "conv2_2"
	top: "score_dsn2"
	param {
	lr_mult: 0.00999999977648
	decay_mult: 1.0
	}
	param {
	lr_mult: 0.019999999553
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 2
	kernel_size: 1
	weight_filler {
	type: "constant"
	value: 0.0
	}
	}
	}
	layer {
	name: "upsample_2"
	type: "Deconvolution"
	bottom: "score_dsn2"
	top: "upscore_dsn2"
	param {
	lr_mult: 0.0
	decay_mult: 0.0
	}
	param {
	lr_mult: 0.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 2
	kernel_size: 4
	stride: 2
	}
	}
	layer {
	name: "crop_dsn2"
	type: "Crop"
	bottom: "upscore_dsn2"
	bottom: "data"
	top: "crop_dsn2"
	crop_param {
	axis: 2
	offset: 35
	}
	}
	layer {
	name: "loss2"
	type: "BalanceSoftmaxWithLoss"
	bottom: "crop_dsn2"
	bottom: "label"
	top: "dsn2_loss"
	loss_param {
	ignore_label: -1
	normalize: false
	}
	}
	layer {
	name: "score_dsn3"
	type: "Convolution"
	bottom: "conv3_3"
	top: "score_dsn3"
	param {
	lr_mult: 0.00999999977648
	decay_mult: 1.0
	}
	param {
	lr_mult: 0.019999999553
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 3
	kernel_size: 1
	weight_filler {
	type: "constant"
	value: 0.0
	}
	}
	}
	layer {
	name: "upsample_4"
	type: "Deconvolution"
	bottom: "score_dsn3"
	top: "upscore_dsn3"
	param {
	lr_mult: 0.0
	decay_mult: 0.0
	}
	param {
	lr_mult: 0.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 3
	kernel_size: 8
	stride: 4
	}
	}
	layer {
	name: "crop_dsn3"
	type: "Crop"
	bottom: "upscore_dsn3"
	bottom: "data"
	top: "crop_dsn3"
	crop_param {
	axis: 2
	offset: 36
	}
	}
	layer {
	name: "loss3"
	type: "BalanceSoftmaxWithLoss"
	bottom: "crop_dsn3"
	bottom: "label"
	top: "dsn3_loss"
	loss_param {
	ignore_label: -1
	normalize: false
	}
	}
	layer {
	name: "score_dsn4"
	type: "Convolution"
	bottom: "conv4_3"
	top: "score_dsn4"
	param {
	lr_mult: 0.00999999977648
	decay_mult: 1.0
	}
	param {
	lr_mult: 0.019999999553
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 4
	kernel_size: 1
	weight_filler {
	type: "constant"
	value: 0.0
	}
	}
	}
	layer {
	name: "upsample_8"
	type: "Deconvolution"
	bottom: "score_dsn4"
	top: "upscore_dsn4"
	param {
	lr_mult: 0.0
	decay_mult: 0.0
	}
	param {
	lr_mult: 0.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 4
	kernel_size: 16
	stride: 8
	}
	}
	layer {
	name: "crop_dsn4"
	type: "Crop"
	bottom: "upscore_dsn4"
	bottom: "data"
	top: "crop_dsn4"
	crop_param {
	axis: 2
	offset: 38
	}
	}
	layer {
	name: "loss4"
	type: "BalanceSoftmaxWithLoss"
	bottom: "crop_dsn4"
	bottom: "label"
	top: "dsn4_loss"
	loss_param {
	ignore_label: -1
	normalize: false
	}
	}
	layer {
	name: "score_dsn5"
	type: "Convolution"
	bottom: "conv5_3"
	top: "score_dsn5"
	param {
	lr_mult: 0.00999999977648
	decay_mult: 1.0
	}
	param {
	lr_mult: 0.019999999553
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 5
	kernel_size: 1
	weight_filler {
	type: "constant"
	value: 0.0
	}
	}
	}
	layer {
	name: "upsample_16"
	type: "Deconvolution"
	bottom: "score_dsn5"
	top: "upscore_dsn5"
	param {
	lr_mult: 0.0
	decay_mult: 0.0
	}
	param {
	lr_mult: 0.0
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 5
	kernel_size: 32
	stride: 16
	}
	}
	layer {
	name: "crop_dsn5"
	type: "Crop"
	bottom: "upscore_dsn5"
	bottom: "data"
	top: "crop_dsn5"
	crop_param {
	axis: 2
	offset: 42
	}
	}
	layer {
	name: "loss5"
	type: "BalanceSoftmaxWithLoss"
	bottom: "crop_dsn5"
	bottom: "label"
	top: "dsn5_loss"
	loss_param {
	ignore_label: -1
	normalize: false
	}
	}
	layer {
	name: "slice2"
	type: "Slice"
	bottom: "crop_dsn2"
	top: "slice2_0"
	top: "slice2_1"
	slice_param {
	slice_point: 1
	axis: 1
	}
	}
	layer {
	name: "slice3"
	type: "Slice"
	bottom: "crop_dsn3"
	top: "slice3_0"
	top: "slice3_1"
	top: "slice3_2"
	slice_param {
	slice_point: 1
	slice_point: 2
	axis: 1
	}
	}
	layer {
	name: "slice4"
	type: "Slice"
	bottom: "crop_dsn4"
	top: "slice4_0"
	top: "slice4_1"
	top: "slice4_2"
	top: "slice4_3"
	slice_param {
	slice_point: 1
	slice_point: 2
	slice_point: 3
	axis: 1
	}
	}
	layer {
	name: "slice5"
	type: "Slice"
	bottom: "crop_dsn5"
	top: "slice5_0"
	top: "slice5_1"
	top: "slice5_2"
	top: "slice5_3"
	top: "slice5_4"
	slice_param {
	slice_point: 1
	slice_point: 2
	slice_point: 3
	slice_point: 4
	axis: 1
	}
	}
	layer {
	name: "concat0"
	type: "Concat"
	bottom: "slice2_0"
	bottom: "slice3_0"
	bottom: "slice4_0"
	bottom: "slice5_0"
	top: "concat0"
	concat_param {
	concat_dim: 1
	}
	}
	layer {
	name: "concat1"
	type: "Concat"
	bottom: "slice2_1"
	bottom: "slice3_1"
	bottom: "slice4_1"
	bottom: "slice5_1"
	top: "concat1"
	concat_param {
	concat_dim: 1
	}
	}
	layer {
	name: "concat2"
	type: "Concat"
	bottom: "slice3_2"
	bottom: "slice4_2"
	bottom: "slice5_2"
	top: "concat2"
	concat_param {
	concat_dim: 1
	}
	}
	layer {
	name: "concat3"
	type: "Concat"
	bottom: "slice4_3"
	bottom: "slice5_3"
	top: "concat3"
	concat_param {
	concat_dim: 1
	}
	}
	layer {
	name: "cat0_score"
	type: "Convolution"
	bottom: "concat0"
	top: "concat0_score"
	param {
	lr_mult: 0.0500000007451
	decay_mult: 1.0
	}
	param {
	lr_mult: 0.00200000009499
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 1
	kernel_size: 1
	weight_filler {
	type: "constant"
	value: 0.25
	}
	}
	}
	layer {
	name: "cat1_score"
	type: "Convolution"
	bottom: "concat1"
	top: "concat1_score"
	param {
	lr_mult: 0.0500000007451
	decay_mult: 1.0
	}
	param {
	lr_mult: 0.00200000009499
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 1
	kernel_size: 1
	weight_filler {
	type: "constant"
	value: 0.25
	}
	}
	}
	layer {
	name: "cat2_score"
	type: "Convolution"
	bottom: "concat2"
	top: "concat2_score"
	param {
	lr_mult: 0.00999999977648
	decay_mult: 1.0
	}
	param {
	lr_mult: 0.00200000009499
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 1
	kernel_size: 1
	weight_filler {
	type: "constant"
	value: 0.333000004292
	}
	}
	}
	layer {
	name: "cat3_score"
	type: "Convolution"
	bottom: "concat3"
	top: "concat3_score"
	param {
	lr_mult: 0.0500000007451
	decay_mult: 1.0
	}
	param {
	lr_mult: 0.00200000009499
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 1
	kernel_size: 1
	weight_filler {
	type: "constant"
	value: 0.5
	}
	}
	}
	layer {
	name: "cat4_score"
	type: "Convolution"
	bottom: "slice5_4"
	top: "concat4_score"
	param {
	lr_mult: 0.0500000007451
	decay_mult: 1.0
	}
	param {
	lr_mult: 0.00200000009499
	decay_mult: 0.0
	}
	convolution_param {
	num_output: 1
	kernel_size: 1
	weight_filler {
	type: "constant"
	value: 1.0
	}
	}
	}
	layer {
	name: "concat_fuse"
	type: "Concat"
	bottom: "concat0_score"
	bottom: "concat1_score"
	bottom: "concat2_score"
	bottom: "concat3_score"
	bottom: "concat4_score"
	top: "concat_fuse"
	concat_param {
	concat_dim: 1
	}
	}
	layer {
	name: "loss"
	type: "BalanceSoftmaxWithLoss"
	bottom: "concat_fuse"
	bottom: "label"
	top: "fuse_loss"
	loss_param {
	ignore_label: -1
	normalize: false
	}
	}