Skip to content

Instantly share code, notes, and snippets.

@jmkim
Created June 22, 2021 20:47
Show Gist options
  • Save jmkim/17448702d72ba8a3f13900284b34bf64 to your computer and use it in GitHub Desktop.
Save jmkim/17448702d72ba8a3f13900284b34bf64 to your computer and use it in GitHub Desktop.
Assignment 3: Deep Learning A05442-001 @ PKNU
Display the source blob
Display the rendered blob
Raw
{
"cells": [
{
"cell_type": "markdown",
"id": "e275dec6",
"metadata": {},
"source": [
"# Assignment 3\n",
"## Deep Learning A05442-001\n",
"\n",
" * Date: 2021-06-22\n",
" * Author: Jongmin Kim <jmkim@pukyong.ac.kr> 201955277\n",
" \n",
"## 목차\n",
" 1. Code preparation\n",
" 2. CNN\n",
" - 모델 설명\n",
" - 모델 레이어 구성의 자세한 설명\n",
" - 결과 분석\n",
" 3. RNN\n",
" - 모델 설명\n",
" - 결과 분석\n",
" - CNN, FNN 비교 분석"
]
},
{
"cell_type": "markdown",
"id": "4c16c02b",
"metadata": {},
"source": [
"## 1. Code preparation"
]
},
{
"cell_type": "code",
"execution_count": 1,
"id": "45d21856",
"metadata": {},
"outputs": [],
"source": [
"import torch\n",
"import torchvision\n",
"import torchvision.transforms as transforms\n",
"import torch.nn as nn\n",
"import torch.optim as optim\n",
"import matplotlib.pyplot as plt\n",
"import numpy as np\n",
"import os\n",
"\n",
"device = torch.device(\"cuda:1\" if torch.cuda.is_available() else \"cpu\")"
]
},
{
"cell_type": "code",
"execution_count": 2,
"id": "a644115d",
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"ID: 0\n",
"Name: GeForce RTX 2080 Ti\n",
"Memory:\n",
" Allocated: 0.0 GB\n",
" Cached: 0.0 GB\n"
]
}
],
"source": [
"torch.manual_seed(201955277)\n",
"if device.type == \"cuda\":\n",
" torch.cuda.manual_seed(201955277)\n",
" print(\"ID: \", torch.cuda.current_device())\n",
" print(\"Name: \", torch.cuda.get_device_name(torch.cuda.current_device()))\n",
" print(\"Memory:\")\n",
" print(\" Allocated: \", round(torch.cuda.memory_allocated(torch.cuda.current_device())/1024**3,1), 'GB')\n",
" print(\" Cached: \", round(torch.cuda.memory_reserved(torch.cuda.current_device())/1024**3,1), 'GB')"
]
},
{
"cell_type": "code",
"execution_count": 3,
"id": "7aae0a4c",
"metadata": {},
"outputs": [],
"source": [
"dataset_root = \"./data\"\n",
"output_root = \"./output_jmkim\"\n",
"batch_size = 4096\n",
"num_workers = 2"
]
},
{
"cell_type": "code",
"execution_count": 4,
"id": "fb76c766",
"metadata": {},
"outputs": [],
"source": [
"transform_train = transforms.Compose([\n",
" transforms.RandomRotation(15),\n",
" transforms.RandomHorizontalFlip(),\n",
" transforms.ToTensor(),\n",
" transforms.Normalize([0.5], [0.5])\n",
"])\n",
"\n",
"transform_valid = transforms.Compose([\n",
" transforms.ToTensor(),\n",
" transforms.Normalize([0.5], [0.5])\n",
"])\n",
"\n",
"trainset = torchvision.datasets.FashionMNIST(root=dataset_root, train=True, download=True, transform=transform_train)\n",
"trainloader = torch.utils.data.DataLoader(trainset, batch_size=batch_size, shuffle=True, num_workers=num_workers)\n",
"\n",
"validset = torchvision.datasets.FashionMNIST(root=dataset_root, train=False, download=True, transform=transform_valid)\n",
"validloader = torch.utils.data.DataLoader(validset, batch_size=batch_size, shuffle=False, num_workers=num_workers)\n",
"\n",
"classes = ('T-shirt', 'Trouser', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot')"
]
},
{
"cell_type": "code",
"execution_count": 5,
"id": "3b0edb00",
"metadata": {},
"outputs": [],
"source": [
"def imshow(inp):\n",
" inp = inp.numpy().transpose((1, 2, 0))\n",
" mean = 0.5\n",
" std = 0.5\n",
" inp = std * inp + mean\n",
" inp = np.clip(inp, 0, 1)\n",
" plt.imshow(inp)\n",
" plt.show()\n",
" \n",
" xb, tb = next(iter(trainloader))\n",
" \n",
" print(xb[0].shape)\n",
" \n",
" imshow(torchvision.util.make_grid(xb[0:8]))\n",
" print(\" \".join(\"%5s\" % classes[tb[j]] for j in range(8)))"
]
},
{
"cell_type": "code",
"execution_count": 6,
"id": "b0d4732c",
"metadata": {},
"outputs": [],
"source": [
"def train(model, loss_fn, optimizer, n_epochs, file_name):\n",
" best_valid_acc = 0.0\n",
" best_epoch = 0\n",
"\n",
" train_loss, train_acc = np.zeros((n_epochs,)), np.zeros((n_epochs, ))\n",
" valid_loss, valid_acc = np.zeros((n_epochs,)), np.zeros((n_epochs))\n",
"\n",
" for epoch in range(n_epochs):\n",
" model.train()\n",
" for xb, tb in trainloader:\n",
" xb, tb = xb.to(device), tb.to(device)\n",
" y = model(xb)\n",
" _, pred = torch.max(y, 1)\n",
" loss = loss_fn(y, tb)\n",
"\n",
" optimizer.zero_grad()\n",
" loss.backward()\n",
" optimizer.step()\n",
"\n",
" train_loss[epoch] += loss.item()/len(trainloader)\n",
" train_acc[epoch] += torch.sum(pred == tb).item()/pred.shape[0]/len(trainloader)\n",
" \n",
" model.eval()\n",
" with torch.no_grad():\n",
" for xb, tb in validloader:\n",
" xb, tb = xb.to(device), tb.to(device)\n",
" y = model(xb)\n",
" _, pred = torch.max(y, 1)\n",
" valid_loss[epoch] += loss_fn(y, tb).item()/len(validloader)\n",
" valid_acc[epoch] += torch.sum(pred == tb).item()/pred.shape[0]/len(validloader)\n",
"\n",
" if valid_acc[epoch] > best_valid_acc:\n",
" best_valid_acc = valid_acc[epoch]\n",
" best_epoch = epoch\n",
" torch.save(model, os.path.join(output_root, file_name))\n",
"\n",
" print('Epoch: %d, Train loss/acc: %3f/%3f, Valid loss/acc: %3f/%3f'\n",
" % (epoch, train_loss[epoch], train_acc[epoch], valid_loss[epoch], valid_acc[epoch]))\n",
"\n",
" plt.plot(train_loss, 'ro-', label='Train loss') \n",
" plt.plot(valid_loss, 'b*-', label='Valid loss') \n",
" plt.plot(best_epoch, train_loss[best_epoch], 'ks', linewidth=5, markersize=10) \n",
" plt.plot(best_epoch, valid_loss[best_epoch], 'ks', linewidth=5, markersize=10)\n",
" plt.xlabel('Epochs') \n",
" plt.ylabel('Cross entropy') \n",
" plt.legend()\n",
" plt.show()\n",
"\n",
" plt.plot(train_acc, 'ro-', label='Train Acc.')\n",
" plt.plot(valid_acc, 'b*-', label='Valid Acc.')\n",
" plt.plot(best_epoch, train_acc[best_epoch], 'ks', linewidth=5, markersize=10) \n",
" plt.plot(best_epoch, valid_acc[best_epoch], 'ks', linewidth=5, markersize=10)\n",
" plt.xlabel('Epochs')\n",
" plt.ylabel('Accuracy')\n",
" plt.legend()\n",
" plt.show()"
]
},
{
"cell_type": "markdown",
"id": "edb1c374",
"metadata": {},
"source": [
"## 2. CNN"
]
},
{
"cell_type": "code",
"execution_count": 7,
"id": "aaab3f52",
"metadata": {},
"outputs": [],
"source": [
"class CNN(nn.Module):\n",
" def __init__(self):\n",
" super().__init__()\n",
"\n",
" self.conv1 = nn.Sequential(\n",
" # input size: 28 * 28\n",
" nn.Conv2d(1, 32, 3, padding=1),\n",
" nn.BatchNorm2d(32),\n",
" nn.ReLU(),\n",
" nn.MaxPool2d(2, 2)\n",
" # output size: 14 * 14\n",
" )\n",
"\n",
" self.conv2 = nn.Sequential(\n",
" # input size: 14 * 14\n",
" nn.Conv2d(32, 64, 3, padding=1),\n",
" nn.BatchNorm2d(64),\n",
" nn.ReLU(),\n",
" nn.MaxPool2d(2, 2)\n",
" # output size: 7 * 7\n",
" )\n",
"\n",
" self.linear1 = nn.Sequential(\n",
" nn.Linear(7*7*64, 256),\n",
" nn.BatchNorm1d(256),\n",
" nn.ReLU()\n",
" )\n",
"\n",
" self.linear2 = nn.Linear(256, 10)\n",
"\n",
" def forward(self, x):\n",
" x = self.conv1(x)\n",
" x = self.conv2(x)\n",
" x = x.view(-1, 7*7*64)\n",
" x = self.linear1(x)\n",
" x = self.linear2(x)\n",
" return x"
]
},
{
"cell_type": "markdown",
"id": "e41c5acd",
"metadata": {},
"source": [
"### 모델 설명\n",
"Fashion MNIST 데이터셋의 각 이미지 크기는 일괄적으로, 28 * 28 크기의 greyscale 이미지입니다. 따라서 `nn.Conv2d`의 입력 채널 수는 `1`입니다. 데이터셋의 클래스는 10개로 이루어져 있으므로, 최종 출력의 개수는 10개입니다.\n",
"\n",
"저는 본 모델을 2개의 컨벌루션 레이어와, 2개의 풀링 레이어, 1개의 완전 연결(Fully connected) 레이어, 1개의 출력 레이어로 구성하였습니다. 차례로 (입력)컨벌루션 → 풀링 → 컨벌루션 → 풀링 → 완전연결(Flattening) → 출력 순서로 구성하였습니다. 출력 레이어를 제외한 모든 레이어의 활성 함수는 ReLU를 사용하였습니다.\n",
"\n",
"\n",
"#### 모델 레이어 구성의 자세한 설명\n",
"\n",
"자세한 파라미터는 다음과 같이 구성하였습니다:\n",
"\n",
" 1. 컨벌루션 레이어 (이미지 입력 레이어)\n",
" - 입력 텐서 크기: 28 * 28 * 1 * 1\n",
" - 이미지 크기: 28 * 28\n",
" - 레이어(이미지) 개수: 1\n",
" - 채널 수: 1\n",
" - 컨벌루션\n",
" - 커널 크기: 3\n",
" - Stride 크기: 1\n",
" - Padding 크기: 1\n",
" - 출력 텐서 크기: 28 * 28 * 32 * 1\n",
" - 이미지 크기: 28 * 28\n",
" - 레이어 개수: 32\n",
" - 채널 수: 1\n",
" 2. 풀링 레이어\n",
" - 입력 텐서 크기: 28 * 28 * 32 * 1\n",
" - 이미지 크기: 28 * 28\n",
" - 레이어 개수: 32\n",
" - 채널 수: 1\n",
" - 풀링\n",
" - 기법: Max Pool\n",
" - 풀링 크기: 2\n",
" - Stride 크기: 2\n",
" - 출력 텐서 크기: 14 * 14 * 32 * 1\n",
" - 이미지 크기: 14 * 14\n",
" - 레이어 개수: 32\n",
" - 채널 수: 1\n",
" 3. 컨벌루션 레이어\n",
" - 입력 텐서 크기: 14 * 14 * 32 * 1\n",
" - 이미지 크기: 14 * 14\n",
" - 레이어 개수: 32\n",
" - 채널 수: 1\n",
" - 컨벌루션\n",
" - 커널 크기: 3\n",
" - Stride 크기: 1\n",
" - Padding 크기: 1\n",
" - 출력 텐서 크기: 14 * 14 * 64 * 1\n",
" - 이미지 크기: 14 * 14\n",
" - 레이어 개수: 64\n",
" - 채널 수: 1\n",
" 4. 풀링 레이어\n",
" - 입력 텐서 크기: 14 * 14 * 64 * 1\n",
" - 이미지 크기: 14 * 14\n",
" - 레이어 개수: 64\n",
" - 채널 수: 1\n",
" - 풀링\n",
" - 기법: Max Pool\n",
" - 풀링 크기: 2\n",
" - Stride 크기: 2\n",
" - 출력 텐서 크기: 7 * 7 * 64 * 1\n",
" - 이미지 크기: 7 * 7\n",
" - 레이어 개수: 64\n",
" - 채널 수: 1\n",
" 5. 완전 연결 레이어\n",
" - 입력 텐서 크기: 7 * 7 * 64 * 1\n",
" - 이미지 크기: 7 * 7\n",
" - 레이어 개수: 64\n",
" - 채널 수: 1\n",
" - 출력 텐서 크기: 256\n",
" 6. 출력 레이어\n",
" - 입력 텐서 크기: 256\n",
" - 출력 텐서 크기: 10\n",
" - 레이어(Fashion MNIST 카테고리) 개수: 10"
]
},
{
"cell_type": "code",
"execution_count": 8,
"id": "84201001",
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"CNN(\n",
" (conv1): Sequential(\n",
" (0): Conv2d(1, 32, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))\n",
" (1): BatchNorm2d(32, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)\n",
" (2): ReLU()\n",
" (3): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)\n",
" )\n",
" (conv2): Sequential(\n",
" (0): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))\n",
" (1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)\n",
" (2): ReLU()\n",
" (3): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)\n",
" )\n",
" (linear1): Sequential(\n",
" (0): Linear(in_features=3136, out_features=256, bias=True)\n",
" (1): BatchNorm1d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)\n",
" (2): ReLU()\n",
" )\n",
" (linear2): Linear(in_features=256, out_features=10, bias=True)\n",
")"
]
},
"execution_count": 8,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"cnn = CNN()\n",
"cnn.to(device)"
]
},
{
"cell_type": "code",
"execution_count": 9,
"id": "4118e556",
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Epoch: 0, Train loss/acc: 0.899103/0.709642, Valid loss/acc: 1.001191/0.759633\n"
]
},
{
"name": "stderr",
"output_type": "stream",
"text": [
"/home/idblab/anaconda3/envs/jupyter/lib/python3.7/site-packages/torch/serialization.py:402: UserWarning: Couldn't retrieve source code for container of type CNN. It won't be checked for correctness upon loading.\n",
" \"type \" + obj.__name__ + \". It won't be checked \"\n"
]
},
{
"name": "stdout",
"output_type": "stream",
"text": [
"Epoch: 1, Train loss/acc: 0.511695/0.828435, Valid loss/acc: 0.587723/0.820490\n",
"Epoch: 2, Train loss/acc: 0.409647/0.857232, Valid loss/acc: 0.426924/0.853563\n",
"Epoch: 3, Train loss/acc: 0.355436/0.874923, Valid loss/acc: 0.352013/0.876292\n",
"Epoch: 4, Train loss/acc: 0.323561/0.885531, Valid loss/acc: 0.323052/0.882725\n",
"Epoch: 5, Train loss/acc: 0.300779/0.893810, Valid loss/acc: 0.311838/0.887103\n",
"Epoch: 6, Train loss/acc: 0.285152/0.898426, Valid loss/acc: 0.299657/0.895005\n",
"Epoch: 7, Train loss/acc: 0.272691/0.903325, Valid loss/acc: 0.292194/0.890037\n",
"Epoch: 8, Train loss/acc: 0.260531/0.907817, Valid loss/acc: 0.276123/0.901428\n",
"Epoch: 9, Train loss/acc: 0.256170/0.907343, Valid loss/acc: 0.279262/0.899898\n",
"Epoch: 10, Train loss/acc: 0.246141/0.911466, Valid loss/acc: 0.264001/0.902627\n",
"Epoch: 11, Train loss/acc: 0.237494/0.915266, Valid loss/acc: 0.265648/0.901109\n",
"Epoch: 12, Train loss/acc: 0.226930/0.918256, Valid loss/acc: 0.257190/0.906836\n",
"Epoch: 13, Train loss/acc: 0.223539/0.920206, Valid loss/acc: 0.242488/0.913605\n",
"Epoch: 14, Train loss/acc: 0.217071/0.921844, Valid loss/acc: 0.242902/0.909787\n",
"Epoch: 15, Train loss/acc: 0.210581/0.924736, Valid loss/acc: 0.238212/0.916019\n",
"Epoch: 16, Train loss/acc: 0.206077/0.925983, Valid loss/acc: 0.241575/0.913442\n",
"Epoch: 17, Train loss/acc: 0.201502/0.928217, Valid loss/acc: 0.239454/0.914484\n",
"Epoch: 18, Train loss/acc: 0.200647/0.927846, Valid loss/acc: 0.271321/0.906201\n",
"Epoch: 19, Train loss/acc: 0.198829/0.928007, Valid loss/acc: 0.235554/0.916307\n",
"Epoch: 20, Train loss/acc: 0.190927/0.930164, Valid loss/acc: 0.246428/0.912092\n",
"Epoch: 21, Train loss/acc: 0.188382/0.932401, Valid loss/acc: 0.232253/0.918367\n",
"Epoch: 22, Train loss/acc: 0.186197/0.933339, Valid loss/acc: 0.226165/0.919642\n",
"Epoch: 23, Train loss/acc: 0.181591/0.934056, Valid loss/acc: 0.227763/0.918845\n",
"Epoch: 24, Train loss/acc: 0.176405/0.936520, Valid loss/acc: 0.235328/0.917322\n",
"Epoch: 25, Train loss/acc: 0.176017/0.936595, Valid loss/acc: 0.235674/0.918412\n",
"Epoch: 26, Train loss/acc: 0.172676/0.938497, Valid loss/acc: 0.228330/0.918438\n",
"Epoch: 27, Train loss/acc: 0.168088/0.939740, Valid loss/acc: 0.272960/0.908040\n",
"Epoch: 28, Train loss/acc: 0.164810/0.940544, Valid loss/acc: 0.221023/0.924291\n",
"Epoch: 29, Train loss/acc: 0.165133/0.941229, Valid loss/acc: 0.228195/0.916822\n"
]
},
{
"data": {
"image/png": "\n",
"text/plain": [
"<Figure size 432x288 with 1 Axes>"
]
},
"metadata": {
"needs_background": "light"
},
"output_type": "display_data"
},
{
"data": {
"image/png": "\n",
"text/plain": [
"<Figure size 432x288 with 1 Axes>"
]
},
"metadata": {
"needs_background": "light"
},
"output_type": "display_data"
}
],
"source": [
"loss_fn = nn.CrossEntropyLoss()\n",
"optimizer = optim.Adam(cnn.parameters(), lr=0.001)\n",
"\n",
"train(cnn, loss_fn, optimizer, 30, \"best_cnn.pth\")\n",
"\n",
"del(cnn)"
]
},
{
"cell_type": "markdown",
"id": "8791b2ec",
"metadata": {},
"source": [
"### 결과 분석\n",
"\n",
"학습률(Learning rate)은 0.001로 설정하였으며, 에폭(Epoch)은 30번 수행하였습니다.\n",
"\n",
"수행 결과, Train loss와 Valid loss가 꾸준히 함께 감소하는 모습을 보였습니다. Valid loss는 Train loss에 미치지는 않지만 근사하게 줄어드는 모습을 보였습니다. 에폭이 지날수록 잘 훈련되는 모습을 보였습니다.\n",
"\n",
"Train loss를 살펴보면, 에폭 28에서 loss가 상승하고 accuracy가 감소한 모습을 보였습니다. 이 즈음의 Train accuracy는 94% 정도의 accuracy에 수렴하는 모습을 보였습니다.\n",
"한편, Valid loss는 몇 번 loss가 상승하거나 accuracy가 감소하는 모습을 보였지만, 대체로 loss 하향(accuracy 상향) 수렴하는 모습을 보였습니다. 92% 정도에 수렴한 정확도(accuracy)를 보였으며, 잘 훈련된 모델이라 볼 수 있다고 생각합니다.\n",
"\n",
"이외에 연산의 빠른 수행을 위해 Batch size를 4096으로 조정하거나 Reproducible하도록 random seed를 학번(201955277)으로 고정하는 등 모델의 성능 향상에 영향을 끼치지 않는 파라미터를 몇몇 조정한 바 있습니다."
]
},
{
"cell_type": "markdown",
"id": "21a9c736",
"metadata": {},
"source": [
"## 3. Run FNN"
]
},
{
"cell_type": "code",
"execution_count": 10,
"id": "b5d61f03",
"metadata": {},
"outputs": [],
"source": [
"class FNN(nn.Module):\n",
" def __init__(self):\n",
" super().__init__()\n",
"\n",
" self.linear1 = nn.Sequential(\n",
" nn.Linear(28*28, 4096),\n",
" nn.BatchNorm1d(4096),\n",
" nn.ReLU()\n",
" )\n",
"\n",
" self.linear2 = nn.Sequential(\n",
" nn.Linear(4096, 2048),\n",
" nn.BatchNorm1d(2048),\n",
" nn.ReLU()\n",
" )\n",
"\n",
" self.linear3 = nn.Sequential(\n",
" nn.Linear(2048, 1024),\n",
" nn.BatchNorm1d(1024),\n",
" nn.ReLU()\n",
" )\n",
"\n",
" self.linear4 = nn.Sequential(\n",
" nn.Linear(1024, 512),\n",
" nn.BatchNorm1d(512),\n",
" nn.ReLU()\n",
" )\n",
"\n",
" self.linear5 = nn.Sequential(\n",
" nn.Linear(512, 256),\n",
" nn.BatchNorm1d(256),\n",
" nn.ReLU()\n",
" )\n",
"\n",
" self.linear6 = nn.Linear(256, 10)\n",
"\n",
" def forward(self, x):\n",
" x = x.view(-1, 28*28)\n",
" x = self.linear1(x)\n",
" x = self.linear2(x)\n",
" x = self.linear3(x)\n",
" x = self.linear4(x)\n",
" x = self.linear5(x)\n",
" x = self.linear6(x)\n",
"\n",
" return x"
]
},
{
"cell_type": "markdown",
"id": "9e11a665",
"metadata": {},
"source": [
"### 모델 설명\n",
"\n",
"Fashion MNIST 데이터셋의 각 이미지 크기는 일괄적으로, 28 * 28 크기를 가지고 있습니다.\n",
"\n",
"저는 본 모델을 5개의 완전 연결(Fully connected) 레이어와, 1개의 출력 레이어로 구성하였습니다.\n",
"\n",
"임의의 표기법 `(x) → (y)` 에서, `→`를 완전 연결 레이어, `(x)`의 문자 `x`를 입력 개수, `(y)`의 문자 `y`를 출력의 개수라 할 때, 차례로:\n",
"\n",
"```\n",
"(28 * 28) → (4096) → (2048) → (1024) → (512) → (256)\n",
"```\n",
"\n",
"순서로 5개의 완전 연결 레이어를 구성하였으며, 이와 이어지도록 출력 레이어를 구성하였습니다. 출력 레이어를 제외한 모든 레이어의 활성 함수는 ReLU를 사용하였습니다."
]
},
{
"cell_type": "code",
"execution_count": 11,
"id": "9c379c38",
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"FNN(\n",
" (linear1): Sequential(\n",
" (0): Linear(in_features=784, out_features=4096, bias=True)\n",
" (1): BatchNorm1d(4096, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)\n",
" (2): ReLU()\n",
" )\n",
" (linear2): Sequential(\n",
" (0): Linear(in_features=4096, out_features=2048, bias=True)\n",
" (1): BatchNorm1d(2048, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)\n",
" (2): ReLU()\n",
" )\n",
" (linear3): Sequential(\n",
" (0): Linear(in_features=2048, out_features=1024, bias=True)\n",
" (1): BatchNorm1d(1024, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)\n",
" (2): ReLU()\n",
" )\n",
" (linear4): Sequential(\n",
" (0): Linear(in_features=1024, out_features=512, bias=True)\n",
" (1): BatchNorm1d(512, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)\n",
" (2): ReLU()\n",
" )\n",
" (linear5): Sequential(\n",
" (0): Linear(in_features=512, out_features=256, bias=True)\n",
" (1): BatchNorm1d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)\n",
" (2): ReLU()\n",
" )\n",
" (linear6): Linear(in_features=256, out_features=10, bias=True)\n",
")"
]
},
"execution_count": 11,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"fnn = FNN()\n",
"fnn.to(device) "
]
},
{
"cell_type": "code",
"execution_count": 12,
"id": "7f28b659",
"metadata": {},
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"/home/idblab/anaconda3/envs/jupyter/lib/python3.7/site-packages/torch/serialization.py:402: UserWarning: Couldn't retrieve source code for container of type FNN. It won't be checked for correctness upon loading.\n",
" \"type \" + obj.__name__ + \". It won't be checked \"\n"
]
},
{
"name": "stdout",
"output_type": "stream",
"text": [
"Epoch: 0, Train loss/acc: 0.803998/0.726864, Valid loss/acc: 0.810076/0.722377\n",
"Epoch: 1, Train loss/acc: 0.464235/0.834057, Valid loss/acc: 0.636247/0.780691\n",
"Epoch: 2, Train loss/acc: 0.410156/0.850685, Valid loss/acc: 0.560476/0.805647\n",
"Epoch: 3, Train loss/acc: 0.378311/0.862722, Valid loss/acc: 0.418152/0.845159\n",
"Epoch: 4, Train loss/acc: 0.359343/0.866854, Valid loss/acc: 0.451178/0.837739\n",
"Epoch: 5, Train loss/acc: 0.336994/0.875836, Valid loss/acc: 0.387398/0.858119\n",
"Epoch: 6, Train loss/acc: 0.328688/0.877760, Valid loss/acc: 0.410624/0.848019\n",
"Epoch: 7, Train loss/acc: 0.313705/0.881822, Valid loss/acc: 0.390327/0.857191\n",
"Epoch: 8, Train loss/acc: 0.307144/0.885795, Valid loss/acc: 0.396981/0.853937\n",
"Epoch: 9, Train loss/acc: 0.296322/0.888926, Valid loss/acc: 0.417271/0.844058\n",
"Epoch: 10, Train loss/acc: 0.290890/0.891831, Valid loss/acc: 0.424834/0.843358\n",
"Epoch: 11, Train loss/acc: 0.283157/0.894270, Valid loss/acc: 0.333803/0.878541\n",
"Epoch: 12, Train loss/acc: 0.272464/0.897872, Valid loss/acc: 0.324606/0.881313\n",
"Epoch: 13, Train loss/acc: 0.268604/0.899767, Valid loss/acc: 0.352171/0.869888\n",
"Epoch: 14, Train loss/acc: 0.264922/0.900938, Valid loss/acc: 0.331090/0.880429\n",
"Epoch: 15, Train loss/acc: 0.259172/0.902385, Valid loss/acc: 0.360817/0.871311\n",
"Epoch: 16, Train loss/acc: 0.257291/0.904428, Valid loss/acc: 0.341761/0.875188\n",
"Epoch: 17, Train loss/acc: 0.253238/0.904457, Valid loss/acc: 0.345044/0.877462\n",
"Epoch: 18, Train loss/acc: 0.248496/0.906692, Valid loss/acc: 0.327107/0.878068\n",
"Epoch: 19, Train loss/acc: 0.237097/0.909787, Valid loss/acc: 0.339478/0.881134\n",
"Epoch: 20, Train loss/acc: 0.236125/0.912511, Valid loss/acc: 0.347306/0.879392\n",
"Epoch: 21, Train loss/acc: 0.232623/0.911108, Valid loss/acc: 0.323449/0.882653\n",
"Epoch: 22, Train loss/acc: 0.225367/0.915233, Valid loss/acc: 0.328902/0.881861\n",
"Epoch: 23, Train loss/acc: 0.221245/0.915654, Valid loss/acc: 0.316807/0.886043\n",
"Epoch: 24, Train loss/acc: 0.218323/0.916960, Valid loss/acc: 0.319766/0.886965\n",
"Epoch: 25, Train loss/acc: 0.212960/0.919120, Valid loss/acc: 0.334582/0.885512\n",
"Epoch: 26, Train loss/acc: 0.212961/0.919279, Valid loss/acc: 0.335623/0.884437\n",
"Epoch: 27, Train loss/acc: 0.204531/0.921409, Valid loss/acc: 0.320582/0.887118\n",
"Epoch: 28, Train loss/acc: 0.202206/0.924083, Valid loss/acc: 0.341422/0.882859\n",
"Epoch: 29, Train loss/acc: 0.201795/0.923449, Valid loss/acc: 0.338368/0.882990\n"
]
},
{
"data": {
"image/png": "\n",
"text/plain": [
"<Figure size 432x288 with 1 Axes>"
]
},
"metadata": {
"needs_background": "light"
},
"output_type": "display_data"
},
{
"data": {
"image/png": "\n",
"text/plain": [
"<Figure size 432x288 with 1 Axes>"
]
},
"metadata": {
"needs_background": "light"
},
"output_type": "display_data"
}
],
"source": [
"loss_fn = nn.CrossEntropyLoss()\n",
"optimizer = optim.Adam(fnn.parameters(), lr=0.001)\n",
"\n",
"train(fnn, loss_fn, optimizer, 30, \"best_fnn.pth\")\n",
"\n",
"del(fnn)"
]
},
{
"cell_type": "markdown",
"id": "f047c348",
"metadata": {},
"source": [
"### 결과 분석\n",
"\n",
"학습률(Learning rate)은 0.001로 설정하였으며, 에폭(Epoch)은 30번 수행하였습니다.\n",
"\n",
"수행 결과, Train loss는 지속적으로 감소하는 모습을 보였으나, Valid loss는 수렴하는 모습을 보였습니다. 에폭 초반에는 잘 훈련되는 모습처럼 보였으나, 에폭 5 이후로는 Valid loss와 accuracy가 수렴하며 진동하는 모습을 보였습니다. 하지만 대체로 감소하는 모습이므로, 이 모델의 경우 이 이상 훈련할 가치가 없다고 해석할 수 있다고 생각합니다.\n",
"\n",
"Train loss를 살펴보면, 에폭 5까지는 급격한 loss의 상승과 accuracy의 감소를 보였으며, 이후 완만한 감소세를 보였습니다. 에폭이 지날 수록 Train accuracy는 1에 가깝게 올라가는 추세를 보였으며, 마지막 에폭(29) 기준으로 92%를 보였습니다.\n",
"Valid loss는, 에폭 5까지는 급격한 loss의 상승과 accuracy의 감소를 보였으나, 이후 수렴 진동하는 모습을 보였습니다. 진동하는 동안의 Valid accuracy는 88% 정도를 보였습니다. 따라서 에폭 5 이후로는 훈련이 잘 되지 않는 모습을 보였으나, 그럼에도 정확도가 88% 정도를 보이므로 비교적 잘 훈련된 모델이라 볼 수 있다고 생각합니다.\n",
"\n",
"이외에 연산의 빠른 수행을 위해 Batch size를 4096으로 조정하거나 Reproducible하도록 random seed를 학번(201955277)으로 고정하는 등 모델의 성능 향상에 영향을 끼치지 않는 파라미터를 몇몇 조정한 바 있습니다."
]
},
{
"cell_type": "markdown",
"id": "2cda6314",
"metadata": {},
"source": [
"## CNN, FNN 비교 분석\n",
"\n",
"CNN의 경우 92%정도의 정확도를 보이도록 비교적 쉽게 훈련시킬 수 있었으나, FNN의 경우 88% 정도의 정확도를 넘어서도록 훈련하기가 힘들었습니다. 오랜 시간동안 다양한 구조로 FNN을 개선시키려 노력하였으나, 제가 수행한 실험에서 가장 높은 정확도를 보인 모델이 상기의 모델(88%의 정확도)입니다.\n",
"\n",
"CNN은 이미지라는 2차원적으로 연속적인 데이터에 대해 컨벌루션 연산으로 평면 상 일정 간격으로 모든 영역의 특징점을 모으거나(컨벌루션) 뭉개뜨려서 주요 특징점 이외에는 도태되도록 하는(풀링) 등 이미지의 특징을 살리는 연산을 할 수 있도록 만들어졌다고 생각합니다.\n",
"\n",
"반면, FNN은 2차원 이미지를 1차원에 나열하여, 평면 상의 두 축에 대해 한 축에 대한 연속성은 고려될 수 있겠으나 다른 축에 대한 연속성은 무시되는 문제가 있다고 생각합니다.\n",
"\n",
"이는 본 실험에서도 모델 훈련의 정확도(CNN: 92%, FNN: 88%)와 난이도(CNN: 비교적 쉬움, FNN: 시간을 투자하여 개선시키려 노력하였으나 추가 개선이 어려움)의 차이에서 볼 수 있습니다."
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.7.10"
}
},
"nbformat": 4,
"nbformat_minor": 5
}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment