#40: Translate 3.6 - paragraph 6 / 9

KerasKorea · Sep 12, 2018 · 672bcad · 672bcad
1 parent 63cacbd
commit 672bcad
Showing 1 changed file with 46 additions and 6 deletions.
diff --git a/40_Keras와 Jupyter Notebook으로 시작하는 딥러닝/3.6-classifying-newswires.ipynb b/40_Keras와 Jupyter Notebook으로 시작하는 딥러닝/3.6-classifying-newswires.ipynb
@@ -456,9 +456,26 @@
     "For this reason we will use larger layers. Let's go with 64 units:"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# Paragraph 4\n",
+    "## 네트워크 구성하기\n",
+    "\n",
+    "뉴스 주제를 분류하는 문제는 앞서 영화 리뷰를 분류하는 문제와 아주 유사합니다. 두 경우 모두 짧은 텍스트들을 분류하는 문제입니다. \n",
+    "다만 출력 클래스가 2개에서 46개로 바뀌었습니다. 즉, 출력 공간의 차원이 훨씬 더 큽니다.\n",
+    "\n",
+    "우리가 이전에 사용하기도 했었던 `Dense` 레이어에서는, 각 레이어는 오직 이전 레이어의 출력의 정보에만 접근할 수 있습니다. \n",
+    "만일 어떤 레이어가 분류 문제에 필요한 정보를 잃는다면, 이 정보는 이 후의 레이어에서 복구할 수 없습니다. 어떤 레이어가 \"정보 병목\"이 될 수 있는 것입니다. \n",
+    "앞선 예제에서, 우리는 16차원의 중간 레이어들을 사용했습니다. 하지만 16-차원은 46개의 다양한 클래스를 나누기에는 턱없이 부족합니다. 이러한 크기가 작은 레이어들은 정보 병목으로서의 역할을 하여 정보를 영구적으로 떨어뜨립니다.\n",
+    "\n",
+    "이러한 이유로 인해 우리는 이제 조금 더 큰 레이어를 사용할 것입니다. 우선 64개의 유닛으로 시작해봅시다. "
+   ]
+  },
   {
    "cell_type": "code",
-   "execution_count": 12,
+   "execution_count": 10,
    "metadata": {
     "collapsed": true
    },
@@ -477,7 +494,6 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "\n",
     "There are two other things you should note about this architecture:\n",
     "\n",
     "* We are ending the network with a `Dense` layer of size 46. This means that for each input sample, our network will output a \n",
@@ -491,9 +507,22 @@
     "distance between these two distributions, we train our network to output something as close as possible to the true labels."
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "우리가 설계한 아키텍쳐에 대해서 여러분이 알고 넘어가야 할 것이 두 가지 있습니다. \n",
+    "\n",
+    "* 이 네트워크의 마지막은 46 사이즈의 `Dense` 레이어로 구성됩니다. 이는 네트워크의 출력이 46-차원 벡터임을 의미합니다. 이 벡터의 각 요소는 하나의 출력 클래스입니다.  \n",
+    "\n",
+    "* 마지막 레이어에서는 활성 함수로 `softmax`를 이용합니다. 우리는 이미 MNIST 예제에서 살펴본 적이 있습니다. `softmax`라는 것은 출력이 46 개의 출력 클래스에 대한 `확률 분포` 임을 의미합니다. 즉, 모든 입력 샘플에서 네트워크가 46-차원 벡터를 출력하는데, `output[i]`는 입력 샘플이 `i`번째 클래스에 속할 확률을 의미합니다. 46개의 스코어를 모두 더하면 1이 됩니다.\n",
+    "\n",
+    "이 경우 가장 쓸만한 손실 함수는 `categorical_crossentropy` 입니다. 이는 두 개의 확률분포 사이의 거리를 측정하는 방법입니다. 이 예시의 경우에는 네트워크의 출력의 확률분포와 정답 레이블의 정답분포 사이의 거리입니다. 이 두 분포 간의 거리를 최소화 함으로써, 우리는 출력이 정답 레이블에 가까워 지도록 학습을 시킬 수 있는 것입니다. "
+   ]
+  },
   {
    "cell_type": "code",
-   "execution_count": 13,
+   "execution_count": 11,
    "metadata": {
     "collapsed": true
    },
@@ -514,9 +543,19 @@
     "Let's set apart 1,000 samples in our training data to use as a validation set:"
    ]
   },
+  {
+   "cell_type": "markdown",
+   "metadata": {},
+   "source": [
+    "# Paragraph 5\n",
+    "## 모델 검증하기\n",
+    "\n",
+    "앞서 1,000개의 **학습 데이터**(training data) 를 **검증 집합**(validation set) 으로 남겨두었습니다."
+   ]
+  },
   {
    "cell_type": "code",
-   "execution_count": 14,
+   "execution_count": 12,
    "metadata": {
     "collapsed": true
    },
@@ -533,7 +572,8 @@
    "cell_type": "markdown",
    "metadata": {},
    "source": [
-    "Now let's train our network for 20 epochs:"
+    "Now let's train our network for 20 epochs:\n",
+    "네트워크를 20 에포크 동안 학습시켜봅시다"
    ]
   },
   {
@@ -1083,7 +1123,7 @@
    "name": "python",
    "nbconvert_exporter": "python",
    "pygments_lexer": "ipython3",
-   "version": "3.6.5"
+   "version": "3.6.1"
   }
  },
  "nbformat": 4,