Skip to content

Commit

Permalink
#40: Translate 3.6 - paragraph 6 / 9
Browse files Browse the repository at this point in the history
  • Loading branch information
visionNoob committed Sep 12, 2018
1 parent 63cacbd commit 672bcad
Showing 1 changed file with 46 additions and 6 deletions.
Original file line number Diff line number Diff line change
Expand Up @@ -456,9 +456,26 @@
"For this reason we will use larger layers. Let's go with 64 units:"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Paragraph 4\n",
"## 네트워크 구성하기\n",
"\n",
"뉴스 주제를 분류하는 문제는 앞서 영화 리뷰를 분류하는 문제와 아주 유사합니다. 두 경우 모두 짧은 텍스트들을 분류하는 문제입니다. \n",
"다만 출력 클래스가 2개에서 46개로 바뀌었습니다. 즉, 출력 공간의 차원이 훨씬 더 큽니다.\n",
"\n",
"우리가 이전에 사용하기도 했었던 `Dense` 레이어에서는, 각 레이어는 오직 이전 레이어의 출력의 정보에만 접근할 수 있습니다. \n",
"만일 어떤 레이어가 분류 문제에 필요한 정보를 잃는다면, 이 정보는 이 후의 레이어에서 복구할 수 없습니다. 어떤 레이어가 \"정보 병목\"이 될 수 있는 것입니다. \n",
"앞선 예제에서, 우리는 16차원의 중간 레이어들을 사용했습니다. 하지만 16-차원은 46개의 다양한 클래스를 나누기에는 턱없이 부족합니다. 이러한 크기가 작은 레이어들은 정보 병목으로서의 역할을 하여 정보를 영구적으로 떨어뜨립니다.\n",
"\n",
"이러한 이유로 인해 우리는 이제 조금 더 큰 레이어를 사용할 것입니다. 우선 64개의 유닛으로 시작해봅시다. "
]
},
{
"cell_type": "code",
"execution_count": 12,
"execution_count": 10,
"metadata": {
"collapsed": true
},
Expand All @@ -477,7 +494,6 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"\n",
"There are two other things you should note about this architecture:\n",
"\n",
"* We are ending the network with a `Dense` layer of size 46. This means that for each input sample, our network will output a \n",
Expand All @@ -491,9 +507,22 @@
"distance between these two distributions, we train our network to output something as close as possible to the true labels."
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"우리가 설계한 아키텍쳐에 대해서 여러분이 알고 넘어가야 할 것이 두 가지 있습니다. \n",
"\n",
"* 이 네트워크의 마지막은 46 사이즈의 `Dense` 레이어로 구성됩니다. 이는 네트워크의 출력이 46-차원 벡터임을 의미합니다. 이 벡터의 각 요소는 하나의 출력 클래스입니다. \n",
"\n",
"* 마지막 레이어에서는 활성 함수로 `softmax`를 이용합니다. 우리는 이미 MNIST 예제에서 살펴본 적이 있습니다. `softmax`라는 것은 출력이 46 개의 출력 클래스에 대한 `확률 분포` 임을 의미합니다. 즉, 모든 입력 샘플에서 네트워크가 46-차원 벡터를 출력하는데, `output[i]`는 입력 샘플이 `i`번째 클래스에 속할 확률을 의미합니다. 46개의 스코어를 모두 더하면 1이 됩니다.\n",
"\n",
"이 경우 가장 쓸만한 손실 함수는 `categorical_crossentropy` 입니다. 이는 두 개의 확률분포 사이의 거리를 측정하는 방법입니다. 이 예시의 경우에는 네트워크의 출력의 확률분포와 정답 레이블의 정답분포 사이의 거리입니다. 이 두 분포 간의 거리를 최소화 함으로써, 우리는 출력이 정답 레이블에 가까워 지도록 학습을 시킬 수 있는 것입니다. "
]
},
{
"cell_type": "code",
"execution_count": 13,
"execution_count": 11,
"metadata": {
"collapsed": true
},
Expand All @@ -514,9 +543,19 @@
"Let's set apart 1,000 samples in our training data to use as a validation set:"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Paragraph 5\n",
"## 모델 검증하기\n",
"\n",
"앞서 1,000개의 **학습 데이터**(training data) 를 **검증 집합**(validation set) 으로 남겨두었습니다."
]
},
{
"cell_type": "code",
"execution_count": 14,
"execution_count": 12,
"metadata": {
"collapsed": true
},
Expand All @@ -533,7 +572,8 @@
"cell_type": "markdown",
"metadata": {},
"source": [
"Now let's train our network for 20 epochs:"
"Now let's train our network for 20 epochs:\n",
"네트워크를 20 에포크 동안 학습시켜봅시다"
]
},
{
Expand Down Expand Up @@ -1083,7 +1123,7 @@
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.6.5"
"version": "3.6.1"
}
},
"nbformat": 4,
Expand Down

0 comments on commit 672bcad

Please sign in to comment.