Update README.md
Browse files
README.md
CHANGED
@@ -37,8 +37,9 @@ Dataset : AI Hub
|
|
37 |
- 한국어 방언 발화(전라도)
|
38 |
- 중·노년층 한국어 방언 데이터(강원도, 경상도)
|
39 |
- 중·노년층 한국어 방언 데이터(충청도, 전라도, 제주도)
|
40 |
-
|
41 |
-
|
|
|
42 |
|
43 |
## Model description
|
44 |
|
|
|
37 |
- 한국어 방언 발화(전라도)
|
38 |
- 중·노년층 한국어 방언 데이터(강원도, 경상도)
|
39 |
- 중·노년층 한국어 방언 데이터(충청도, 전라도, 제주도)
|
40 |
+
|
41 |
+
위 데이터로부터 6개의 각 클래스별 약 15만개씩 sampling하여 88만개의 문장을 train set으로 구성하고, 3만개씩 sampling하여 총 18만개의 문장을 evaluation dataset으로 사용
|
42 |
+
|
43 |
|
44 |
## Model description
|
45 |
|