머신러닝 & 딥러닝
가장 길게 다양한 실습을 한 것 같은 9월의 수업
이어지는 미니프로젝트까지 이어져 있어 가장 길게 이어진 수업 !
머신러닝
지도학습 - 분류(Classifier) / 회귀(Regressor)
▶ 분류와 회귀는 서로 다른 알고리즘을 가지고 있기 때문에 문제 유형을 정확히 파악하고 알고리즘과 평가 방법을 선택해야 함
▶ 학습 알고리즘을 제공하는 대표적인 파이썬 라이브러리
• '사이킷런' 이라고 읽음
• 오픈 소스로서 개인, 비즈니스 관계없이 누구나 무료로 사용가능
• 여러 알고리즘을 같은 구조의 코드로 사용할 수 있어 배우기 쉬움
• 여러 예제 데이터셋을 포함하고 있어 학습에 용이
• 처음 Machine Learning을 배울 때 가장 적합한 라이브러리
▶ 가장 중요한 sklearn 구조
1. 불러오기 - 라이브러리 import
2. 선언하기 - 사용할 알고리즘을 모델로 선언
3. 학습하기 - 모델.fit(x_train,y_train) 형태로 학습 시키기
4. 예측하기 - 모델.predict(x_test) 형태로 예측 값 만들기
5. 평가하기 - 예측 값과 실제 값으로 평가
▶ 어떻게 평가할 것인가?
회귀 모델 평가
• 회귀 모델이 정확한 값을 예측하기는 사실상 어려움
• 예측 값과 실제 값에 차이(=오차)가 존재할 것이라 예상함
• 예측 값이 실제 값에 가까울 수록 좋은 모델이라 할 수 있음
→ 예측한 값과 실제 값의 차이(=오차)로 모델 성능을 평가
• 분류 모델 평가
• 분류 모델은 0인지 1인지를 예측하는 것
• 실제 값도 0과 1이고 예측 값도 0과 1임(이진분류의 경우)
• 하지만 0을 1로 예측하거나 1을 0으로 예측할 수 있음
• 예측 값이 실제 값과 많이 같을 수록 좋은 모델이라 할 수 있음
→ 정확히 예측한 비율로 모델 성능을 평가
기본 알고리즘
Linear Regression / K-Nearest Neighbor / Decision Tree / Logistic Regression
→ 여러 개 알고리즘 모델링을 통해 오차가 가장 적은 알고리즘으로 값을 예측
* Hyperparameter
→ 알고리즘을 사용하여 모델링할 때 최적화하기 위해 조절할 수 있는 옵션
• 모델의 성능 향상을 위해 최선의 하이퍼파라미터 값을 찾는 다양한 시도를 해야 함
• 다양한 시도 방법 - Grid Search / Random Search
딥러닝 (가장 많은 실습을 했지만, 어렵고 이해하기 어렵던 부분)
구조
1. 모델 설계 - 딥러닝 구조 설계 (히든 레이어, 노드 수..)
2.컴파일 - Optimizer, Loss Function 지정
3. 학습 - 모델.fit(x_train,y_train)
4. 학습 그래프 - 학습 진행 그래프
5. 검증하기 - 예측 값과 실제 값으로 평가
Regression / Classification 코드 이해가 중요 !! (외워야)
'AIVLE SCHOOL - DX 트랙' 카테고리의 다른 글
12월 에이블 (1) | 2022.12.26 |
---|---|
10월의 에이블 (0) | 2022.10.24 |
AIVLE Day (9.7 1차) (0) | 2022.09.24 |
8월의 에이블 (0) | 2022.09.23 |
에이블스쿨의 첫 번째 이벤트, “메타버스 스터디룸 만들기 이벤트” (1) | 2022.08.29 |