1. 머신러닝
- AI : 인간의 지능을 요구하는 업무를 수행하기 위한 시스템
- 머신러닝 : 관측된 패턴을 기반으로 의사결정을 지원하는 시스템
- 딥러닝 : 인공신경망을 이용한 머신러닝
2. 머신러닝의 종류
- 지도학습 : 문제와 답을 모두 알려주고 학습시키는 방법 - 예측, 분류
- 비지도학습 : 답을 가르쳐주지 않고 학습시키는 방법 - 군집, 연관규칙
- 강화학습 : 보상을 통해 상은 최대화, 벌은 최소화하는 방향으로 행위를 강화하는 학습 - 보상
- 숫자를 맞추는 방법 => 회귀 분석 원리
- 범주를 맞추는 방법 => 분류 분석 원리
3. 선형회귀
- (실제 데이터 - 예측 데이터) 로 정의 : "오차"를 구하는데, 부호가 달라서 더하게 되면 상쇄되는 현상이 발생
- 에러를 제곱하여 모두 양수로 만들고 다 합치기 : 따라서 오차를 제곱하여 오차의 합이 가장 작은게 잘 설명해주는 직선이다
- 데이터 수 만큼 나누기 : 근데 데이터가 늘어나면 오차의 합이 커지게 되므로 전체 오차의 합을 데이터의 개수로 나눠줌 ( 오차의 평균 구하기 )
4. 선형회귀 이론
- 머신러닝에서 사용하는 선형회귀 식 : Y = wX + b
→ 회귀계수 또는 가중치의 값을 알면 x가 주어졌을때 y의 값을 알 수 있음 (x가 1만큼 증가하면 y가 x의 가중치만큼 증가)
5. 회귀분석의 평가지표
1) MSE (평균제곱오차)
: 앞으로 만나는 숫자 예측 문제는 모델을 머신러닝이든 딥러닝이든 어떤 모델을 만들어도 위의 mse 지표를 최소화하는 방향으로 평가하게 된다
2) 기타 평가지표
- RMSE : MSE에 루트를 씌운 값
- MAE : 절대값을 이용해서 오차 구하기
5. 선형회귀만의 평가지표
● R square
- 결정계수 (R2) : 표본에 대한 회귀모형의 설명력, 값이 클수록 모델의 설명력이 커짐