본문 바로가기

카테고리 없음

[TIL] 머신러닝 기초 (1)

1. 머신러닝

  • AI : 인간의 지능을 요구하는 업무를 수행하기 위한 시스템
  • 머신러닝 : 관측된 패턴을 기반으로 의사결정을 지원하는 시스템
  • 딥러닝 : 인공신경망을 이용한 머신러닝

 

2. 머신러닝의 종류

  • 지도학습 : 문제와 답을 모두 알려주고 학습시키는 방법 - 예측, 분류
  • 비지도학습 : 답을 가르쳐주지 않고 학습시키는 방법 - 군집, 연관규칙
  • 강화학습 :  보상을 통해 상은 최대화, 벌은 최소화하는 방향으로 행위를 강화하는 학습 - 보상

- 숫자를 맞추는 방법 => 회귀 분석 원리

- 범주를 맞추는 방법 => 분류 분석 원리

 

 

3. 선형회귀

  • (실제 데이터 - 예측 데이터) 로 정의 : "오차"를 구하는데, 부호가 달라서 더하게 되면 상쇄되는 현상이 발생
  • 에러를 제곱하여 모두 양수로 만들고 다 합치기 : 따라서 오차를 제곱하여 오차의 합이 가장 작은게 잘 설명해주는 직선이다
  • 데이터 수 만큼 나누기 : 근데 데이터가 늘어나면 오차의 합이 커지게 되므로 전체 오차의 합을 데이터의 개수로 나눠줌 ( 오차의 평균 구하기 )

 

4. 선형회귀 이론

  • 머신러닝에서 사용하는 선형회귀 식  :   Y = wX + b

→ 회귀계수 또는 가중치의 값을 알면 x가 주어졌을때 y의 값을 알 수 있음 (x가 1만큼 증가하면 y가 x의 가중치만큼 증가)

 

 

5. 회귀분석의 평가지표

1)  MSE (평균제곱오차)

 

: 앞으로 만나는 숫자 예측 문제는 모델을 머신러닝이든 딥러닝이든 어떤 모델을 만들어도 위의 mse 지표를 최소화하는 방향으로 평가하게 된다

 

2) 기타 평가지표

- RMSE : MSE에 루트를 씌운 값

- MAE : 절대값을 이용해서 오차 구하기

 

 

5. 선형회귀만의 평가지표

●  R square

yi : 데이터의 실제 값 / y^ : 예측한값 / y- : 평균값

 

   - 결정계수 (R2)  : 표본에 대한 회귀모형의 설명력, 값이 클수록 모델의 설명력이 커짐

SSR(회귀) / SST(total) / SSE(에러)