머신러닝의 개념과 용어
본 글은 모두를 위한 머신러닝/딥러닝 강의를 참고하여 작성하였습니다.
ML lec 01 - 기본적인 Machine Learning 의 용어와 개념 설명
프로그램을 이용해 무언가를 표현하는 일에는 한계점이 존재합니다.
예를들어, 스팸 필터의 경우 한 두가지의 단어를 제외시킨다고 모두 걸러지는 것이 아닙니다.
또한, 일상 생활에서 우리가 모든 일을 예측하지 못하듯 일어날 모든 상황을 일일히 지정해줄 수도 없습니다.
이를 해결하기 위해 나타난 것이 바로 Machine Learning 입니다.
Machine Learning은 Arthur Samuel이 주창한 단어로,
“우리가 모든 상황들을 지정해 줄 수 없으니, 여러 상황의 데이터를 줘 스스로 학습하게 하면 어떨까?”
란 의문에서 나온 해결책 입니다.
즉, 사용자가 일일히 지정해주지 않고 스스로 학습하게 하는 컴퓨터 기술 입니다.
그렇다면 머신러닝의 종류는 어떻게 구성 돼 있을까요?
머신러닝은 정답값의 유무에 따라 두 가지로 나눠집니다.
- Supervised Learning
- Unsupervised Learning
Supervised Learning
Supervised Learning은 지도학습이라고도 하며, 컴퓨터가 학습할 데이터에 정답값이 존재하는 학습 방법으로,
실생활에서 주어진 대부분의 데이터들은 정답값을 주고 그 값을 예측하는 지도학습으로 이루어져 있습니다.
어떤 이미지인지 맞추는 데이터, 스팸 필터를 골라내는 데이터, 시험 점수를 예측하는 데이터 등이 그 예입니다.
또한, 대부분의 데이터가 Supervised Learning듯이
모두를 위한 머신러닝/딥러닝 강의에서도 주로 이를 이용하여 학습하게 됩니다.
이 지도학습의 종류는 여러개가 존재합니다.
- Regression
- Classification
Regression
Regression의 경우 데이터의 값을 이용하여 연속적인 값을 예측하는 지도학습의 기법입니다.
Classification
Classification의 경우 데이터의 값을 이용하여 범주값을 예측하는 지도학습의 기법입니다.
이 경우는 두 가지로 나눌 수 있습니다.
두 개의 범주값을 예측하는 Binary Classfication과
세 개 이상의 범주값을 예측하는 Multi-label Classfication이 존재합니다.
Unsupervised Learning
Unsupervised Learning는 비지도학습이라고도 하며, 컴퓨터가 학습할 데이터에 정답값이 존재하지 않는 학습 방법입니다.
댓글남기기