머신러닝

업데이트:

본 내용은 인공지능의 이해의 내용을 참조하여 작성하였습니다.

머신러닝

빅데이터 시대가 도래하면서 우리는 이 데이터를 갖고 예측과 분석을 하게 되는데,
이때, 이와 동시에 많은 발전을 이룬 부분이 딥러닝과 머신러닝 분야이다.

딥러닝은 데이터의 예측과 분석을 하는 기법이고,
머신러닝이란 데이터 내부의 패턴들을 컴퓨터로 학습해 결과를 만들어내는 학문 분야이다.

오늘은 두 내용 중 머신러닝에 대해 다뤄보려고 한다.

머신러닝은 앞에서 언급했던 것 처럼
데이터에서 패턴을 인식하고 이를 컴퓨터로 계산하는 학문분야이다.

그 종류는 크게 지도학습과, 비지도학습, 반지도학습, 강화학습으로 구분된다.

머신러닝의 종류

지도학습

주어진 데이터와 정답값을 이용해 값을 예측하는 학습방법으로,
학습 데이터에 입/출력 정보가 모두 포함돼 있으며, 분류와 회귀로 이루어져 있다.

비지도학습

데이터 자체에서 유용한 패턴값을 찾아내는 학습 방법으로,
출력정보가 없는 학습데이터에 대해서 학습하며, 군집화, 밀도 추정, 토픽 모델링으로 이루어져있다.

반지도학습

지도학습과 비지도학습의 중간으로,
입/출력이 존재하는 데이터 또는 입력만 있는 데이터를 학습 데이터로 사용한다.
반지도학습의 경우 지도학습의 데이터가 적을 때 이를 보완 및 개선하기 위해 사용한다.

강화학습

특정 환경에서 행동에 대한 보상의 경험을 통해 이를 최대화 하는 방향으로 학습하는 방법으로,
기계가 취할 행동은 각 상황에서 보상이 최대가 되는 방향이다.

위에선 머신러닝의 종류에 대해 알아봤다.
다음은 머신러닝에서 사용하는 주된 개념들에 대해 살펴보겠다.

머신러닝의 주요 개념

머신러닝을 접하게 되면 어떤 모델을 적합히켜 결과를 냈다는 말을 많이 들을 것이다.
이때, 모델은 데이터를 바라보는 시점과 가정으로 데이터에 따라 사용할 모델이 달라진다.
이런 모델을 어떤 목적에 따라 학습 목표를 세우고 이를 수치화하는 것을 손실함수 라한다.
손실함수로 표현된 모델을 실제 학습에 시켜보는 것을 최적화 라 하며,
학습을 통해 구현된 모델이 실제 상황에서는 어떠할지 추정하는 것이 모델 평가 이다.

위의 언급한 순서로 머신러닝 과정이 돌아가게 된다.
모델 정하기
먼저, 데이터에 어떤 모델을 사용할지를 정해야한다.

모델 수식화
모델에 대해 어떤 학습 목표를 잡아 어떻게 수치화 할것인가?

모델 학습
손실함수로 표현된 모델을 학습시키기

모델 평가
모델로 추정된 값이 실제 상황에서도 유효한지를 파악

태그:

카테고리:

업데이트:

댓글남기기