머신 러닝의 종류

로봇 & 과학|2019. 7. 9. 16:23

인공지능과 머신러닝 

머신러닝이란 인간이 컴퓨터에 일일이 어떻게 할지 지시하지 않고, 컴퓨터가 데이터를 통해 스스로 학습해서 수행 방법을 찾아내도록 하는 것이다. 최근 인공지능의 폭발적인 성장은 머신러닝 기술의 발달에 기인한다. 머신러닝이 컴퓨터 감각, 자연어 처리, 자동 추론 등 인공지능 안의 여러 분야의 문제를 해결해나가고 있는데, 그러다 보니 이제는 제각각 발달되어왔던 인공지능 내의 분류 기준조차 모호해지고 있다. 조금 과장하면 머신러닝이 다른 여러 분야를 집어삼키고 있다고도 할 수 있다. 그래서 인공지능에서 가장 중요한 것은 머신 러닝이다. 머신러닝은 이미 매우 다양한 영역에서 우리를 돕고 있고, 그 역할 범위가 계속 커지고 있다. 컴퓨터를 비즈니스의 거의 모든 영역에 사용했듯이, 컴퓨터와 데이터의 새로운 활용 방법인 머신러닝 역시 데이터만 충분하다면 그 자체로 비즈니스의 거의 모든 부분에 걸쳐 사용할 수 있을 것이다.




머신러닝의 종류 

머신러닝은 학습 방법에 따라 크게 지도 학습, 비지도 학습, 강화 학습으로 나눌 수 있다.


학습 방법에 따른 머신러닝의 종류


지도 학습 : 명시적 정답으로 학습 • 예측 모델 등에 사용

비지도 학습 : 명시적 정답 없이 학습 · 군집화 등에 사용

강화 학습 : • 시뮬레이션 반복 학습 · 성능 강화 등에 사용


지도 학습은 명확한 정답 데이터가 있는 경우 이를 학습하고 나머지 영역에서 정답과 유사한 것을 찾아내는 방법이다. 쉽게 접근할 수 있는 지도 학습 활용 방법으로는 고객 타겟팅을 들 수 있다. A라는 제품을 구매한 고객을 정답지로 학습하고, 나머지 고객 중에서 A 제품을 살 고객을 찾아 타겟팅하는 방식은 구매 데이터만 있다면 비교적 쉽게 시도해볼 수 있다. 스팸 메일이라는 정답 데이터를 주고 나머지 메일 중 스팸 메일을 가려내는 것, 신용카드 사기 거래라는 정답 데이터를 주고 나머지 거래 중 사기 거래를 적발하는 것, 고장 제품 생산 당시의 프로세스 데이터를 정답 데이터로 주고 고장을 미리 예측하는 것 등 지 도 학습을 이용할 수 있는 일은 무궁무진하다.


비지도 학습은 인간도 정답을 모르거나 정답이라는 것이 없는 경우에 데이터 를 학습해 파악하는 방식이다. 입력의 규칙성에 따라 군집 분석(Cluster analysis), 의존 구조(dependency structure) 학습, 벡터 양자화(vector quantization), 데이터 차원 축소(data dimensionality reduction) 등으로 구분한다. 


강화학습은 강화형 기계 학습은 지도형/비지도형 기계 학습에 이용되는 훈련 데이터 대신, 주어진 상태에 맞춘 행동의 결과에 대한 보상(reward)을 준다. 컴퓨터는 보상을 이용하여 성능을 향상시킨다. 주로 게임이나 로봇 제어 등에 적용된다.


예를 들어보자.체스 프로그램을 학습시킬 때, 경우의 수가 너무 많고(약35의 100승) 정해진 하나의 답이 없으므로, 학습 훈련 데이터로 입력(주어진 상태)에 대한 출력(가장 적절한 행동)을 제공하기는 쉽지 않다. 


하지만 체스가 종료되면 그 직전에 둔 일련의 수(, 행동)들이 좋았는지 나빴는지를 학습 알고리즘에게 알려 줄 수 있다. 이렇게 행동의 좋고 나쁜 정도를 학습 알고리즘에게 알려 주는 것을 보상(reward) 또는 강화(reinforcement)라고 하며, 이러한 정보를 이용하는 학습이 강화학습이다. 



댓글()