Machine Learning

01. Introduction to Machine Learning

정우섭 2023. 6. 26. 19:06

빅데이터

IT기술과 통신의 발전으로 빅데이터는 어디에든 존재한다.

 

중요한 점은, 데이터는 무작위적이지 않고, 구조를 갖고있다는 점이다.

 

우리는 아래 두가지 목적을 위해 데이터에서 '구조'를 알아내야한다.

 

목적

1. Understanding the process

2. Making Predictions for the future

 

분석 데이터의 예시

분석 데이터의 예시 : 비트코인 가격의 패턴

 

그렇다면 머신러닝(ML)은 무엇일까?

 

학계의 저명한 석학인 Tom Mitchell은 머신러닝을 다음과 같이 정의했다.

Machine Learning(ML) is the study of computer algorithms that improve automatically through experience - Tom Mitchell

 

더 설명하자면, Machine Learning(ML)은 통계학을 기반으로 한 AI의 한 분야이다.

 

그리고 'Deep Learning'은 Machine Learning의 기술 중 하나이다.

 

AI, ML, 딥러닝의 포함관계

 

ML Workflow

Training은 즉, Optimazation(최적화)를 말한다.

 

위에서 말하는 최적화 과정이 곧 ML의 모든 것이라고 해도 좋다.

 

자세한 설명에 앞서, 먼저 Model과 Optimization에 대해서 알아보자.

 

정의는 다음과 같다.

 

Model

  • Data를 수학적으로 표현해놓은 것(일종의 함수)
  • 일반적으로 몇몇의 변수로 이루어진다.

 

Optimization

  • 최적의 변수값을 찾는 과정(데이터에 가장 적합한 모델을 찾기 위해)

Machine Learning Process

 

ML을 통해 할 수 있는 것

 

1. Description

  • Gain knowledge from data and unveil its hidden structure.
  • Application: Principal Component Analysis, Generative Models.

 

2. Prediction/Inference

  • Make predictions of unseen data.
  • Application: Classification, Regression, Decision Rules

 

개인적으로 현재 가장 엄청난 application이 Generative Model이라고 생각한다.

 

ChatGPT와 같은 언어 Generative Model(생성 모델)이라던지, GAN 등과 같은 사진 생성 모델 등에 대한 생성 모델에 대한 기술이 급속도로 발전하며 인공지능 분야에 새로운 혁신을 일으키기 때문이다.

 

이에 대한 기술이 발전하며 학습에 사용할 데이터를 지수적으로 증가시켜 새로운 모델이 더욱 고도의 학습이 가능한 환경이 갖춰지기 때문이다.

 

Three Types of ML

ML에는 아래와 같은 3가지 방식이 존재한다.

(Label은 예를 들면 학습데이터인 토끼 사진에 해시태그 '#토끼' 등의 추가 정보를 지칭한다.)

 

출처: https://www.mathworks.com/discovery/reinforcement-learning.html