Lecture 1 "Supervised Learning Setup" -Cornell CS4780 Machine Learning for Decision Making SP17
Lecture #1 - Supervised Learning Setup
by Cornell CS4780 , Machine Learning for Decision Making SP17
* 부족한 영어 실력으로 잘못된 해석이 있을 수 있습니다. 수정이 필요한 부분이 있다면 알려주시면 감사하겠습니다.
* 부족한 영어 실력으로 잘못된 해석이 있을 수 있습니다. 수정이 필요한 부분이 있다면 알려주시면 감사하겠습니다.
개요
- Machine Learning 이란?
- Machine Learning 의 역사
- Machine Learning 의 타입 및 사례
- Supervised Learning 구조
1. ML(Machine Learning) 이란?
CS(Computer Science) 와 ML(Machine Learning) 의 차이점을 통해서 이해를 해보도록 하겠습니다.
CS의 경우, Program을 Logic을 이용해서 사람이 만드는 구조하고 한다면,
ML의 경우, Input에 활용되는 Data에 의해 Program이 생성되는 구조입니다.
하여 Data이 양과 질에 의해서 Program의 품질도 개선이 될수 있습니다.
2. ML(Machine Learning)의 역사
- 1952년 Samuel's Checker player
- MiniMax Algorithm ( Traditional AI )
- 1957년 Perceptron ( Frank Rosenblatt @ Cornell )
- AI Winter
- 1969년 Minskey & Papert "killed" AI
- AI 버블 붕괴 -> AI Research 와 관련한 자금투자 붕괴
- Rebirth as ML
- ML : Bottom up / AI : Top Down
- ML : More practical smaller goals
- Based on Statistics and Optimization, not Logic
- 1994년 TD-Gammon
- Gerry Tesauro ( IBM ) teach a neural network to play Backgammon.
- 승패에 따른 점수를 부여하는 시도 = Reinforcement Learning
- 1997년 Deep Blue
- IBM's Deep Blue wins against Kasparov in chess
- Next...
- ML Model을 생성하는 사람은 소수이며, 많은 사람들이 이런 소수가 만든 Model 을 사용하는 구조가 될것이다
3. Machine Learning 의 타입 및 사례
- Supervised Learning
- Label 을 주고, UnLabel 된 것을 예측하는 방식
- 사례 ) 스팸메일 분류
- Unsupervised Learning
- Data를 주고 유사한 것(패턴,구조,부분공간 등) 들을 찾아내는 방식
- 사례 ) 기사 분류 ( 토픽별 유사 기사들을 분류 )
- Reinforcement Learning
- 피드백을 통해 배우는 방식
- 사례 ) 로봇 개발 ( 걷고, 뛰고, ... ), 게임 AI
4. Supervised Learning 구조
- Example of Y
- Binary Classification : Y = {0,1}
- Multi-class Classification : Y = {1, ..., k}
- Regression : Y∈ℝ
- D = { (x₁, y₁), (x₂, y₂), ... ( x៷,y៷) } ⊆ X*Y
- X = ℝ🇩 ( N 차원(dimension) 의 실수 )
- 위 말은 ( x₁₁, x₁₂, x₁₃, y₁) 형태의 구조를 가질수도 있다는 의미
- Features
- y៷ ∈ Y
- Label
- (x₁, y₁) ∼ P ( IID )
- x 값들으로 인해 y가 될 확률을 의미
- IID ( independent and identically distributed, 독립항등분포 ) : 서로 독립적이고 동일한 분포를 나타낸다는 의미
- 예시1 ) 동전을 N번 던질때, 각각은 동전 앞면 혹은 뒷면으로 N번을 던질때 동일한 확률로 던져짐
- 예시2) 상자안에 1~10까지의 숫자가 적힌 공이 있고, 그 중에서 1개의 공을 뽑았을 때, 특정 숫자가 나올 확률. 다시 뽑을 때는 뽑았던 공을 다시 상자에 넣고 다시 뽑는 행동을 반복할 때
- Example > Patient Data
- BoW(Bag of Words)
- 문자형 데이터를 숫자형 데이터로 변환하기 위한 방법
- 위 예시에서는 단어가 나타난 건수를 숫자로 치환함
댓글
댓글 쓰기