2.5. How to create a decision tree given a training dataset

2021. 1. 23. 23:24·컴퓨터/인공지능 및 기계학습 개론1

Linear Regression(회기 분석)

 

Introduction to Linear Regression

Housing Information : 13개의 continuous variable(independent values), 1개의 true value(dependent value)로 이루어져있다.

function approximation을 linear한 형태 function으로 approximation하는 것이 linear regession이다.

 

이전까지는 hypothesis를 rule로 정의했지만, 이번에는 function으로 정의한다.

θ zero에 linear sum을 더한 것으로 dependent variable을 정의한다. 

θ를 잘 정하면 잘 approximation 될 것이다.

이 때, n = independent value의 개수, linerly wieght sum과 θ가 있다.

 

Finding Parameter in Linear Regression

θ zero를 1로 하여 dummy data처럼 만든다.

현실에선 error가 있는데 이 error을 포함한 것이 true parameter이다.

(위에서 f hat을 한 이유는 가짜임을 표현하기 위함)

True Y라는 것은 Xθ + e이다.

 

X는 data로 정의되어 있고, 목표는 e를 줄이고 θ를 늘리는 것이다.

argmin : minimize 시켜주는 θ를 만들어서 그것을 θ hat이라고 잡겠다. 여기서 제곱은 에러에 패널티를 주는 것.

Y는 관측된 값으로 independnet variable, X는 dependent variable이다.

이 값을 미분하여 정리하면 θ는 다음과 같다.

이 때 X를 뻥튀길 할 수록 실제 값에 더욱 가까워진다. 단, 더이상 linear 되지 않는다.

또한, 승수를 높여가며 만든 곡선이 미래의 값에도 통하는지는 의문스럽다.

 

Limitations

심플하면 고장나지 않고, 오류가 적기 때문에 많은 곳에서 사용될 수 있다.

하지만 많은 데이터를 기반으로 training, paramter 대입 등에선 한계점이 분명히 존재한다.

>> 데이터가 많아질수록 억지스러운 듯 모델이 복잡해지고, 에러가 늘어날 수 있다.

 

하지만 분명히 기초가 되는 모델임을 분명하다.

 

저작자표시 (새창열림)

'컴퓨터 > 인공지능 및 기계학습 개론1' 카테고리의 다른 글

3.3. Naive Bayes Classifier  (0) 2021.01.24
3.1. Optimal Classification  (0) 2021.01.24
2.4. Entropy and Information Gain  (0) 2021.01.23
2.3. Introduction to Decision Tree  (0) 2021.01.23
2.2. Introduction to Rule Based Algorithm  (0) 2021.01.23
'컴퓨터/인공지능 및 기계학습 개론1' 카테고리의 다른 글
  • 3.3. Naive Bayes Classifier
  • 3.1. Optimal Classification
  • 2.4. Entropy and Information Gain
  • 2.3. Introduction to Decision Tree
스커
스커
학생 시절 만든 블로그 [폐쇄]
  • 스커
    Legacy
    스커
  • 전체
    오늘
    어제
    • 분류 전체보기 (115)
      • 독후감 (0)
      • 일상 (0)
      • 컴퓨터 (101)
        • BOJ (19)
        • 프로그래머스 (0)
        • 파이썬 공부정리 (21)
        • 파이썬 알고리즘 인터뷰 (7)
        • 자료구조와 함께 배우는 알고리즘 입문 (5)
        • 기타 언어 공부 (1)
        • 인공지능 및 기계학습 개론1 (18)
        • MATLAB을 이용한 알기 쉬운 수치해석 (29)
        • 딥러닝 공부 (1)
      • NRF 시민참여단 (8)
        • 조사 자료 (4)
        • 발표 자료 (4)
      • 학교 공부 (0)
        • 과제보관함 (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 미디어로그
    • 위치로그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    BCI
    뇌공학
    한국연구재단 #NRF #로봇돌봄 #효 #인공지능 #로봇 #윤리규범
    백준
    한국연구재단
    파이썬
    시민참여단
    NRF
    15128
    erp
    priming effect
    phython
    BOJ
    Congruent Numbers
    EEG
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.6
스커
2.5. How to create a decision tree given a training dataset
상단으로

티스토리툴바