Normal Equation
๊ฒฝ์ฌ ํ๊ฐ๋ฒ์ cost function $J$์ ๊ฐ์ ์ค์ด๋ ๋ฐฉ๋ฒ ์ค ํ๋์ด๋ค. cost function์ ๊ฐ์ ์ค์ด๋ ๋ค๋ฅธ ๋ฐฉ๋ฒ์ ์์๋ณด๋๋ก ํ์! ์ด๋ฒ์ ์์๋ณผ ๋ฐฉ๋ฒ์ ๋ช ์พํ๊ฒ ์ต์ํ๋ฅผ ํ๊ณ , ๋ฐ๋ณต ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํ์ง ์๋๋ค. "Normal Equation"์ $\theta_{j}$์ ๊ดํ์ฌ ๋ฏธ๋ถ์ ํจ์ผ๋ก์จ 0์ผ๋ก ์ค์ ํ์ฌ $J$๋ฅผ ์ต์ํํ๋ค. ์ด๋ ๋ฐ๋ณต ์์ด ์ต์ ์ $\theta$๋ฅผ ์ฐพ์ ์ ์๊ฒ ํด์ค๋ค. normal equation ๊ณต์์ ๋ค์๊ณผ ๊ฐ๋ค.
$\theta = (X^{T}X)^{-1}X^{T}y$
normal equation์์๋ feature scaling์ ํ ํ์๊ฐ ์๋ค. ๋ค์์ ํ๋ ๊ฒฝ์ฌ ํ๊ฐ๋ฒ๊ณผ normal equation ๊ฐ์ ๋น๊ต๋ฅผ ๋ณด์ฌ์ค๋ค.
Gradient Descent | Normal Equation |
$\alpha$๋ฅผ ์ ํํด์ผ ํจ | $\alpha$๋ฅผ ์ ํํ ํ์ X |
๋ง์ ๋ฐ๋ณต ๋๋ฐ | ๋ฐ๋ณตํ ํ์ X |
$O(kn^{2})$ | $O(n^{3})$ |
$n$์ ๊ฐ์ด ํด ๋ ์ ์๋ | $n$์ ๊ฐ์ด ํฌ๋ฉด ๋๋ ค์ง |
normal equation์์ inversion์ ๊ณ์ฐํ๋ ๊ฒ์ ๋ณต์ก๋ $O(n^{3})$์ ๊ฐ์ง๋ค. ๊ทธ๋์ ๋ง์ ์์ feature์ ๊ฐ์ง๊ณ ์์ผ๋ฉด, normal equation์ ๋๋ ค์ง๋ค. $n$์ ๊ฐ์ด 10,000์ ๋์ด์๊ฒ ๋๋ฉด, normal equation์์ ๋ฐ๋ณต ํ๋ก์ธ์ค๋ก ๋์ด๊ฐ๋ ๊ฒ์ด ์ข๋ค.
Normal Equation Noninvertibility
๋ง์ฝ $X^{T}X$๊ฐ ๋น๊ฐ์ญ์ฑ์ด๋ฉด ์ผ๋ฐ์ ์ผ๋ก ๋ค์๊ณผ ๊ฐ๋ค.
- ๋ feature๊ฐ ๋งค์ฐ ๋ฐ์ ํ๊ฒ ๊ด๋ จ๋ redundant feature
- ๋๋ฌด ๋ง์ feature$(m \leq n)$. ์ด ๊ฒฝ์ฐ์๋ ๋ช ๊ฐ์ feature๋ฅผ ์์ ๊ฑฐ๋ "์ ๊ทํ"๋ฅผ ์ฌ์ฉํ๋ฉด ๋๋ค.
์ ๋ฌธ์ ์ ๋ํ ํด๊ฒฐ์ฑ ์๋ ๋ค๋ฅธ feature์ ์ ํ์ ์ผ๋ก ์ข ์๋ feature์ ์ญ์ ํ๊ฑฐ๋ ๊ธฐ๋ฅ์ด ๋๋ฌด ๋ง์ ๋ ํ๋ ์ด์์ feature์ ์ญ์ ํ๋ ๊ฒ์ด ํฌํจ๋๋ค.
'Lecture ๐งโ๐ซ > Coursera' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
[Machine Learning] Multiclass Classification (0) | 2023.03.15 |
---|---|
[Machine Learning] Classification & Representation (0) | 2023.03.15 |
[Machine Learning] Multivariate Linear Regression (0) | 2023.03.14 |
[Machine Learning] Parameter Learning - Gradient Descent (0) | 2023.03.13 |
[Machine Learning] Model & Cost Function (0) | 2023.03.13 |