Paper Reading ๐/Mathematics(์ ํ๋์, ํ๋ฅ ๊ณผ ํต๊ณ, ๋ฏธ์ ๋ถํ)
Friedberg Linear Algebra ํ๋ฆฌ๋๋ฒ๊ทธ ์ ํ๋์ํ์ ๊ณต๋ถํ๋ฉด์ ๊ฐ๊ฐ์ ์ฅ ๋ณ๋ก ์ ๋ฆฌ๋ฅผ ํ์๋ค. Table of Contents 1. ๋ฒกํฐ๊ณต๊ฐ 2. ์ ํ๋ณํ๊ณผ ํ๋ ฌ 3. ๊ธฐ๋ณธํ๋ ฌ์ฐ์ฐ๊ณผ ์ฐ๋ฆฝ์ผ์ฐจ๋ฐฉ์ ์ 4. ํ๋ ฌ์ 5. ๋๊ฐํ$($This post$)$ 6. ๋ด์ ๊ณต๊ฐ 7. ํ์คํ The overview of this chapter 5์ฅ์์๋ ๊ณ ์ณ๊ฐ, ๊ณ ์ ๋ฒกํฐ, ๋๊ฐํ๋ฅผ ํ์ตํ์๋ค. ์ด ์ฃผ์ ์ ๊ฐ์ฅ ์ค์ํ ์์ฉ์ ํ๋ ฌ ๊ทนํ์ ๊ณ์ฐํ๋ ๊ฒ์ด๋ค. 5.4์ ์์๋ ๋ถ๋ณ ๋ถ๋ถ๊ณต๊ฐ๊ณผ ์ผ์ผ๋ฆฌ-ํด๋ฐํด ์ ๋ฆฌ๋ฅผ ๋ค๋ฃฌ๋ค. 5.1 ๊ณ ์ณ๊ฐ๊ณผ ๊ณ ์ ๋ฒกํฐ ์์ 2.5์ ์์ $\textbf{R}^2$์์ ์ง์ $y=2x$์ ๋ํ ๋์นญ ๊ณต์์ ์ ๋ํ์๋ค. ์ ๋ ๊ณผ์ ์ ํต์ฌ์ $[\textbf{T}]_{\beta^{'}}$์ด ๋..
Paper Reading ๐/Mathematics(์ ํ๋์, ํ๋ฅ ๊ณผ ํต๊ณ, ๋ฏธ์ ๋ถํ)
Friedberg Linear Algebra ํ๋ฆฌ๋๋ฒ๊ทธ ์ ํ๋์ํ์ ๊ณต๋ถํ๋ฉด์ ๊ฐ๊ฐ์ ์ฅ ๋ณ๋ก ์ ๋ฆฌ๋ฅผ ํ์๋ค. Table of Contents 1. ๋ฒกํฐ๊ณต๊ฐ 2. ์ ํ๋ณํ๊ณผ ํ๋ ฌ 3. ๊ธฐ๋ณธํ๋ ฌ์ฐ์ฐ๊ณผ ์ฐ๋ฆฝ์ผ์ฐจ๋ฐฉ์ ์ 4. ํ๋ ฌ์$($This post$)$ 5. ๋๊ฐํ 6. ๋ด์ ๊ณต๊ฐ 7. ํ์คํ The overview of this chapter 4์ฅ์์๋ ํ๋ ฌ์์ ๋ํ์ฌ ํ์ตํ์๋ค. ํ๋ ฌ์์ ๊ณผ๊ฑฐ์๋ ๋๋จํ ์ค์ํ ์ฃผ์ ์์ผ๋, ์ต๊ทผ์๋ ๊ทธ ์ค์์ฑ์ด ๋ง์ด ์ค์๋ค. ๊ฒฐ๊ณผ์ ์ผ๋ก ์ด ์ฅ์์๋ ๋ ๊ฐ์ง ์ ํ์ง๋ฅผ ์ ๊ณตํ๋ค. ํ๋ ฌ์์ ์ด๋ก ์ ์ผ๋ก ์๋ฒฝํ ๊ท๋ช
ํ๋ ๊ธธ$($4.1์ ๋ถํฐ 4.3์ $)$๊ณผ ์ดํ ์ฅ์์ ์ฌ์ฉ๋๋ ํ๋ ฌ์์ ๋ํ ์ค์ํ ์ฌ์ค๋ค์ ์์ฝํ ๊ธธ$($4.4์ $)$์ด๋ค. ์ด๋ ๋น์ ์ ํ๋ ฌ์์ ๋ํ ํ์์ ๋ฐ๋ผ..
Paper Reading ๐/Mathematics(์ ํ๋์, ํ๋ฅ ๊ณผ ํต๊ณ, ๋ฏธ์ ๋ถํ)
Friedberg Linear Algebra ํ๋ฆฌ๋๋ฒ๊ทธ ์ ํ๋์ํ์ ๊ณต๋ถํ๋ฉด์ ๊ฐ๊ฐ์ ์ฅ ๋ณ๋ก ์ ๋ฆฌ๋ฅผ ํ์๋ค. Table of Contents 1. ๋ฒกํฐ๊ณต๊ฐ 2. ์ ํ๋ณํ๊ณผ ํ๋ ฌ 3. ๊ธฐ๋ณธํ๋ ฌ์ฐ์ฐ๊ณผ ์ฐ๋ฆฝ์ผ์ฐจ๋ฐฉ์ ์$($This post$)$ 4. ํ๋ ฌ์ 5. ๋๊ฐํ 6. ๋ด์ ๊ณต๊ฐ 7. ํ์คํ The overview of this chapter 3์ฅ์์๋ ๋ฒกํฐ๊ณต๊ฐ๊ณผ ์ ํ๋ณํ์ ์ด์ฉํ ์ฐ๋ฆฝ์ผ์ฐจ๋ฐฉ์ ์์ ํ์ด๋ฒ์ ํ์ตํ์๋ค. 3.1 ๊ธฐ๋ณธํ๋ ฌ์ฐ์ฐ๊ณผ ๊ธฐ๋ณธํ๋ ฌ ์ด๋ฒ ์ ์์๋ 3์ฅ์์ ๋๋ฃจ ์ฌ์ฉํ ๊ธฐ๋ณธ์ฐ์ฐ์ ์ ์ํ๋ค. ์ดํ ๊ธฐ๋ณธ์ฐ์ฐ์ ์ฌ์ฉํ์ฌ ์ ํ๋ณํ์ ๋ญํฌ๋ฅผ ๊ณ์ฐํ๊ณ ์ฐ๋ฆฝ์ผ์ฐจ๋ฐฉ์ ์์ ํด๋ฅผ ๊ตฌํ๋ค. ๊ธฐ๋ณธํ๋ ฌ์ฐ์ฐ์๋ ๋ ์ข
๋ฅ$($ํ์ฐ์ฐ, ์ด์ฐ์ฐ$)$์ด ์์ผ๋ฉฐ ํ์ฐ์ฐ์ด ๋ ์ ์ฉํ๋ค. ๊ธฐ๋ณธ์ฐ์ฐ์ ์ฐ๋ฆฝ์ผ์ฐจ๋ฐฉ์ ์์ ๋ณ์๋ฅผ ์๊ฑฐํ ..
Paper Reading ๐/Mathematics(์ ํ๋์, ํ๋ฅ ๊ณผ ํต๊ณ, ๋ฏธ์ ๋ถํ)
Friedberg Linear Algebra ํ๋ฆฌ๋๋ฒ๊ทธ ์ ํ๋์ํ์ ๊ณต๋ถํ๋ฉด์ ๊ฐ๊ฐ์ ์ฅ ๋ณ๋ก ์ ๋ฆฌ๋ฅผ ํ์๋ค. Table of Contents 1. ๋ฒกํฐ๊ณต๊ฐ 2. ์ ํ๋ณํ๊ณผ ํ๋ ฌ$($This post$)$ 3. ๊ธฐ๋ณธํ๋ ฌ์ฐ์ฐ๊ณผ ์ฐ๋ฆฝ์ผ์ฐจ๋ฐฉ์ ์ 4. ํ๋ ฌ์ 5. ๋๊ฐํ 6. ๋ด์ ๊ณต๊ฐ 7. ํ์คํ The overview of this chapter 2์ฅ์์๋ ์ ํ๋ณํ๊ณผ ํ๋ ฌ์ ๊ด๊ณ$($์๊ณต๊ฐ, ์๊ณต๊ฐ, ์ ํ๋ณํ์ ํ๋ ฌํํ, ๋ํ์ฌ์, ์ขํ๋ณํ$)$์ ํ์ตํ์๋ค. 2.1 ์ ํ๋ณํ, ์๊ณต๊ฐ, ์๊ณต๊ฐ ์ ์์ญ์ด $\textbf{V}$์ด๊ณ , ๊ณต์ญ์ด $\textbf{W}$์ธ ํจ์ $\textbf{T}$๋ฅผ $\textbf{T} : \textbf{V} \to \textbf{W}$๋ผ ํ๊ธฐํ๋ค. ์ ์ $\textbf{V}$์ $..
Paper Reading ๐/Mathematics(์ ํ๋์, ํ๋ฅ ๊ณผ ํต๊ณ, ๋ฏธ์ ๋ถํ)
Friedberg Linear Algebra ํ๋ฆฌ๋๋ฒ๊ทธ ์ ํ๋์ํ์ ๊ณต๋ถํ๋ฉด์ ๊ฐ๊ฐ์ ์ฅ ๋ณ๋ก ์ ๋ฆฌ๋ฅผ ํ์๋ค. Table of Contents 1. ๋ฒกํฐ๊ณต๊ฐ$($This post$)$ 2. ์ ํ๋ณํ๊ณผ ํ๋ ฌ 3. ๊ธฐ๋ณธํ๋ ฌ์ฐ์ฐ๊ณผ ์ฐ๋ฆฝ์ผ์ฐจ๋ฐฉ์ ์ 4. ํ๋ ฌ์ 5. ๋๊ฐํ 6. ๋ด์ ๊ณต๊ฐ 7. ํ์คํ The overview of this chapter 1์ฅ์์๋ ๋ฒกํฐ๊ณต๊ฐ์ ๊ธฐ๋ณธ์ ์ธ ์ด๋ก $($๋ถ๋ถ๊ณต๊ฐ, ์ผ์ฐจ๊ฒฐํฉ, ์ผ์ฐจ๋
๋ฆฝ๊ณผ ์ผ์ฐจ์ข
์, ๊ธฐ์ , ์ฐจ์$)$์ ๋ํด ํ์ตํ์๋ค. 1.1 ๊ฐ๋ก ํ, ์๋, ๊ฐ์๋ ๋ฑ ๋ง์ ๋ฌผ๋ฆฌ์ ๊ฐ๋
์ ํฌ๊ธฐ ๋ฟ๋ง ์๋๋ผ, ๋ฐฉํฅ ์ ๋ณด๋ ํจ๊ป ๊ฐ์ง๊ณ ์๋ค. ์ด์ฒ๋ผ ํฌ๊ธฐ์ ๋ฐฉํฅ์ ๋ชจ๋ ๊ฐ์ง ๋ฌผ๋ฆฌ๋์ '๋ฒกํฐ$($vector$)$' ๋ผ๊ณ ํ๋ค. ๋ฒกํฐ๋ ํํ ํ์ดํ๋ก ํํํ๋ฉฐ, ๋ฒกํฐ์ ํฌ๊ธฐ๋ ํ์ดํ์ ๊ธธ..
Paper Reading ๐/Mathematics(์ ํ๋์, ํ๋ฅ ๊ณผ ํต๊ณ, ๋ฏธ์ ๋ถํ)
What is this? machine learning์์ ๋ชจ๋ธ์ด๋ ํจํด์ ๋ถ๋ฅ ์ฑ๋ฅ ํ๊ฐ์์ ์ฌ์ฉ๋๋ ์งํ์ด๋ค. ์ด๋ฅผ ํตํด ๋ชจ๋ธ์ ๋ถ๋ฅ ์ฑ๋ฅ์ ๋ ์์ธํ๊ฒ ํ์
์ด ๊ฐ๋ฅํ๋ค. ์ด๋ฌํ ๊ฒฐ๊ณผ๋ฅผ ์ด์ฉํ์ฌ ๋ชจ๋ธ์ ๊ฐ์ ๋ฐฉํฅ์ฑ์ ์ก์๊ฐ ์ ์๊ฒ ๋๋ค. Table of Contents 1. Precision, Recall, and Accuracy 1-1. Precision$($์ ๋ฐ๋$)$ 1-2. Recall$($์ฌํ์จ$)$ 1-3. Accuracy$($์ ํ๋$)$ 1-4. F1-score 2. ๊ทธ ์ธ์ ์งํ๋ค 2-1. ROC curve 2-2. AUC ๋ณธ๋ฌธ์ผ๋ก ๋ค์ด๊ฐ๊ธฐ ์ ์, confusion matrix์ ๋ํด ์์๋ณด๊ฒ ๋ค. confusion matrix๋ ํ๋ จ์ ํตํ prediction์ ์ฑ๋ฅ์ ์ธก์ ํ๊ธฐ ์ํด ..
Paper Reading ๐/Computer Vision
The overview of this paper ์ด ๋
ผ๋ฌธ์์๋ ์๋ก์ด vision Transformer์ธ Swin Transformer์ ์ ์ํ์๋ค. ์ด Swin Transformer๋ computer vision์ ๋ํด general-purpose ์ฒ์ถ๊ฐ์ ์ญํ ์ ํ๋ค. ์๊ฐ์ ํน์ฑ์ ๋ค์ํ scale๊ณผ text์ ๋นํด ๊ณ ํด์๋์ธ ์ด๋ฏธ์ง์ ๊ฐ์ computer vision๊ณผ NLP ๋ ์์ญ์ ์ฐจ์ด ๋๋ฌธ์, Transformer์ computer vision์ ์ ์ฉ์ํค๋๋ฐ ๋ง์ ๋ฌธ์ ๊ฐ ์์๋ค. ์ด๋ฌํ ์ฐจ์ด์ ์ ๊ทน๋ณตํ๊ธฐ ์ํด, ๋
ผ๋ฌธ์์๋ representation์ด Shifted Windows์ ํจ๊ป ๊ณ์ฐ๋๋ hierarchical Transformer์ ์ ์ํ์๋ค. shifted windowing ๊ธฐ๋ฒ์..
Paper Reading ๐/Computer Vision
The overview of this paper Transformer architecture๋ NLP ๋ถ์ผ์์ ๋งค์ฐ ๊ถ์์ ์ด๋ค. ํ์ง๋ง, ์ด๋ฅผ computer vision์ ์ฌ์ฉํ๋ ์๋ ๊ทนํ ์ ํ๋์ด ์๋ค. convolutional network์ ์ฌ์ด์ attention์ ์ฌ์ฉํ๊ฑฐ๋, convolutional network์ ์ ๋ฐ์ ์ธ ๊ตฌ์ฑ์ ๋ฐ๊พธ๊ธด ํ์ง๋ง, ์ ๋ ์ ๋ฐ์ ์ธ ๊ตฌ์กฐ๋ฅผ ๋ฐ๊พธ์ง๋ ์๋๋ค. ๋
ผ๋ฌธ์์๋ ์ด๋ฌํ CNN์ ์์กดํ ํ์ ์์ด image์ patch์ ์ง์ ์ ์ผ๋ก Transformer๋ฅผ ์ ์ฉํ๋ ๊ฒ์ด ๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์คฌ๋ค. ๊ฑฐ๋ํ ์์ ์ด๋ฏธ์ง ๋ฐ์ดํฐ์์ pre-train์ ํ๊ณ , ์ด๋ฏธ์ง ๋ฒค์น๋งํฌ์ ์ ์ฉํ ๊ฒฐ๊ณผ, Vision Transformer$($ViT$)$๋ ๋์ฑ ์ ์ ๊ณ์ฐ ๋น์ฉ์ผ๋ก..
Paper Reading ๐/Deep Learning
What is the purpose of this post? ์ด๋ฒ ํฌ์คํธ์์๋ CNN network์ ์ญ์ฌ์ ๋ํด ์์๋ณด์๋ค. CNN์๋ ์ฌ๋ฌ๊ฐ์ง network๊ฐ ์์๋๋ฐ, ์๋ฅผ ๋ค์ด LeNet๊ณผ AlexNet ๋ฑ์ด ์์๋ค. ์ด๋ฒ ํฌ์คํธ์์๋ ์ด๋ ํ CNN network๋ค์ด ์์๋์ง ์์๋ณด์๋ค. Table of Contents 1. LeNet 2. AlexNet 3. VGGNet 4. GoogLeNet 5. ResNet 6. ResNeXt 7. Xception 8. MobileNet 9. DenseNet 10. EfficientNet 11. ConvNext 1. LeNet$($1998$)$ Gradient-Based Learning Applied to Document Recognition LeNet์ ์..
Paper Reading ๐/Natural Language Processing
Pre-trained Language Modeling paper reading ์์ฆ NLP ๋ถ์ผ์์ ๋จ๊ฑฐ์ด ๊ฐ์์ธ pre-trained Language Modeling์ ๊ดํ ์ ๋ช
ํ ๋
ผ๋ฌธ๋ค์ ์ฝ๊ณ ๋ฆฌ๋ทฐ๋ฅผ ํ์๋ค. ์ด๋ฒ ํฌ์คํธ์์๋ ์ ๋ฒ ํฌ์คํธ์ธ GPT-1์ ํ์ ๋ชจ๋ธ์ธ GPT-2์ ๋ํด์ ๋ฆฌ๋ทฐํ์๋ค. ELMo: 'Deep contextualized word representations' reading & review BERT: 'Pre-training of Deep Bidirectional Transformers for Language Understanding' reading & review GPT-1: 'Improving Language Understanding by Generative Pre-Trai..