์ด๋ฒ ํฌ์คํ ์ ๊ธฐ์กด์ ํฌ์คํ ๊ณผ ์ด์ง ๋ค๋ฅด๊ฒ PPT ์๋ฃ๋ฅผ ํ์ฉํ์ฌ ์ค๋ช ํ๋๋ก ํ๊ฒ ๋ค. ์ด๋ฒ ํฌ์คํ ์ ์ฃผ์ ๋ ์ ๋ชฉ์์ ๋ณด์ฌ์ง๋ ๊ฒ์ฒ๋ผ LM์ Evaluation metric์ ๋ํด์ ์์๋ณด๋ ์๊ฐ์ ๊ฐ์ ธ๋ณด๋ ค๊ณ ํ๋ค! ๐ ๊ธฐ์กด์ Evaluation metric์ ๋ํด์ ์์๋ณด๊ณ , ๊ธฐ์กด metric๋ค์ ์ด๋ ํ ๋ฌธ์ ๊ฐ ์๋์ง ์์๋ณธ ๋ค, ๋ง์ง๋ง์ผ๋ก ์ด๋ค ๊ฐ์ ์๋ค์ด ์๊ฒจ๋ฌ๋์ง์ ๋ํด์ ํ ๋ฒ ์์๋ณด๋๋ก ํ๊ฒ ๋ค. ๋ง์ฝ PPT๋ฅผ ๋ณด๋ฉด์ ๊ถ๊ธํ๊ฑฐ๋ ์ค๋ฅ๊ฐ ์๋ ๊ฒ ๊ฐ์ ์ฌํญ๋ค์ PPT ๋๋ ํฌ์คํ ์ ๋๊ธ์ ๋ฌ์์ฃผ์๋ฉด ๋ต๋ณ์ ๋ฌ์๋๋๋ก ํ๊ฒ ์ต๋๋ค! ์ฌ๋ฐ๊ฒ ๋ด์ฃผ์ญ์ผ! ๐คฉ
https://docs.google.com/presentation/d/1XL_B0nI-yp2dgLDVrEzTlLcg9DpUnALBklmpJ4iOZRw/edit?usp=sharing
How to evaluate LM optimally?
How to evaluate LM optimally? 2023.07.27 Cartinoe ์ด๋ฒ์ ๋ค๋ค๋ณด๊ณ ์ ํ๋ ๋ด์ฉ์ LM์ Evaluation metric์ ๊ดํ ๋ด์ฉ์ด๋ค. LM์ด ๊ฐ๋ฐ๋ ์๊ฐ๋งํผ์ด๋ ๊ทธ LM์ ํ๊ฐํ๋ metric๋ค๋ ์ ๋ง ๋ง์ด ๊ฐ๋ฐ๋์๋๋ฐ, ๊ณผ์ฐ ์ด
docs.google.com