Starting from ChatGPT ๐ค which is closed-source
์๋ 12์, ์ฆ 2022๋ 12์์ ์ ์ธ๊ณ์ ์ฌ๋๋ค์๊ฒ ์ ์์ด ์ ์ ํ ์ถฉ๊ฒฉ์ ์ค ์ฌ๊ฑด์ด ๋ฐ์ํ์๋ค. ๋ฐ๋ก ๊ทธ ์ ๋ช ํ 'ChatGPT'์ ๋ฐํ๋ค! OpenAI์์ ๋ฐํํ ์ด ๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ(Large Language Model, LLM)์ ์ง๊ธ๊น์ง์๋ ์ฐจ์์ด ๋ค๋ฅธ ์์ฒญ๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๋ฉด์ ์ฌ๋๋ค์ ์ฌํ ๋ฐ ์ถ์ ์ ๋ฐ์ ์ผ๋ก ์ค๋ฉฐ๋ค์ด๊ฐ๊ธฐ ์์ํ๋ค. ํ์ง๋ง, ์ด ์๋ฒฝํด ๋ณด์ด๋ ChatGPT๋ ์ฌ๋ฌ ๊ฐ์ง ๋จ์ ์ ๊ฐ์ง๊ณ ์๋๋ฐ, ๊ทธ์ค์์ ์ด๋ฒ ํฌ์คํ ์์ ๋ค๋ค๋ณด๊ณ ์ ํ๋ ๋ด์ฉ์ ๋ฐ๋ก 'Closed-source' model์ด๋ผ๋ ์ ์ด๋ค. ๐ซ
closed-source๊ฐ ๋ฌด์์ผ๊น? ์ด ์ฉ์ด๋ฅผ ์ฒ์ ๋ฃ๊ฒ ๋๋ค๋ฉด ๋ค์ ์์ํ ํ ๋ฐ, closed-source๋ ๊ฐ๋จํ๊ฒ ๋งํ๋ฉด, '์ ์๊ถ'์ ๊ฐ์ง๋ ๋ชจ๋ธ์ ๋งํ๋ค. ์ด๊ฒ ๋ฌด์จ ์๋ฆฌ์ผ๊น? ๊ทธ๋ ๋ค๋ฉด ๋ชจ๋ ๋ชจ๋ธ์ด ์ ์๊ถ์ ๊ฐ์ง๋ ๊ฒ์ ์๋๋ผ๋ ๋ง์ธ๊ฐ? ์ ํํ๋ค! ์ด ์ ์๊ถ์ ๊ฐ์ง๊ณ ์๊ธฐ ๋๋ฌธ์ ์ด๋ฌํ ๋ชจ๋ธ์ ์ฌ์ฉํ ์๋ ์์ผ๋ ๊ทธ ์ ํํ ๊ตฌ์กฐ๋ฅผ ๋ค์ฌ๋ค๋ณด๊ฑฐ๋ ์์ ์ ํ๋ ํ์๋ ๊ธ์ง๋์ด ์๋ค๋ ์๋ฏธ์ด๋ค. ๐ ์ด๋ฌํ ๋ชจ๋ธ๋ค์ ๋ค๋ฅธ ๋ง๋ก '์์ ์ฉ ๋ชจ๋ธ'์ด๋ผ๊ณ ํด์ Proprietary Model์ด๋ผ๊ณ ๋ถ๋ฅด๊ธฐ๋ ํ๋ค.
๊ทธ๋ ๋ค๋ฉด ์ closed-source๋ผ๋ ๊ฒ์ด ChatGPT์ ๋จ์ ์ค ํ๋๋ก ์ง์ ๋ฐ๊ณ ์๋ ๊ฒ์ผ๊น? ์ด๊ฒ์ ChatGPT ๋ฟ๋ง ์๋๋ผ ๋ค๋ฅธ ๋ชจ๋ closed-source model๋ค์ ๋ํด์๋ ์ ์ฉ๋๋ ๋ถ๋ถ์ธ๋ฐ ๊ทธ ๋ชจ๋ธ์ ํ์ฉํ ํ์ ์ฐ๊ตฌ๊ฐ ๋ถ๊ฐ๋ฅํ๋ค๋ ์ ๊ณผ ๋ชจ๋ธ์ ๋ํ ์์ธํ ๋ถ์์ด ๋ถ๊ฐ๋ฅํ๋ค๋ ์ ๋๋ฌธ์ด๋ค. ๊ทธ๋ฆฌ๊ณ ๋น๊ต์ ์์์ด ๋ถ์กฑํ ํ๊ฒฝ์ธ ์ฐ๊ตฌ์ค์์๋ ์ด๋ฌํ ๋ชจ๋ธ์ ์ฌ์ฉํ๊ธฐ๋ ๋ฒ ์ฐฐ๋ฟ๋๋ฌ ๋๋ฌด ์ฌ์ด์ฆ๊ฐ ํฐ ๋ชจ๋ธ์ ๋ํด์๋ ์์์ด ๋ถ์กฑํ ์ง๊ฒฝ์ ์ด๋ฅด๊ธฐ๊น์ง ํ ์๋ ์๋ค. ๋ฐ๋ผ์ ํ๋ฃจ์๋ ๋ช ๋ฐฑ๊ฐ์ ๋ ผ๋ฌธ์ด ์์์ ธ ๋์ค๋ computer science ๋ถ์ผ์์ ์ด๋ฌํ ์ฐ๊ตฌ์ ์ ์ฝ์ ์๋นํ ๋ผ ์ํ ๋ถ๋ถ์ด ๋ ์ ์๋ค. ๐ฅ
Rising star, Open-source โจ
์์์ closed-source model์ ๋จ์ ์ค ํ๋์ธ closed-source๋ผ๋ ์ ์ ํ ๋ฒ ์์๋ดค๋๋ฐ, ๊ทธ๋ ๋ค๋ฉด ์ด closed-source๋ฅผ ํด๊ฒฐํ๊ณ ์ ํ๋ ์๋๋ค์ ์์์๊น? ๋น์ฐํ ์๋ค! ์ฌ์ค ๋ฌธ์ ํด๊ฒฐ์ด๋ผ๊ธฐ๋ณด๋ค๋ ์๋ก ๋ค๋ฅธ ์ฌ์์ ์ถ๊ตฌํด์ ๋ง๋ค์ด์ง๋ ๊ฒ์ด๋ผ์ ๋ฌธ์ ์ ํด๊ฒฐ์ด๋ผ๊ธฐ๋ณด๋ค๋ ๋ค๋ฅธ ๋ฐฉํฅ์ ์ ํํ ์๋๋ค์ด๋ผ๊ณ ์๊ฐํ๋ฉด ๋ ์ข์ ๊ฒ ๊ฐ๋ค. ๐
'Open-source' model์ closed-source model๊ณผ ๋ฌ๋ฆฌ ์ ์๊ถ์ด ๋ฐ๋ก ์กด์ฌํ์ง ์์์ ๋ชจ๋ธ์ ์ฌ์ฉ์ ์ ์ฝ์ ๊ฑธ์ง ์๊ณ , ์ ์ฒด์ ์ธ ์์ค ์ฝ๋ ๋ํ ๊ณต๊ฐ๋์ด ์๋, ๋ง ๊ทธ๋๋ก ์ ๋ง open๋์ด ์๋ ๋ชจ๋ธ๋ค์ ๋งํ๋ค. ์ด๋ก์จ ์์ ๋งํ๋ closed-source๋ก ์ธํด์ ๋ฐ์ํ๋ ์ฐ๊ตฌ์ ์ธก๋ฉด์์์ ์ ์ฝ์ ํด๊ฒฐํ ์ ์๊ฒ ๋ ๊ฒ์ด๋ค! ๐ ๋ฌผ๋ก ์ด๋ ๊ฒ๋ง ๋ณด๋ฉด closed-source model์ด ์ ํ์ํ ๊ฒ์ธ์ง ๋ชจ๋ฅผ ์ ๋๋ก open-source model์ด ํจ์ฌ ๋ ๋ง์ ์ฅ์ ์ ๊ฐ์ง๊ณ ์๋ ๊ฒ์ฒ๋ผ ๋ณด์ผ ์ ์์ผ๋, ํ์คํ open-source model์ closed-source model์ ๋นํด์ ์ฑ๋ฅ์ด ๋จ์ด์ง๋ ๋จ์ ์ ๊ฐ์ง๊ณ ์๋ค. ๐ ๋ฌผ๋ก ์ด๋ open-source๋ก ๊ณต๊ฐํ๊ธฐ ์ํด ์ด์ฉ ์ ์๋ ์์์ด๊ธด ํ์ง๋ง ๋ง์ด๋ค. ๊ทธ๋์ ์ฑ๋ฅ๊ณผ ํจ์จ์ฑ ์ธก๋ฉด์์ ์ ๋นํ trade-off๋ฅผ ๊ฑฐ์น ๋ชจ๋ธ์ด open-source model์ด๋ผ๊ณ ์๊ฐํ๋ฉด ๋ ๊ฒ ๊ฐ๋ค!
ChatGPT๊ฐ ์๊ฒจ๋ ์ดํ๋ก ์ด๋ฐ์๋ ์ฌ๋ฌ closed-source model๋ค์ด ๋์ค๊ธฐ ์์ํ๋ค. ์๋ฅผ ๋ค์ด Anthropic์ Claude, OpenAI์ GPT-4, Google์ Bard ๋ฑ ๋ง์ด๋ค. ์ฌ๋ฌ ๋๊ธฐ์ ๋ค์ ์์ ๋ค์ ๊ธฐ์ ๋ ฅ์ ๊ฒฝ์ํด์ผ ํ๋ ์ด์ฉ ์ ์์ด closed-source model์ ๋ง์ ๊ด์ฌ์ด ์ ๋ ค์์๋๋ฐ, ๊ทธ๋ฌ๋ฉด ๊ทธ๋ด์๋ก ์คํ๋ ค ํผํด๋ฅผ ๋ณด๋ ๊ฒ์ ์ฐ๊ตฌ์๋ค์ด์๋ค.. ๐ญ ๊ทธ๋ฌ๋ ๋์ค Meta์์ open-source LLM์ ์์ด ๊ฒฉ์ด๋ผ๊ณ ๋ณผ ์ ์๋ LLaMA๋ฅผ ๊ณต๊ฐํ๋ฉด์ open-source LLM์ ์์ฅ๋ ์ด๋ฆฌ๊ธฐ ์์ํ๋ค! ๐ค 2023๋ 2์ 24์ผ์ LLaMA๊ฐ ์ฒ์ ๋ฐํ๋๊ณ ๋์ ํ์ฌ๊น์ง ์ ๋ง ๋ง์ open-source LLM ์ฐ๊ตฌ๊ฐ ์งํ๋์๊ณ , ๊ทธ์ ๋ฐ๋ผ HuggingFace์ Open LLM Leaderboard์์๋ open-source LLM๋ผ๋ฆฌ ์น์ดํ๊ฒ ๊ฒฝ์ํ๋ ๋ชจ์ต์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค. ๊ทธ๋ฆฌ๊ณ ํฌ์คํ ์ ์์ฑํ๋ ์์ ์์๋ Meta์์ LLaMA2๋ฅผ ๊ณต๊ฐํจ์ผ๋ก์จ ๋ค์ ํ ๋ฒ open-source LLM ์์ฅ์ ์ด๊ธฐ๋ฅผ ํ ๋์ด์ฌ๋ ธ๋ค!
closed-source model ๋งํผ์ด๋ ์ฃผ๋ชฉ๋ฐ๊ณ ์๋ open-source model์ธ๋ฐ, ๊ทธ๋ ๋ค๋ฉด open-source model์ ์ด๋ป๊ฒ ์ด๋ ๊ฒ ์ ํ์ ์ธ ์ธ๊ธฐ๋ฅผ ๋ ์ ์๊ฒ ๋ ๊ฒ์ผ๊น? ์ผ๋จ ํ์๋ ์ด ์ ์ ๊ดํ์ฌ ์ ๋ง ํ๊ณ ์ถ์ ๋ง์ด ๋ง๋ค! ํ์๊ฐ ์๊ฐํ๋, ๊ทธ๋ฆฌ๊ณ ๋ง์ ์ฌ๋๋ค์ด ์๊ฐํ๋ open-source model์ด ์ธ๊ธฐ๋ฅผ ๋๊ฒ ๋ ์ด์ ๋ ๋ค์๊ณผ ๊ฐ๋ค๊ณ ์๊ฐํ๋ค.
- closed-source model์ ๋นํด ์๋นํ ์์ ์ฌ์ด์ฆ๋ก ์์์ ์ ์ฝ์์ ๋ฒ์ด๋ ์ข ๋ ์์ ๋กญ๊ฒ ์ฌ๋ฌ๊ฐ์ง ์คํ์ ์งํํ ์ ์์ ๐งช
- HuggingFace์ API๋ฅผ ํ์ฉํ ์์ฌ์ด ์ฌ์ฉ์ด ๊ฐ๋ฅํด์ง ๐ค
- ์์ ์๊ฒฌ๋ค์ ์ด์ด์ ์ฌ๋ฌ๊ฐ์ง ์ฌ๋ฏธ๋ ์คํ๋ค๋ ๋ง์ด ๋์ค๊ฒ ๋๊ณ , ๊ทธ๋ก ์ธํ ์ฌ๋๋ค์ ํธ๊ธฐ์ฌ ์๊ทน ๐
ํ์๋ LLM ๊ด๋ จ ์ฐ๊ตฌ๋ฅผ ์งํํด๋ณด๋ ค ํ๊ณ ์์์ผ๋ ๋๋ฌด๋ ํฐ ์ฌ์ด์ฆ์ ๋ชจ๋ธ๋ค๊ณผ ์์ ์ฌ์ฉ์ด ๋ถ๊ฐ๋ฅํ ๋ชจ๋ธ๋ค๋ก ์ธํ ์ ์ฝ ๋๋ฌธ์ ๋ฒฝ์ ๋งํ์ ์ฐ๊ตฌ๋ฅผ ์งํ์กฐ์ฐจ ํด๋ณด์ง ๋ชปํ๊ณ ์์๋ค.. ๐ญ ๊ทธ๋ฌ๋ open-source LLM์ ๋ฑ์ฅ์ผ๋ก ์กฐ๊ธ์ฉ ์กฐ๊ธ์ฉ ๋ชจ๋ธ์ ์ฌ์ฉํ ์ ์๊ฒ ๋๋ฉฐ ์ด์ ๋ pre-training์ ๋ฌด๋ฆฌ๋ผ๊ณ ํ๋๋ผ๊ณ fine-tuning๊น์ง๋ ์ํ๋ ๋ฐ์ดํฐ์ ์ ํ์ฉํ์ฌ ํ ์ ์๋ ์ ๋๊น์ง ์ฌ ์ ์๊ฒ ๋์๋ค! ๐ ์ด๋ ๋ฏ ๊ธฐ์ ์ด ์๋ ์ผ๋ฐ ์ฐ๊ตฌ์๋ ์๋๋ฉด ์ฐ๊ตฌ์ค์ ์๋ ์ฐ๊ตฌ์๋ค์ ์์ง ์์์ ์ ์ฝ(GPU, RAM ๋ฑ)์ ๋ง์ด ๋ฐ๊ณ ์๋ค. ์ด๋ก ์ธํด์ ์ฐ๊ตฌ์ ๊ธฐํ์ ๋ํ ์ ์ฝ๋ ๋ง์ด ๋ฐ๊ณ ์๋ ์ํฉ์ ๊ฐ๋ญ์ ๋จ ๋น์ฒ๋ผ ๋ด๋ฆฐ open-source model์ ๋ฑ์ฅ์ ์ด์ฐ ์ด๊ดํ์ง ์์ ์ ์๊ฒ ๋๊ฐ! ๐ฅ ๊ทธ๋์ ์ด๋ฒ ํฌ์คํ ์์๋ ์ด๋ฌํ open-source LLM์ ๋ํด์ ์ดํด๋ณด๊ณ ์ ํ๋ค. (์ด์ฉ๋ค ๋ณด๋ ์๋ก ์ ์ด๋ ๊ฒ ๊ธธ๊ฒ ์์ฑํ๊ฒ ๋์๋๋ฐ ์ด ๊ธด ์๋ก ์ ํตํด ๋ ์๋ค์ด open-source์ closed-source์ ๋ํด์ ์ข ๋ ์ ์ดํดํ ์ ์์์ผ๋ฉด ์ข๊ฒ ๋ค. ๐)
Beginning of open-source LLM, LLaMA ๐ฆ
์์๋ ๋งํ๋ ๊ฒ์ฒ๋ผ ์ง๊ธ์ฒ๋ผ ์ด๋ ๊ฒ ํ๋ฐํ open-source model ์์ฅ์ ๋ง๋ ๊ฒ์ LLaMA ๋๋ถ์ด๋ผ๊ณ ํด๋ ๊ณผ์ธ์ด ์๋๋ผ๊ณ ์๊ฐํ๋ค. ์๋ํ๋ฉด HuggingFace Open LLM Leaderboard์ ์ฌ๋ผ์ ์๋ ๊ฑฐ์ ๋๋ถ๋ถ์ ๋ชจ๋ธ๋ค์ด LLaMA ๋๋ LLaMA2๋ฅผ ๋ฒ ์ด์ค๋ก ํด์ fine-tuning์ ๊ฑฐ์น ๋ชจ๋ธ๋ค์ด๊ธฐ ๋๋ฌธ์ด๋ค! ๐ซข ๊ทธ๋ ๋ค๋ฉด ์ด LLaMA, ๋๋์ฒด ๋ฌด์จ ๋ชจ๋ธ์ด๊ธธ๋ ์ด๋ ๊ฒ ์ ํ์ ์ธ open-source model์ ์ธ๊ธฐ๋ฅผ ๋ ์ ์์๋ ๊ฒ์ผ๊น?
LLaMA๋ Meta์์ ๊ณต๊ฐํ open-source model๋ก 'LLaMA: Open and Efficient Foundation Language Models'์ ๋ ผ๋ฌธ์์ ์ฒ์ ๊ณต๊ฐ๋์๋ค. LLaMA๊ฐ ๋ง๋ค์ด์ง ๋ฐฐ๊ฒฝ์ ๋ํด์ ๊ฐ๋ตํ๊ฒ ์ค๋ช ํ๋ฉด ๊ธฐ์กด์ LM scaling law์ธ 'ํ๋ผ๋ฏธํฐ ๋๋ฆฌ๋ ๊ฒ ์งฑ ๐'์์ ์๋กญ๊ฒ ์ฐ๊ตฌ๋ Chinchilla scaling law์ 'ํ๋ผ๋ฏธํฐ๋ ๋ฐ์ดํฐ ๋์ด ๊ฐ์ด ๋๋ฆฌ๋ ๊ฒ ์งฑ ๐'์ ์ด๋ ์ ๋ฐ์์ ํจ์ฌ ๋ ์์ ์ฌ์ด์ฆ์ ๋ชจ๋ธ(7B, 13B, 30B, 65B)์ ํจ์ฌ ๋ ๋ง์ ์์ ๋ฐ์ดํฐ(1.0T, 1.4T tokens)๋ฅผ ์ฌ์ฉํด์ ํ์ต์ํจ ๋ชจ๋ธ์ด๋ค. ์ด๋ ํ์ต์ ์ฌ์ฉ๋ ๋ฐ์ดํฐ๋ publicly available data๋ง ์ฌ์ฉํจ์ผ๋ก์จ publicly available data๋ ์ถฉ๋ถํ ๊ฐ๋ ฅํ๋ค๋ผ๋ ๊ฒ ๋ํ ๋ณด์ฌ์คฌ๋ค. ์ด ๊ณผ์ ์์ ๊ธฐ์กด LM๋ค์ ์ฌ์ฉ๋์๋ ์ข์ method๋ค์ ์์ ๊ฐ์ง๊ณ ์์ ์ต์ข ์ ์ผ๋ก ๋ง๋ค์ด์ง ๊ฒ์ด 'LLaMA'์ธ ๊ฒ์ด๋ค! ๐
์ด๋ ๊ฒ ๋ง๋ค์ด์ง LLaMA๋ ์๋นํ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๋ฉฐ ๋น์์ 3๋ฐฐ ๊ฐ๋ ๋ ํฐ ๋ชจ๋ธ์ธ GPT-3์ ๋ฅ๊ฐํ๋ ๋ชจ์ต์ ๋ณด์ฌ์ฃผ๋ฉฐ ์ธ๊ฐ์ ์ด๋ชฉ์ด ์ ๋ฆฌ๊ฒ ๋ง๋ค์๋ค! LLaMA๋ open-source๋ก ๊ณต๊ฐ๋์์ผ๋ ๋ฌด๋ถ๋ณํ ์ฌ์ฉ์ ๋ง๊ธฐ ์ํด ๊ณต์์ ์ธ ํ๋ฝ์ ๋ฐ์ ์ฌ์ฉ์๋ง์ด LLaMA์ ๊ฐ์ค์น๋ฅผ Meta๋ก๋ถํฐ ๋ฐ์์ ์ฌ์ฉํ ์ ์๊ฒ ๋ง๋ค์ด๋ค.
์ด๋ ๊ฒ ์๋นํ ๊ฐ๋ ฅํ open-source LLM์ ๋ํ ์ฌ์ฉ์ด ๊ฐ๋ฅํด์ง๋ฉด์ ๋ง์ ์ฐ๊ตฌ์๋ค์ด ์ด๋ฅผ ์ด์ฉํด ์ฌ๋ฌ ๊ฐ์ง ์๋ง์ ์ฐ๊ตฌ๋ฅผ ํ์ฌ ์๋นํ ๋ง์ ์์ ์๋กญ๊ณ ๊ฐ๋ ฅํ open-source LLM์ ๋ง๋ค์ด๋๋ค. ๊ทธ ์ด๋ฆ๋ค์ ๋ชจ๋ ๋์ดํ ์๋ ์๊ณ ๋ ์์ธํ ๋ด์ฉ๋ค์ ๋ค๋ฃจ๊ธฐ์๋ ๋๋ฌด ๊ธด ํฌ์คํ ์ด ๋ ๊ฒ ๊ฐ๊ธฐ์ ๊ฐ์ถ๋ ค์ ๋ค์๊ณผ ๊ฐ์ด ์ ๋ฆฌํ๊ณ ๊ฐ ๋ชจ๋ธ์ ๋ํ ์์ธํ ๋ฆฌ๋ทฐ ๋งํฌ ๋ํ ๋ฌ์๋๋๋ก ํ๊ฒ ๋ค! ๐
- LLaMA(๋ฆฌ๋ทฐ ๋งํฌ: ํด๋ฆญ): ์์ ์ค๋ช ์ ์ฐธ๊ณ ํด์ฃผ์ธ์!!
- Stanford Alpaca(๋ฆฌ๋ทฐ ๋งํฌ: ํด๋ฆญ): Self-Instruct data๋ฅผ ํตํด ๋ชจ๋ธ์ ํ์ต์ํด. ๋น์ฉ์ด ์๋นํ ์ ๊ฐ๋จ.
- Lmsys Vicuna(๋ฆฌ๋ทฐ ๋งํฌ: ํด๋ฆญ): ShareGPT ๋ฐ์ดํฐ๋ฅผ ํตํด ๋ชจ๋ธ์ ํ์ต์ํด. response preference๋ก ํ๊ฐ์ํค๋ ๋ฐฉ๋ฒ์ธ Vicuna Evaluation์ ์๊ฐํจ.
- BAIR Koala(๋ฆฌ๋ทฐ ๋งํฌ: ํด๋ฆญ): ChatGPT Distillation data + Self-Instruct data๋ฅผ ํตํด ๋ชจ๋ธ์ ํ์ต์ํด.
- WizardLM(๋ฆฌ๋ทฐ ๋งํฌ: ํด๋ฆญ): ๊ธฐ์กด instruction์ method๋ฅผ ํตํด ์ข ๋ ๋ณต์กํ๊ณ ์ด๋ ต๊ฒ ๋ง๋ฆ์ผ๋ก์จ ์ฑ๋ฅ์ ๊ฐ์ ์ ์ค.
- Falcon: ๋ฐ๋ก ๋ชจ๋ธ์ ๋ํ ์๋ฃ๋ ์๊ณ , ์ฌ์ฉ๋ ๋ฐ์ดํฐ์ ์ ๋ํ ๋ ผ๋ฌธ๋ง ์์(๋ฆฌ๋ทฐ ๋งํฌ: ํด๋ฆญ)
- Orca(๋ฆฌ๋ทฐ ๋งํฌ: ํด๋ฆญ): high-quality data์ ๋ํด์ ๋ชจ๋ธ์ ํ์ต์ํด์ผ๋ก์จ ๋ ๊ฐ์ ๋ ์ฑ๋ฅ์ ๋ณด์ฌ์ค.
- Baize(๋ฆฌ๋ทฐ ๋งํฌ: ํด๋ฆญ): Self-Chat์ ํตํ ๋ฐ์ดํฐ๋ก ๋ชจ๋ธ์ ํ์ต์ํด. seed data๋ง์ผ๋ก ChatGPT๋ฅผ ํ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ง๋ค๊ณ ๋์ค์ ์ถ๋ ฅ์ ๋ํ ํผ๋๋ฐฑ๊น์ง ์ ๊ณตํ๋ฉด์ ๋ชจ๋ธ์ ํ์ต์ํด.
- phi-1(๋ฆฌ๋ทฐ ๋งํฌ: ํด๋ฆญ): ๊ต๊ณผ์ ์์ค์ high-quality ๋ฐ์ดํฐ๋ฅผ ํ์ฉํด์ ๋ชจ๋ธ์ ํ์ต์์ผ์ ์๋นํ ์์ ์ฌ์ด์ฆ์ ๋ชจ๋ธ์์ ์ฝ๋ฉ ๋ฅ๋ ฅ์ ๊ฐ์ ์ํด.
์์ ๊ฐ์ด LLaMA๋ฅผ ์ฌ์ฉํด์ fine-tune ํ์ฌ ๋์ค๊ฒ ๋ ๊ตต์งํ open-source model๋ง ํด๋ 8๊ฐ์ ๋ฌํ ์ ๋๋ก LLaMA๋ฅผ open-source LLM์ ์์ด๋ผ๊ณ ํด๋ ๊ณผ์ธ์ด ์๋ ์ ๋์ด๋ค! ๐ ๊ทธ๋ฆฌ๊ณ ์ด๋ ๊ฒ LLaMA์ ๋ํ ์ธ๊ธฐ๊ฐ ์กฐ๊ธ ์์ด๊ฐ๊ธฐ ์์ํ ๋ ์ฆ์ ๋๋ค์ Meta์์ ๊ฟํ๊ฑฐ๋ฆฌ๊ธฐ ์์ํ๋๋ฐ... (๋ค์ ๊ณ์ โฌ๏ธ)
'RE'volution of open-source LLM, LLaMA2 ๐ฆ๐ฆ
์์ ์ ๋ชฉ์์ revolution์ 're'๋ฅผ ๊ฐ์กฐํ ๊ฒ์ re๊ฐ '๋ค์'๋ผ๋ ์๋ฏธ์ด๋ ๋ค์ ํ๋ฒ ํ๋ช ์ ๋ณด์ฌ์ค๋ค๋ ์๋ฏธ๋ฅผ ๋ํ๋ด๊ณ ์ ๊ฐ์กฐ ํ์ํ์๋ค! ๐ ์์ ๊ฐ์ด LLaMA์ LLaMA๋ฅผ ํ์ฉํ ์ฌ๋ฌ open-source LLM๋ค์ ๋ํด์ ์์๋ดค๋ค. ์ ๋ง ๋ง์ open-source LLM๋ค์ด ๋์ค๊ฒ ๋์๋๋ฐ, ๋ชจ๋ธ๋ค์ด ๋์ค๋ฉด ๋์ฌ์๋ก ์ ์ ๋จ์ ์ด ๋๊ฐ ๋๊ธฐ ์์ํ์๋ค. ๊ธฐ๋ณธ์ ์ผ๋ก ๋ชจ๋ธ์ ์ฑ๋ฅ์ด ์ข๊ธฐ ์ํด์๋ base model์ ์ฑ๋ฅ์ด ์ข์์ผ ํ๊ธฐ ๋๋ฌธ์ LLaMA์ ํ๊ณ์ ๋ถ๋ชํ์ open-source LLM์ ์ฑ์ฅ์ด ์ ์ฐจ ์ฃผ์ถคํ๊ธฐ ์์ํ ๊ฒ์ด๋ค.
Meta์์๋ ์ด๋ฌํ ์ ์ ์์๋ ๊ฒ์ธ์ง ๋ฑ ์ ์ ํ ์๊ธฐ์ ๊ธฐ์กด์ LLaMA์์ ๊ฐ์ ๋ ๋ชจ๋ธ์ด 'LLaMA2'๋ฅผ ์ ๋ณด์ด๋ฉฐ, LLaMA2์ ๋ ผ๋ฌธ์ธ 'LLaMA2: Open Foundation and Fine-tuned Chat Models'๋ ํจ๊ป ๊ณต๊ฐํ์๋ค! ๐ฎ ์๋ก ๋์จ ์ด ๋ฐ๋๋ฐ๋ํ ๋ชจ๋ธ์ ๊ธฐ์กด์ LLaMA์์ ๋ค์๊ณผ ๊ฐ์ ๋ณํ๋ฅผ ์ฃผ์ด์ ๋ ๊ฐ์ ์์ผฐ๋ค.
- ๋ ๋ง์ ์์ ๋ฐ์ดํฐ ๐พ (1.4T → 2.0T)
- 2๋ฐฐ ๋์ด๋ context length โ๏ธ (2,048 → 4,096)
- Chat Fine-tuned version ๐ฌ
์์ ๊ฐ์ด LLaMA2๊ฐ LLaMA์ ๋นํด์ ํน๋ณํ ๊ฐ์ ๋ ๋ถ๋ถ์ ๋ ๋ง์ ์์ ๋ฐ์ดํฐ์ 2๋ฐฐ๊ฐ ๋์ด๋ context length ์ ๋๋ก ๋ณผ ์ ์๋ค. ์ฌ์ค model architecture ๋ถ๋ถ์์๋ ๊ฑฐ์ ๋ฐ๋ ๋ถ๋ถ์ด ์๊ณ ๋ถ๋ถ ๋ถ๋ถ ์๋ก์ด method๊ฐ(GQA) ๊ฐ๋ ์ฌ์ฉ๋์๋ค๋ ์ ์ ๋์ด๋ค. ๊ทธ๋๋ ๊ธฐ์กด์ open-source LLM์ ๋ชจ๋ ๋ฅ๊ฐํ๋ ์ฑ๋ฅ์ ์ฌ์ง์ด๋ closed-source model(ChatGPT, PaLM)๊ณผ ๋น์ทํ ์์ค์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค๋ ์ ์์ ํ์คํ ์ฑ๋ฅ์ ๊ฐ์ ์์ผฐ๋ค๋ ์ ์ ํ์ธํ ์ ์๋ค.
LLaMA2๋ ์ค์ํ ์ฑ๋ฅ ์ธ์๋ ๋์ฌ๊ฒจ๋ณผ ์ฌํญ์ด ํ๋ ๋ ์๋๋ฐ, ๊ธฐ์กด์ LLaMA๋ pre-trained model๋ง ๋์๋ ์ ์ ๋ฐํด ์ด๋ฒ LLaMA2๋ chat use case๋ฅผ ์ฌ์ฉํ์ฌ fine-tune ํ ๋ฒ์ ์ธ LLaMA2-Chat๋ ํจ๊ป ์ ๋ณด์๋ค๋ ์ ์ด๋ค! ๐ฎ LLaMA2-Chat์ ํ์ต์ํจ ์์ธํ ๋ฐฉ๋ฒ์ ์๋นํ ๋ฐฉ๋ํ๋ฏ๋ก ์์ธํ ๋ด์ฉ์ ๋ ผ๋ฌธ์ ์ฝ์ด๋ณด๊ธธ ๋ฐ๋ผ๊ณ , ๋๋ต์ ์ธ process๋ ๋ค์๊ณผ ๊ฐ๋ค. (chat fine-tuning process ๋ถ๋ถ์ด ์๋นํ ํฅ๋ฏธ๋ก์ฐ๋ ๋ ผ๋ฌธ๋ ํ ๋ฒ ์ฝ์ด๋ณด๊ธฐ๋ฅผ ์ถ์ฒํ๋ค!! ๐)
์ด๋ ๊ฒ ํด์ ๊ธฐ์กด์ LLaMA์์ ์ข ๋ ๊ฐ์ ๋ LLaMA2 ๋ชจ๋ธ์ด ๊ณต๊ฐ๋์๋ค. ์์ผ๋ก ์ด์ ์ด LLaMA2 ๋ชจ๋ธ์ ํ์ฉํ ์๋ก์ด open-source LLM์ด ๋ฑ์ฅํ๋ ๊ฒ์ ์๊ฐ๋ฌธ์ ๋ผ๊ณ ์๊ฐํ๋ค. ์ด๋ ๊ฒ ์๊ฐํ๊ณ ์๋ ์์ค์ ๋ฒ์จ LLaMA2๋ฅผ ํ์ฉํ์ฌ HuggingFace Open LLM leaderboard์์ 1์๋ฅผ ๊ฟฐ์ฐฌ ๋ชจ๋ธ๋ค์ด ๋์ค๊ณ ์๋ค! ๐ฎ ๋งํฌ ์ ์ปค๋ฒ๊ทธ Meta ํ์ฅ์ด 'I wonder what you guys will make out of this model(์ด ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์ด๋ค ๊ฒ์ ๋ง๋ค์ด๋ผ์ง ๊ถ๊ธํด์!)'๋ผ๊ณ ๋งํ ๊ฒ์ฒ๋ผ LLaMA2๋ฅผ ํ์ฉํ์ฌ ๋ ์ด๋ค ์ ๊ธฐํ๊ณ ์์ฒญ๋ ๋ชจ๋ธ๋ค์ด ๋ง๋ค์ด์ง์ง ๊ถ๊ธํ๊ณ ๋ ๋์ฌ ์ ์๊ธธ ๊ธฐ๋ํ๋ค! ๐
My opinion & Thank you for everyone ๐
๊ฒฐ๊ตญ์ LLM์ ์์ฅ์์ closed-source model๊ณผ open-source model์ ์๋ก ํจ๊ป ๋์๊ฐ์ผ ํ๋ค๊ณ ์๊ฐํ๋ค. ์๊ฐํด ๋ณด๋ฉด closed-source model์ ๊ฐ๋ฐ๋ก ์ฌ๋ฌ ์๋ก์ด method๋ค์ ๋ฐ๊ฒฌํ ์ ์๊ฒ ๋๊ณ , ์๋ก์ด ๋ฐฉํฅ์ผ๋ก ๋์๊ฐ ์ ์๊ฒ ๋๋ค. ๊ทธ๋ฆฌ๊ณ open-source model์ ์ด๋ฌํ closed-source model์ ํ์ฉํ์ฌ ์ข ๋ ํจ์จ์ ์ธ method๋ฅผ ๋ง๋ค๊ฑฐ๋ closed-source model์ method๋ฅผ ํ์ฉํ์ฌ ๊ฐ์ ๋ ๋ชจ๋ธ์ ๋ง๋ค๊ณ ์ ํ๋ค. ๊ทธ๋ฆฌ๊ณ closed-source model์ ๊ธฐ์ ์๊ฒ ์ฌ์ฉ์๋คํํ ์ข ๋ ๊ฐ์ ๋ ์๋น์ค๋ฅผ ์ ๊ณตํ ์ ์๊ฒ ํด ์ฃผ๊ณ , open-source model์ ์ฐ๊ตฌ์๋ค๋ก ํ์ฌ๊ธ ์ฌ๋ฌ ์ฐ๊ตฌ๋ฅผ ์งํํ ์ ์๊ฒ ํด ์ฃผ์ด ๊ธฐ์กด ๋ชจ๋ธ๋ค์ ๋ํ ์์ธํ ๋ถ์์ ๊ฐ๋ฅํ๊ฒ ํด ์ค์ผ๋ก์จ ์ข ๋ ๊ฐ์ ๋ ๋ฐฉ์์ ์ ์ํ ์ ์๊ฒ ํด ์ค๋ค. ๋ฐ๋ผ์ closed-source model๊ณผ open-source model์ ์๋ก ์ํธ๋ณด์ ๊ด๊ณ์ ์๋ค๊ณ ์๊ฐํ๋ค.
์ด ํฌ์คํ ์ ๋๊น์ง ์ฝ์ ๋ ์๋ผ๋ฉด ํ์๊ฐ ์ฝ๊ฐ open-source๋ฅผ ์๋นํ ์ข๊ฒ ๋ฐ๋ผ๋ณด๊ณ ์๋ค๋ ๊ฒ์ ํ์ ํ ์ ์์ ๊ฒ์ด๋ค. ๐ ์ฌ์ค ๊ฒฐ๋ก ๋ถํฐ ๋งํ์๋ฉด ๋ง๋ ๋ง์ด๋ค! ํ์๋ ์์ง ์ฐ๊ตฌ์ค์ด๋ ๊ธฐ์ ์ด๋ ์ด๋์๋ ์ํด์์ง ์์ ํ์ ์ ๋ถ์ด๊ธฐ์ computing resource ๋ฐ ๋น์ฉ์ ์ธก๋ฉด์์ ์๋นํ ์ ์ฝ์ ๋ฐ๊ณ ์๋ ์ํฉ์ด๋ผ์, open-source model์ ๋ฑ์ฅ์ ๊ฐ๋ญ์ ๋ด๋ฆฐ ๋จ ๋น๋ผ๊ณ ํํํ ์ ์์ ๊ฒ ๊ฐ๋ค. ๋๋ถ์ ์์์ ์ ์ฝ์์ ๋ฒ์ด๋ ์ฌ๋ฌ ๊ฐ์ง ํ๋ก์ ํธ์ ์ฐ๊ตฌ๋ค์ ์งํํด ๋ณผ ์ ์๋ ํ๊ฒฝ์ด ๋ง๋ จ๋์๊ธฐ ๋๋ฌธ์ open-source model์ ์ข์ ์์ ์ผ๋ก ๋ฐ๋ผ๋ณผ ์ ์๊ฒ ๋ ๊ฒ ๊ฐ๋ค. ๋ค์๊ธ ์ด๋ ๊ฒ ์ฐ๊ตฌ์๋ค๋ก ํ์ฌ๊ธ ๋์ฑ ํธํ๊ฒ ์ฐ๊ตฌ๋ฅผ ํ ์ ์๋๋ก open-source model์ ๋ง๋ค์ด์ค ์ฌ๋ฌ ์ฐ๊ตฌ์๋ค์๊ฒ ๊ฐ์ฌ๋ฅผ ํํ๋ค. ๐ฅฒ