Koala Overview
Koala๋ฅผ ์๊ฐํ๋ ํฌ์คํธ์์๋ ์น์ผ๋ก๋ถํฐ ์์ง๋ ๋ํ ๋ฐ์ดํฐ์์ Meta์ LLaMA๋ฅผ fine-tuning ํจ์ผ๋ก์จ ํ์ต๋ ์ฑ๋ด์ธ Koala๋ฅผ ์๊ฐํ์๋ค. ๋ฐ์ดํฐ์
curation๊ณผ training process๋ฅผ ์ค๋ช
ํ๊ณ Koala์ ChatGPT, Alpaca์ ๋น๊ตํ๋ ์ฌ์ฉ์ ์ฐ๊ตฌ์ ๊ฒฐ๊ณผ ๋ํ ๋ณด์ฌ์คฌ๋ค. Koala์ ๊ฒฐ๊ณผ๋ Koala๊ฐ ๋ค์ํ ์ฌ์ฉ์ ์ฟผ๋ฆฌ์ ํจ๊ณผ์ ์ผ๋ก ์๋ตํ ์ ์๊ณ , ์๋ต ์์ฑ๋ Alpaca๋ณด๋ค ๋ ์ ํธ๋์๊ณ , ์ ๋ฐ์ด ๋๋ ๊ฒฝ์ฐ์ ์ต์ํ ChatGPT์ ํ์ด๋ฅผ ์ด๋ฃจ๋ ๋ชจ์ต์ ๋ณด์ฌ์คฌ๋ค.
์ด๋ฌํ ๊ฒฐ๊ณผ๋ ์ถฉ๋ถํ ์์ ๋ชจ๋ธ๋ ์ ์คํ๊ฒ ๋ชจ์ฌ์ง ๋ฐ์ดํฐ์์ ํ์ต๋๋ฉด ์ด ๋ชจ๋ธ๋ค์ ํฐ cousin ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋ง์ด ์บก์ฒํ ์ ์๋ค๋ ๊ฒ์ ์ ์ํ๋ค. ์ด๊ฒ์ ์ปค๋ฎค๋ํฐ๊ฐ high-quality ๋ฐ์ดํฐ์
์ curating ํ๋๋ฐ ๋ ๋ง์ ๋
ธ๋ ฅ์ ์๋ ๊ฒ์ด ๊ธฐ์กด ์์คํ
์ ์ฌ์ด์ฆ๋ฅผ ๋ฅ๊ฐํ๋ ๊ฒ๋ณด๋ค ์ค์ํ๋ค๋ ๊ฒ์ ์์ํ๋ค. ๊ทธ๋ ์ง๋ง Koala๋ ์์ง ํ๋กํ ํ์
์ธ๋ฐ, ์ด๋ content, safety, reliability ์ธก๋ฉด์์ ์ฃผ์ํ ๋ช ๊ฐ์ง์ ๋จ์ ๋ค์ ๊ฐ์ง๊ณ ์๊ธฐ ๋๋ฌธ์ด๋ค.
System Overview
open-source ๋ชจ๋ธ์ closed-source ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋ง๋จน์ ์ ์๋ค. ๊ทธ์น๋ง ์ ์คํ๊ฒ ์ ํ๋ training data์ ์ฌ์ฉ์ ์ด๋ค์ ์ฑ๋ฅ์ ์ ๊ทผํ ์ ์๊ฒ ํด ์ค๋ค. Alpaca์์๋ ์ฌ๋ฐ๋ฅธ ๋ฐ์ดํฐ๋ smaller open-source ๋ชจ๋ธ์ ์๋นํ ๊ฐ์ ์ํฌ ์ ์๋ค๋ ๊ฒ์ ์ ์ํ๋ค.
์ด ํฌ์คํธ์๋ฌ๋ ์ด๋ฌํ ๋
ผ์์ ๋ํ ์ถ๊ฐ์ ์ธ ์ฆ๊ฑฐ๋ฅผ ์ ๊ณตํ๋ ์๋ก์ด ๋ชจ๋ธ์ธ ‘Koala’๋ฅผ ์๊ฐํ์๋ค. Koala๋ ์์ ๋กญ๊ฒ ์ฌ์ฉ ๊ฐ๋ฅํ ์น์์ ์์ง๋ ์ํธ์์ฉ ๋ฐ์ดํฐ์์ fine-tune ๋์์ง๋ง, ๋งค์ฐ ์ ๋ฅํ closed model๊ณผ ํจ๊ปํ ์ํธ์์ฉ์ ํฌํจํ๋ ๋ฐ์ดํฐ์ ๊ตฌ์ฒด์ ์ผ๋ก ์ง์คํ๊ธฐ๋ ํ๋ค. LLaMA base model์ ์น์์ ์์ง๋ ๋ํ ๋ฐ์ดํฐ์ ๊ณต๊ณต ๋ฐ์ดํฐ์
๋ฟ๋ง ์๋๋ผ question answering ๋ฐ์ดํฐ์
๊ณผ human feedback ๋ฐ์ดํฐ์
์์๋ fine-tune ํ์๋ค. ์ด๋ ๊ฒ ํด์ ๋์จ ๋ชจ๋ธ์ธ Koala-13B๋ human evaluation์ ์ํด ๊ธฐ์กด ๋ชจ๋ธ์ ๋นํด ์ ๋งํ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค.
์ด ๊ฒฐ๊ณผ๋ high-quality ๋ฐ์ดํฐ์
์ผ๋ก๋ถํฐ์ ํ์ต์ด smaller model์ ์ฝ์ ๋ค์ ์ํํ ์ ์์ ๋ฟ๋ง ์๋๋ผ ํฅํ์ ๊ฑฐ๋ closed-source ๋ชจ๋ธ์ ๋ฅ๋ ฅ๊ณผ๋ ๋ง์ถฐ์ง ์ ์๋ค๋ ๊ฒ๋ ์ ์ํ์๋ค. ๋ค์์ ํ 1์ Koala์ ๋ค๋ฅธ ๊ธฐ์กด ๋ชจ๋ธ๋ค ๊ฐ์ ์ฐจ์ด์ ๊ฐ์๋ฅผ ์ ๊ณตํด ์ค๋ค.
Dataset & Training
๋ํ ๋ชจ๋ธ์ ๋ง๋๋๋ฐ ๊ฐ์ฅ ํฐ ์ด๋ ค์์ training data๋ฅผ curateํ๋ ๊ฒ์ด๋ค. Koala๋ฅผ ๋ง๋ค๊ธฐ ์ํด ์น๊ณผ ๊ณต๊ณต ๋ฐ์ดํฐ์
์ผ๋ก๋ถํฐ ๋ํ ๋ฐ์ดํฐ๋ฅผ ์์งํจ์ผ๋ก์จ training set๋ฅผ curate ํ์๋ค. ์ด ๋ฐ์ดํฐ๋ ์ฌ์ฉ์๋ค์ด ์จ๋ผ์ธ์ ์ฌ๋ฆฐ LLM์ ๋ํ๋ฅผ ํฌํจํ๋ค.
์ต๋ ๊ฐ๋ฅํ ์น ๋ฐ์ดํฐ๋ฅผ ์์งํจ์ผ๋ก์จ ์์ ์ต๋ํํ๊ธฐ๋ณด๋ค, ์์ง๋ง high-quality ๋ฐ์ดํฐ์
์ ์์งํ๋๋ฐ ์ด์ ์ ๋์๋ค. ์ด๋ฅผ ์ํด QA, human feedback, LM๊ณผ์ ๋ํ์ ๋ํ ๊ณต๊ณต ๋ฐ์ดํฐ์
์ ์ฌ์ฉํ์๋ค. ์๋์์ ๋ฐ์ดํฐ์
์ ๊ตฌ์ฒด์ ์ธ ๋ํ
์ผ์ ๋ํด ์ค๋ช
ํ๊ฒ ๋ค.
ChatGPT Distillation Data
- Public User-shared Dialogue with ChatGPT(ShareGPT): ์ฌ์ฉ์๋ค์ ์ํด ๊ณต์ ๋ 60K ๊ฐ์ ๋ํ
- Human ChatGPT Comparison Corpus(HC3): 24K ๊ฐ์ question์ ๋ํ 60K human answer+27K ChatGPT answer
Open Source Data
- Open Instruction Generalist(OIG): OIG ๋ฐ์ดํฐ์ ์ผ๋ก๋ถํฐ ์์ ์ ํ๋ ์์์ ์๋ธ์
- Stanford Alpaca: Alpaca ๋ชจ๋ธ์ ํ์ต์ํค๋๋ฐ ์ฌ์ฉ๋ ๋ฐ์ดํฐ์
- Anthropic HH: ๋ชจ๋ธ outpyt์ harmful & helpfulness์ ์ฌ๋ ํ๊ฐ๋ฅผ ํฌํจํ๋ ๋ฐ์ดํฐ์
- OpenAI WebGPT: question, ๋ชจ๋ธ ์๋ต ์, ๋ฉํ๋ฐ์ดํฐ๋ก ๊ตฌ์ฑ๋ ๊ฐ example ๊ฐ์ 20K ๋น๊ต
- OpenAI Summarization: ๊ฐ example์ ๋ชจ๋ธ์ ์ํด ์์ฑ๋ ์์ฝ์ ๋ํ ์ฌ๋์ ํผ๋๋ฐฑ์ผ๋ก ๊ตฌ์ฑ๋ 93K ๊ฐ์ example์ ํฌํจํ๋ ๋ฐ์ดํฐ์
Preliminary Evaluation
์คํ์์๋ 2๊ฐ์ ๋ชจ๋ธ์ ํ๊ฐํ๋ค: distillation data๋ง ์ด Koala-Distill๊ณผ distillation๊ณผ open-source ๋ฐ์ดํฐ๋ฅผ ๋ชจ๋ ํฌํจํ๋ Koala-All. ์ด ์คํ์ ๋ชฉํ๋ ์ด ๋ชจ๋ธ๋ค์ ์ฑ๋ฅ์ ๋น๊ตํ๊ณ distillation๊ณผ open-source ๋ฐ์ดํฐ์
์ด ์ต์ข
์ฑ๋ฅ์ ์ด๋ ํ ์ํฅ์ ๋ฏธ์น๋์ง ํ๊ฐํ๋ ๊ฒ์ด๋ค. ๊ฐ ๋ชจ๋ธ๋ค์ ๋น๊ตํ๊ธฐ ์ํด human evaluation์ ์ฌ์ฉํ์๋ค. ๊ทธ ๊ฒฐ๊ณผ๊ฐ ์์ ๊ทธ๋ฆผ 2์ ๋ํ๋ ์๋ค. Stanford Alpaca์์ ์ฌ์ฉ๋ 180๊ฐ์ test query๋ก ๊ตฌ์ฑ๋ ์ธํธ์ Koala๋ง์ ํ
์คํธ์
์ธ Koala Test Set์์ ํ๊ฐํ์๋ค.
๋์ฑ ์ฌ์ค์ ์ธ ํ๊ฐ ํ๋กํ ์ฝ์ ์ ๊ณตํ๊ธฐ ์ํด ์จ๋ผ์์ด ํฌ์คํธ ๋ 180๊ฐ์ ์ค์ ์ฌ์ฉ์ ์ฟผ๋ฆฌ๋ก ๊ตฌ์ฑ๋ Koala Test Set์ ์๊ฐํ์๋ค. ์ด๋ฌํ ์ฌ์ฉ์ ์ฟผ๋ฆฌ๋ ๋ค์ํ ํ ํฝ์ผ๋ก ์ด๋ฃจ์ด์ ธ ์๊ณ , ๊ตฌ์ด์ฒด์ ์ด๊ณ , ์ฑํ
๊ธฐ๋ฐ ์์คํ
์ ์ค์ ์ฌ์ฉ ์ฌ๋ก๋ฅผ ๋ ์ ๋ํํ ๊ฐ๋ฅ์ฑ์ด ๋๋ค. ๊ฐ๋ฅํ test-set ๋์๋ฅผ ์ํํ๊ธฐ ์ํด training set์ example๊ณผ 20% ์ด์์ BLEU score๋ฅผ ๊ฐ์ง๋ ์ฟผ๋ฆฌ๋ ํํฐ๋งํด ๋๋ค. ์ถ๊ฐ์ ์ผ๋ก rater๋ค์๊ฒ ์ ๋ขฐ๋ ์๊ฒ ํ๊ฐ๋ ์ ์๋ ์ฟผ๋ฆฌ์ ๋ํ ๋น์์ด ๋ฐ ์ฝ๋ฉ ๊ด๋ จ ์๋ต์ ์ ๊ฑฐํ๋ค.
์ด 2๊ฐ์ง ํ๊ฐ ์ธํธ์ ํจ๊ป ๋ชจ๋ธ์ ํ๋ฆฌํฐ๋ฅผ ๋น๊ตํ๊ธฐ ์ํด ๊ฑฐ์ 100๋ช
์ ํ๊ฐ์๋ค์๊ฒ ๋ฌผ์ด๋ด์ผ๋ก์จ ๋ธ๋ผ์ธ๋ ์๋ณ ๋น๊ต๋ฅผ ์ํํ์๋ค. ํ๊ฐ ์์ ๊ฐ ํ๊ฐ์๋ค์๊ฒ input prompt์ 2๊ฐ์ ๋ชจ๋ธ์ output์ ์ฃผ์๋ค. ๊ทธ๋ค์์ ์๋ต ํ๋ฆฌํฐ์ ์ ํ๋์ ์ฐ๊ด๋ ๊ธฐ์ค์ ์ฌ์ฉํด์ ์ด๋ค output์ด ๋ ๋์์ง ํ๊ฐํ๋๋ก ๋ฌผ์ด๋ดค๋ค.
Alpaca ํ
์คํธ ์
์์ Koala-All์ Alpaca์ ์คํ๋ ์ฑ๋ฅ์ ๋ณด์ฌ์คฌ๋ค. ํ์ง๋ง ์ ์๋ test set์์ ์ ๋ฐ์ ๊ฐ๊น์ด ๊ฒฝ์ฐ์ Koala-All์ Alpaca๋ณด๋ค ๋ ๋ซ๋ค๊ณ ํ๊ฐ๋์๋ค. ๊ทธ๋ฆฌ๊ณ ๋ ๋ชจ๋์ ๊ฒฝ์ฐ์ 70% ์ด์์ ๊ฒฝ์ฐ์ Alpaca๋ณด๋ค ๋ซ๊ฑฐ๋ ํ์ด๋ฅผ ์ด๋ฃจ๋ ๋ชจ์ต์ ๋ณด์ฌ์คฌ๋ค. ๋ฌผ๋ก Koala test set์ ๋ ๋ง์ ๋ํํ prompt๋ Koala training set๊ณผ ๋ ์ ์ฌํ๋ฏ๋ก ์ด๋ ๋๋์ง ์์ง๋ง, ์ด๋ฌํ prompt๊ฐ ํด๋น ๋ชจ๋ธ์ downstream ์ฌ์ฉ ์ฌ๋ก์ ๋ ์ ์ฌํ๋ค๋ ์ ์์ ์ด๋ Koala๊ฐ ์์ํ ์ ์์์ ๋ณด์ฌ์ค๋ค. ์ด๋ assistant์ ๊ฐ์ ์์ฉ์์ ๋ ๋์ ์ฑ๋ฅ์ ๋ฐํํ๋ค. ์ด๊ฒ์ ์น์์ ์ฌ์ฉ์๋ค์ ์ํด ํฌ์คํธ ๋ example๋ก๋ถํฐ ์ป์ด์ง LLM ์ํธ์์ฉ ๋ฐ์ดํฐ๋ ํจ๊ณผ์ ์ธ instruction ์คํ ๋ฅ๋ ฅ์ ์ํ ํจ๊ณผ์ ์ธ ์ ๋ต์ด๋ผ๋ ๊ฒ์ ์ฃผ์ฅํ๋ค.
์ด์ง ๋๋๊ฒ๋ open-source data + distillation data(Koala-All)์์์ ํ์ต์ ๊ทธ์ ChatGPT distillation data(Koala-Distill)์์์ ํ์ต๋ณด๋ค ์ด์ง ์ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์คฌ๋ค. ์ฐจ์ด๋ ๊ทธ๋ฆฌ ํฌ์ง ์์์ง๋ง, ์ด๋ high-quality์ ChatGPT ๋ํ ๋ฐ์ดํฐ์ ๋ ๋ฐฐ ๋ ๋ง์ ์์ open-source data๋ฅผ ์ถ๊ฐํ๋ ๊ฒ์ ์๋นํ ๊ฐ์ ์ ์ด๋์ง ์๊ธฐ ๋๋ฌธ์, ํจ๊ณผ์ ์ธ instruction๊ณผ assistant ๋ชจ๋ธ์ ๋ง๋๋ ๊ฒ์ด ์ค์ํ๋ค๋ ๊ฒ์ ์ ์ํ๋ค. ๊ทธ๋ฆฌ๊ณ ๊ฐ๋ ฅํ ๋ํ ๋ชจ๋ธ์ ๋ง๋๋๋ฐ ์ค์ํ ๊ฒ์ ๊ธฐ์กด ๋ฐ์ดํฐ์
์ ๊ฐ๋จํ๊ฒ ์ฌํฌ๋งท ํ๋ ๊ฒ๋ณด๋ค ์ฌ์ฉ์ ์ฟผ๋ฆฌ์ ๋ค์ํ high-quality ๋ํ ๋ฐ์ดํฐ๋ฅผ curate ํ๋ ๊ฒ์ด ์ค์ํ๋ค๊ณ ๋งํ๋ค.
Limitations & Safety
๋ค๋ฅธ LM๊ณผ ๊ฐ์ด Koala๋ ์๋ชป ์ฌ์ฉ๋์ ๋ ํด๋ก์ธ ์ ์๊ณ ์ ์ฝ์ ๊ฐ์ง๋ค. Koala๋ ์ฌ์ค์ฑ ์๋ ์๋ต์ ๋งค์ฐ ์์ ๊ฐ ์๋ ์ด์กฐ๋ก hallucinateํ๊ณ ์์ฑํ ์๋ ์๋ค. ์ด๊ฒ์ smaller model์ด larger model๊ณผ ๋๊ฐ์ ์์ค์ ์ฌ์ค์ฑ์ ๊ฐ์ง์ง ๋ชปํ๊ณ , ๊ทธ์ ์์ ๊ฐ ์๋ ์คํ์ผ์ ์์๋ฐ์ ์ ์ข์ ์ํฅ ๋๋ฌธ์ด๋ค. ๊ทธ๋ฆฌ๊ณ hallucinated ์๋ต์ด ์๋ชป ์ฌ์ฉ๋์ ๋ ์๋ชป๋ ์ ๋ณด๋ฅผ ํผ๋จ๋ฆฌ๋ ๋ฑ์ ๋ฌธ์ ๋ฅผ ์ผ์ผํฌ ์๋ ์๋ค.
Koala๋ ๋ถ์ ํํ ์ ๋ณด๋ฅผ ์์ ๊ฐ ์๋ ์ด์กฐ๋ก hallucinate ํ ์ ์๋ค. Koala๋ ๋ค๋ฅธ ์ฑ๋ด LM์ด ๊ฐ์ง๋ ๋ค์์ ์ฝ์ ๋ค์ ๊ณต์ ํ๋ค.
- Biases & Stereotypes
- Commonsense์ ๋ถ์กฑ
- Limited Understanding
Koala๋ฅผ ์์ ํ๊ฒ ๋ง๋ค๊ธฐ ์ํด, ๋ชจ๋ธ์ด ๋์ฑ robustํ๊ณ harmless ํ๊ฒ ๋ง๋ค๊ธฐ ์ํ ShareGPT์ Anthropic HH๋ก๋ถํฐ ๊ณต๊ฒฉ์ ์ธ prompt๋ฅผ ํฌํจํ์๋ค.
์ถ์ฒ
https://bair.berkeley.edu/blog/2023/04/03/koala/