The overview of this paper
ChatGPT ๊ฐ์ chat ๋ชจ๋ธ๋ค์ ์ธ์์ ์ธ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ๋ฉด์ ๋น ๋ฅด๊ฒ ์ฌ๋ฌ ๋๋ฉ์ธ์ ์ ์ฉ๋์ด ๋๊ฐ๊ณ ์๋ค. ํ์ง๋ง, ์ ํ๋ API ๋๋ฌธ์ ์๋ก์ด ์ฐ๊ตฌ์ ์ฅ์ ๋ฌผ์ ๋ง๋ค๊ณ ์๋ค. ๋ ผ๋ฌธ์์๋ ChatGPT๋ฅผ ๋ํ์ ์ฐธ์ฌ์ํค๊ฒ ํ์ฉํจ์ผ๋ก์จ ์๋์ ์ผ๋ก high-quality multi-turn chat corpus๋ฅผ ์์ฑํ ์ ์๋ ํ์ดํ๋ผ์ธ์ ์ ์ํ์๋ค. ๊ทธ๋ค์์ ์ด ๋ฐ์ดํฐ๋ค์ parameter-efficient tuning์ผ๋ก LLaMA๋ฅผ ํฅ์ํ๊ธฐ ์ํด ์ฌ์ฉํ์๋ค. ๊ทธ ๊ฒฐ๊ณผ ํ์ํ ๋ชจ๋ธ์ด Baize์ด๊ณ , ์ด ๋ชจ๋ธ์ ๊ฐ๋๋ ์ผ์ด ์๋ multi-turn dialogue ์ธํ ์์ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋ค. ๊ฒ๋ค๊ฐ, ChatGPT์ ํผ๋๋ฐฑ์ ์ฌ์ฉํ์ฌ Baize ๋ชจ๋ธ์ ์ฑ๋ฅ์ ์ถ๊ฐ์ ์ผ๋ก ๊ฐ์ ์ํค๊ธฐ ์ํด ์๋ก์ด ๊ธฐ์ ์ธ Self-Distillation with Feedback(SDF)๋ฅผ ์ ์ํ์๋ค.
Table of Contents
1. Introduction
2. Data Collection via Self-Chat
3. Model Training
4. Evaluation
5. Conclusion
1. Introduction
ChatGPT์ GPT-4์ฒ๋ผ ๋ง์ LM๋ค์ ๊ด๋ชฉํ ๋งํ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๊ณ ์์ง๋ง, ์ด๋ค์ ์ด๋ฐ ์ ๋งํ ๋ฅ๋ ฅ์๋ ๋ถ๊ตฌํ๊ณ ์ด๋ค์ ๋ํ ์ ๊ทผ์ ์ ํ๋ API์์๋ง ๊ฐ๋ฅํ๋ค๋ ๋จ์ ์ ๊ฐ์ง๊ณ ์๋ค. ์ด๋ ์๋ก์ด ์ฐ๊ตฌ ๋๋ ๋ฐ์ ์ ์ฅ๋ฒฝ์ ๋ง๋ค์ด ๋ฒ๋ฆฌ๋ ์ ์ด๋ค.
์ด ๋ ผ๋ฌธ์์๋ ์๋์ ์ผ๋ก high-quality multi-turn chat corpus๋ฅผ ์์ฑํ๊ธฐ ์ํด ChatGPT์ ๋ฅ๋ ฅ์ ํ์ฉํจ์ผ๋ก์จ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ์๋ก์ด pipeline์ ์ ์ํ์๋ค(๊ทธ๋ฆผ 1). ๋ ผ๋ฌธ์ ๋ฐฉ์์ ChatGPT๋ฅผ ์ฌ์ฉ์์ AI ์๋ต์ ๋ชจ๋ ์ฌ์ฉํ์๋ค. ์ด๋ ๊ฒ ์์ฑ๋ corpus๋ multi-turn ๋ํ์ ๋ฌธ๋งฅ์์ chat model์ ํ๊ฐํ๊ณ ํ์ต์ํค๊ธฐ ์ํ ๊ท์คํ ์์์ผ๋ก ์ฌ๊ฒจ์ง๋ค.
low-resource ์ธํ ์์ LLM์ fine-tuneํ๊ธฐ ์ํด parameter-efficient ๋ฐฉ์์ ์ฌ์ฉํ์๋ค. ์ด ์ ๋ต์ SoTA ๋ชจ๋ธ์ ํ์ ๋ ์์ ํ๊ฒฝ์์ ์ข์ ์ฑ๋ฅ์ ์ ์ง์ํค๋ฉด์ ์ ์ฉํ ์ ์๊ฒ ํด ์ค๋ค. ๋ ผ๋ฌธ์์๋ ์ฃผ๋ก open-source LLM์ธ LLaMA๋ฅผ ๊ฐ์ ์ํค๋๋ฐ ์ง์คํ์๋ค. LLaMA๋ฅผ ์์ฑ๋ chat corpus์ ํจ๊ป fine-tuning ํจ์ผ๋ก์จ ์๋ก์ด Baize ๋ชจ๋ธ์ ์์ฑํ์๋ค. ๊ฒ๋ค๊ฐ ๋ ผ๋ฌธ์์๋ Baize์ ์ฑ๋ฅ์ ๊ฐ์ ์ํค๊ธฐ ์ํด RLHF์ ๋ํ ๋์์ผ๋ก Self-Distillation with Feedback(SDF)๋ฅผ ์ ์ํ์๋ค.
๋ ผ๋ฌธ์ ์ฃผ๋ contribution์ ๋ค์๊ณผ ๊ฐ๋ค.
- ChatGPT๋ฅผ ๋ํ์ ์ฐธ์ฌ์ํด์ผ๋ก์จ ์๋์ ์ผ๋ก high-quality multi-turn chat corpus๋ฅผ ์์ฑํ๋ ๋ณต์ฌํ ์ ์๋ pipeline์ ์ ์ํ์๋ค. ๋ ผ๋ฌธ์์ ์๊ฐํ pipeline์ multi-turn dialogue ์ธํ ์์ chat model์ ํ์ต์ํค๊ธฐ ์ํ public resource์ ๊ฐ๋ฅ์ฑ ๊ฐญ์ ์ฑ์ ๋ค.
- ๋ ผ๋ฌธ์์๋ low-resource ์ธํ ์์ LLaMA ๋ชจ๋ธ์ ํฅ์์ํค๊ธฐ ์ํด parameter-efficient tuning๊ณผ SDF๋ฅผ ์ ์ํ์๋ค. ์ด๋ ๊ฒ ํด์ ๋งค์ฐ ์ ๋ฅํ chat model์ธ Baize๋ฅผ ๋ง๋ค์ด๋๋ค.
2. Data Collection via Self-Chat
์ด ์น์ ์์๋ ๋ํ์ ChatGPT๋ฅผ ์ฐธ์ฌ์ํค๊ธฐ ์ํด ChatGPT๋ฅผ ํ์ฉํจ์ผ๋ก์จ high-quality multi-turn chat corpus๋ฅผ ์์ฑํ๊ธฐ ์ํด ์ฌ์ฉ๋๋ ๋ฐฉ๋ฒ๋ก ์ ๋ํด์ ์ค๋ช ํ์๋ค. ์ด self-chat ํ๋ก์ธ์ค๋ ๋ฐ์ดํฐ ์์ง pipeline์ ํ ๋์ด๊ณ open-source LLM, LLaMA์ ์ฑ๋ฅ์ ํฅ์ํ๋๋ฐ ์ค์ํ ์ญํ ์ ํ๋ค.
self-chat process๋ ๋ฉ์์ง๋ฅผ ์์ฑํ๊ธฐ ์ํด ChatGPT๋ฅผ ์ฌ์ฉ์์ AI assistant๋ก ์ฌ์ฉํ์๋ค. ๋ ผ๋ฌธ์์๋ ํฌ๋งท๊ณผ ์๊ตฌ์ฌํญ์ ์ ์ํ๊ธฐ ์ํด template์ ์ ์ฉํ์๋ค. ๋ํ๋ 'seed'๋ฅผ ์ค์ฌ์ผ๋ก ํด์ ์งํ๋๊ณ , ์ด๊ฒ์ chat์ ๋ํ ํ ํฝ์ ์ค์ ํ๋ ์ง๋ฌธ ๋๋ ์ค์ ๊ตฌ๋ฌธ์ด ๋ ์ ์๋ค.
Baize๋ฅผ ํ์ต์ํค๊ธฐ ์ํด ๋ ผ๋ฌธ์์๋ Quora & StackOverflow์ question์ seed๋ก ์ฌ์ฉํ์๋ค. self-chat์ ์ํด ์์ฑ๋ example์ ๋ค์์ ํ 1์ ํ์ธํ๊ธธ ๋ฐ๋๋ค. Baize์ ์ฒซ ๋ฒ์งธ ๋ฒ์ (Baize v1)์ ํ์ต์ํค๊ธฐ ์ํด ๋ ผ๋ฌธ์์๋ self-chat์ ํตํด ์ด 111.5K ๊ฐ์ ๋ํ๋ฅผ ์์งํ์๋ค. ๋ํ ํน์ ๋๋ฉ์ธ์ ๋ฐ์ดํฐ์ ์ผ๋ก๋ถํฐ ์ถ์ถ๋ question๊ณผ ๊ตฌ๋ฌธ์ ์ฌ์ฉํด์ ํน์ ๋๋ฉ์ธ์ ๋ํ chat model์ ์ง์๊ณผ ๋ฅ๋ ฅ์ ํฅ์์ํฌ ์ ์๋ค. ๊ทธ๋์ ๋ ผ๋ฌธ์์๋ MedQuAD ๋ฐ์ดํฐ์ ์ seed๋ก ์ฌ์ฉํด์ ํฌ์ค์ผ์ด์ ํนํ๋ Baize ๋ชจ๋ธ์ ํ์ต์ํค๊ธฐ๋ ํ์๋ค.
๋ ผ๋ฌธ์์๋ Baize v1.5๋ฅผ ํ์ต์ํค๊ธฐ ์ํ ๋ ๋์ ํ๋ฆฌํฐ์ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ธฐ ์ํด ํ ๋ฒ์ ํ ๋ฒ์ฉ ์๋ต์ ์์ฑํ๊ธฐ ์ํด ๋ ๋ค๋ฅธ ChatGPT๋ฅผ ์ฌ์ฉํ๊ณ ํ ํ๋ฆฟ์์ AI์ ์๋ต์ ์ ๊ฑฐํ์๋ค. ์ด๋ ChatGPT ์๋ต๊ณผ ์์ ํ ์ผ๊ด๋๋ ์๋ต์ ์ป๊ธฐ ์ํด์์ด๋ค. ์ด๊ฒ์ ๋ณดํต ๋์ฑ ๊ธธ๊ณ ๋ ๋ง์ ๋ํ ์ผ์ ํฌํจํ๋ค. ๊ฒฐ๊ณผ๋ก ๋์จ corpora์ ํต๊ณ๊ฐ ํ 2์ ๋ํ๋ ์๋ค.
Comparison with Other Sources. Alpaca ๋ชจ๋ธ์ instruction learning ํ์์ ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ธฐ ์ํด self-instruct๋ฅผ ์ฌ์ฉํ์๋ค. ํ์ง๋ง T0๊ณผ FLAN์์ ์๊ฐ๋ instruction-input-output ํ์์ single turn์ผ๋ก ์ ํ๋๊ณ ChatGPT์ ๋ํ ์ธํฐํ์ด์ค์ ๋ค๋ฅด๋ค. ์ด์๋ ๋ฐ๋๋ก, Baize์ ๋ฐ์ดํฐ ์์ง pipeline์ ChatGPT์ high-quality chat ๋๋ณธ์ ํ์ฉํจ์ผ๋ก์จ ๋ชจ๋ธ์ ์ฑ ๋ฅ๋ ฅ์ ๊ฐํ์ํค๋๋ฐ ์ง์คํ์๋ค. ์ถ๊ฐ์ ์ผ๋ก instruction์ ๋ฐ๋ฅด๋ Baize์ ๋ฅ๋ ฅ์ ์ถ๊ฐ์ ์ผ๋ก ํฅ์์ํค๊ธฐ ์ํด Alpaca์ ๋ฐ์ดํฐ๋ฅผ training data์ ํฌํจํ์๋ค.
VIcuna๋ shareGPT.com์ผ๋ก๋ถํฐ ํฌ๋กค๋ง๋ ๋ํ๋ฅผ ์ฌ์ฉํ์๋ค. ์ด๋ ๊ฒ ํ๋ ๊ฒ์ ์ฅ์ ์ ์์ง๋ ๋ฐ์ดํฐ์ high-quality ๋๋ฌธ์ด๋ค. ํ์ง๋ง ์ด๋ฌํ ์์ค๋ ์ค์ํ ๊ฐ์ธ์ ๋ณด์ ๋ฒ์ ๋ฌธ์ ๋ฅผ ๊ฐ์ง๊ณ ์์ ์ ์๋ค. ์ฌ์ฉ์๋ค์ ์ํด ๊ณต์ ๋๋ ์ปจํ ์ธ ๋ ๋งค์ฐ ๋ฏผ๊ฐํ ๊ฐ์ธ ์ ๋ณด๋ฅผ ํฌํจํ๊ฑฐ๋ ๋ณต์กํ ์ ์๊ถ ๋ฌธ์ ์ ์ฐ๊ด๋์ด ์์ ์๋ ์๋ค. ์ด๋ฌํ ๋ฐ์ดํฐ ์์ค์ ๋ฌ๋ฆฌ ๋ ผ๋ฌธ์์ ์ ์๋ self-chat pipeline์ ์ ์๊ถ ๋ฌธ์ ์ ๋ํ ๊ฑฑ์ ์์ด ๋ฐ์ดํฐ๋ฅผ ์์งํ๊ธฐ ์ํ ์ ๋ขฐ๋ ์๊ณ scalable ํ ๋ฐฉ๋ฒ์ด๋ค.
3. Model Training
Parameter-Efficient Supervised Fine-tuning. ๊ธฐ์กด์ fine-tuning์ ๋ฐฉ๋ํ ์์ ์ปดํจํ ์์ ๋ฟ๋ง ์๋๋ผ high-quality & ๋ฐฉ๋ํ ๋ฐ์ดํฐ์ ์ ํ์๋ก ํ๋ค. ํ์ง๋ง high-quality multi-turn chat corpora์ ์ ํ๋ ๊ฐ์ฉ์ฑ์ด ์ฃผ์ด์ง๋ฉด, ๋ฐ์ดํฐ & ์ปดํจํ ์์ ํน๋ฉด์์ ๋์ฑ ํจ์จ์ ์ธ method๋ฅผ ์ ์ฉ์ํค๋ ๊ฒ์ด ์ค์ํ๋ค. ์ฌ๊ธฐ์ parameter-efficient tuning method๋ ์ฌ์ฉ ๊ฐ๋ฅํ ๋ฐ์ดํฐ์ ๋ ๋์ ์ฌ์ฉ์ ๋ง๋ค๊ณ ๊ด๋ฒ์ํ ์์ ํ์ฉ์ ๋ํ ํ์๋ฅผ ์ต์ํํจ์ผ๋ก์จ ์ด ๋ชฉํ๋ฅผ ๋ฌ์ฑํ ์ ์๊ฒ ๋์์ฃผ์๋ค.
๋ ผ๋ฌธ์์๋ LLaMA ๋ชจ๋ธ์ ํ๋ํ๊ธฐ ์ํด LoRA๋ฅผ ์ฌ์ฉํ์๋ค. ํ์ต ๊ฐ๋ฅํ ํ๋ผ๋ฏธํฐ์ ์๋ฅผ ๋๋ฆฌ๊ณ ์ ์ ๋ฅ๋ ฅ์ ์ฆ๊ฐ์ํค๊ธฐ ์ํด LoRA๋ฅผ LLaMA์ ๋ชจ๋ ์ ํ ๋ ์ด์ด์ ์ ์ฉํ์๋ค. ํ 3์ ๊ฐ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ์ ์๊ฐ ๋์ด๋์ด ์๋ค.
Self-Distillation with Feedback(SDF). Baize v1.5์ ๊ธฐ๋ฐํด์ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๊ฐ์ ์ํค๊ธฐ ์ํ ์๋ก์ด ๋ฐฉ๋ฒ์ ์๊ฐํ๊ณ ๊ทธ ๊ฒฐ๊ณผ๋ก Baize v2๊ฐ ๋์๋ค. self-chat ๋ฐ์ดํฐ์์ supervised fine-tuning ํ์ ๊ฒฐ๊ณผ๋ก ๋์จ Baize v1.5 ๋ชจ๋ธ์ Quora ๋ฐ์ดํฐ์ ์ ๊ฐ instruction์ ๋ํ 4๊ฐ์ ์๋ต์ ์์ฑํ๊ธฐ ์ํด ์ฌ์ฉํ์๋ค. ๊ทธ๋ค์์ ChatGPT๋ก self-distillation์ ์ํ ์ต๊ณ ์ ์๋ต์ ๊ณ ๋ฅด๊ธฐ ์ํด ์ฌ์ฉํ์๋ค.
new LoRA๋ ChatGPT์ ์ํด ์ ํ๋ ์ต๊ณ ์ ์๋ต์ ๋ํด์ ์ต์ ํ๋ ๋ฐฉ๋ฒ์ด๋ค. self-distillation ๊ณผ์ ์์ new LoRA๋ฅผ Baize v1.5์ ๋ชจ๋ ์ ํ ๋ ์ด์ด์ ์ ์ฉํ์๋ค. SDF๋ RLHF์ ๋์์ผ๋ก Reward model์ด ํ์ํ์ง ์๊ณ , 3๋ฐฐ ๋ ๋น ๋ฅธ ์๋๋ฅผ ๋ณด์ฌ์ค๋ค.
SDF๋ Baize ์์ ์ ๋ํ ์์ฑ์์ distillation์ ํฌํจํ๊ธฐ ๋๋ฌธ์ ์ ๋ฐ์ ์ผ๋ก ๋ฎ์ loss๋ฅผ ๊ฐ์ง๊ณ , ์ด๋ ๋ชจ๋ธ์ด ํผ๋๋ฐฑ์์ ๋์์ค๋ฅผ ์บก์ฒํ๊ณ catastrophic forgetting ์์ด fine-grained optimization์ ์ํํ๊ฒ ํ๋ฝํด ์ค๋ค. ์ด ๋ ผ๋ฌธ์์๋ preference๋ฅผ ์์ฑํ๊ธฐ ์ํด ChatGPT๋ฅผ ์ฌ์ฉํ๋ SDF๋ฅผ ์ฌ์ฉํ์์ง๋ง, ์ด ๊ธฐ์ ์ human feedback๊ณผ๋ ์ฌ์ฉ๋ ์ ์๋ค๊ณ ๋ฏฟ๋๋ค.
4. Evaluation
GPT-4 Score. ๋ ผ๋ฌธ์์๋ Baize์ ์ฑ๋ฅ์ ํ๊ฐํ๊ธฐ ์ํด GPT-4๋ฅผ ์ฌ์ฉํ์ฌ ํ๊ฐํ๋ Vicuna Evaluation์ ํ์ฉํ์๋ค. before SDF Baize v2 & after SDF Baize v2์ ChatGPT๋ฅผ ๋น๊ตํ๊ณ , ์ด์ธ์ ๋ค๋ฅธ ๋ชจ๋ธ๋ค๋ ๋น๊ตํด๋ณด์๋ค. ๊ทธ๋ฆผ 2์์ ๋ณด์ด๋ ๊ฒ์ฒ๋ผ Baize v2 7B๋ Vicuna 7B๋ณด๋ค ๋ ๋์ ์ฑ๋ฅ์ ๋ณด์ฌ์คฌ๊ณ , Baize v2 13B๋ Vicuna 13B์ ๋๋ฑํ ์ฑ๋ฅ์ ๋ณด์ฌ์คฌ๋ค. VIcuna๋ fully fine-tune ๋์ด ์๋ ์ํ์์๋ ๋ง์ด๋ค.
Qualitative Study. ๋ ผ๋ฌธ์์๋ Baize์ ๋ฅ๋ ฅ์ ์ค๋ช ํ๋ example ๋ํ ์ ๊ณตํ์๋ค. ๊ฐ ์นดํ ๊ณ ๋ฆฌ์ example์ ์ฒ์์ ์๋๋ ๊ฒ์ด๋ผ๋ฉด not cherry-picked๋ก, ๋ค์ํ ๋ํ๋ก๋ถํฐ ์ ํ๋ ๊ฒ์ด๋ผ๋ฉด cherry-picked๋ก ํ๊ธฐํ์๋ค. ํ 4์์๋ chat model์ด ์ด๋ป๊ฒ ๊ธ์ต ์ฌ๊ฑด์ ๋ถ์ํ๋์ง ๋ณด์ฌ์ฃผ๊ณ , ํ 5์์๋ ์กฐํฌ๋ฅผ ์ค๋ช ํ๋ ๊ฒ์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค.
์ฑ๋ด์ ๋ํด ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ๋ ์ค์ํ์ง๋ง, ๋ชจ๋ธ์ ์๋ชป๋ ์ฌ์ฉ์ ์๋ฐฉํ๋ ๊ฒ๋ ์ค์ํ๋ค. ๋ ผ๋ฌธ์์๋ ๋ชจ๋ธ์ด ๋น์ค๋ฆฌ์ ์ง๋ฌธ์ ์ด๋ป๊ฒ ์ฒ๋ฆฌํ๋์ง 2๊ฐ์ง example์ ์ ๊ณตํ๊ณ ์๋ค. ์ด๋ฌํ ๋ ๊ฐ์ง example์ Baize๊ฐ ์ฑ๊ณต์ ์ผ๋ก ๋ถ๋๋ํ ์์ฒญ์ ๊ฑฐ์ ํ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค.
๋ง์ง๋ง์ผ๋ก Baize์ ์ฝ๋ฉ ๋ฅ๋ ฅ์ ํ 7์์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค.
์ถ๊ฐ์ ์ผ๋ก general Baize ๋ชจ๋ธ์ ์ํด ํฌ์ค์ผ์ด ์ ๋ฌธ๊ฐ์ ๋์์ ๋ฐ์ Baize-Healthcare๋ฅผ ํ ์คํธํ์๋ค. ํ๋์ ์์๊ฐ ํ 8์ ๋ํ๋ ์๊ณ , ํฌ์ค์ผ์ด ์ ๋ฌธ๊ฐ๋ Baize-Healthcare์ ์๋ต์ด ์ ์ ํ๋ค๋ ๊ฒ์ ์ ์ฆํด์ฃผ์๋ค.
5. Conclusion
open-source chat ๋ชจ๋ธ Baize์ ๊ตฌ์ฒด์ ๋ฐ์ดํฐ์ ์ผ๋ก๋ถํฐ ์๋์ ์ผ๋ก seed๋ฅผ ์ํ๋งํ๋ pipeline์ ์ ์ํ์๋ค. ChatGPT ์์ ๊ณผ ๋ํํ๊ฒ ํจ์ผ๋ก์จ high-quality ๋ํ corpus๋ฅผ ์์งํ์๋ค.
Limitations
Foundation Model. ๋ค๋ฅธ LM๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก Baize๋ hllucination๊ณผ ์ ๋ ์ฑ, ๊ณ ์ ๊ด๋ ์ ๊ฒช๋๋ค. ํนํ LLaMA๋ 82% ์ด์์ด 2020๋ ์ด์ ์ ๋ฐ์ดํฐ์ด๊ธฐ ๋๋ฌธ์ Baize๋ ํน์ ์ง๋ฌธ์ ๋ํด ์๊ฐ์ด ์ง๋ ๋๋ต์ ๋ด๋์ ์๋ ์๋ค. ๊ฒ๋ค๊ฐ LLaMA๋ 20๊ฐ ๋จ์ง์ ์ธ์ด๋ฅผ ์ง์ํ๊ธฐ ๋๋ฌธ์, ๋น์์ด๊ถ ์ธ์ด์ ๋ํด์๋ ์ ํ๋ ์์ corpus๋ฅผ ์ง๋๋ค.
Evaluation. ๋ ผ๋ฌธ์์๋ GPT-4๋ฅผ ์ฌ์ฉํ์ฌ ์๋์ ์ผ๋ก ๋ชจ๋ธ์ ํ๊ฐํ์๋ค. ํ์ง๋ง ๋ ผ๋ฌธ์์๋ ๊ธด ์๋ต๊ณผ ์์น ํธํฅ์ ๋ํด ๋ ๊ฐํ ์ ํธ๋๋ฅผ ๊ฐ์ง๋ ๊ฒ์ ์ฐพ์ ์ ์์๋ค. ๋ฐ๋ผ์ ๋ ผ๋ฌธ์์๋ human evaluation์ด ๋น๋ก ๋น์ฉ๊ณผ ์๊ฐ์ด ๋ ๋ง์ด ๋ค์ง๋ง ๋์ฑ ์๊ฒฉํ๊ณ ์ ๋ขฐํ ์ ์๋ ํ๊ฐ๋ฅผ ํ ์ ์๋ค๊ณ ๋ฏฟ๋๋ค.
Safety and Access Control. ChatGPT์ ๋ฌ๋ฆฌ Baize๋ unwanted ํ๋์ ์ต์ ํ๊ธฐ ์ํด human feedback์ ์์กดํ์ง ์๋๋ค. ๊ทธ ๋์ ์ Baize๋ ChatGPT๋ฅผ ํ๋ด ๋์ผ๋ก์จ unwanted ํ๋์ ํผํ๊ธฐ ์ํด ํ์ตํ๋ค. ๊ทธ๋ฆฌ๊ณ ์ด๋ฌํ ํ๋์ ๊ฐ์ด๋ํ๊ธฐ ์ํด ๋ช ์์ prompt๋ฅผ ์ถ๊ฐํ๋ค. ํ์ง๋ง, ์ฌ๊ธฐ์ ์ ์์ ์ธ ๋ฅ๋ ฅ์ ๋ํ Baize์ ์ฌ์ฉ๊ณผ ๊ด๋ จ๋ ์ ์ฌ์ ์ธ ๋ฆฌ์คํฌ๋ฅผ ์ธ์ ํด์ผ ํ๋ค. ํนํ ๊ฐ์ค์น๋ฅผ ๊ณต๊ฐํจ์ ๋ฐ๋ผ ๋์ฑ ๋ง์ด๋ค. ๋ ผ๋ฌธ์์๋ Baize๋ฅผ ๊ธฐ๋ณธ template์ ์ฌ์ฉํด์ ํ๊ฐํ์์ง๋ง, prompt์ ๋ณ๊ฒฝ์ ์ ์ฌ์ ์ผ๋ก ๊ฐ๋๋ ์ผ์ ์์จ ์๋ ์๋ค. ๊ทธ๋๋ ๋คํ์ธ ๊ฒ์ ๋ ผ๋ฌธ์ ์ถ๊ฐ์ ์ธ ํ๋์ด ์ด๋ฌํ ๋ฆฌ์คํฌ๋ฅผ ์ค์๋ค๋ ์ ์ด๋ค. ๋ ผ๋ฌธ์์๋ ์ด๋ฌํ ๋ฆฌ์คํฌ์ ์ค์์ฑ์ ๋ํด ์ธ์งํ๊ณ ์๋ ๊ฒ์ ์ค์์ฑ๊ณผ ์ฐ๊ตฌ ๋ชฉ์ ์ธ์ Baize์ ์ฌ์ฉ์ ๊ธํ๋ ๊ฒ์ ๊ฐ์กฐํ์๋ค.
์ถ์ฒ
https://arxiv.org/abs/2304.01196