Paper Reading ๐/Alignment Problem of LLM
The overview of this paper LLM์ human value๋ก align ํ๋ ๊ฒ์ LLM์ ์ ๊ตํ ์กฐ์ข
์ ๊ฐ๋ฅํ๊ฒ ํด ์ฃผ๊ธฐ ๋๋ฌธ์ ์ค์ํด์ก๋ค. ํ์ง๋ง alignment๋ ์๋นํ ์์ human demonstration๊ณผ ํผ๋๋ฐฑ์ ํ์๋ก ํ๋ค. ์ต๊ทผ์ open-source model์ ์ด๋ฏธ align ๋ InstructGPT์ ChatGPT ๊ฐ์ LLM์ผ๋ก๋ถํฐ ๋ฐ์ดํฐ๋ฅผ distill ํจ์ผ๋ก์จ alignment learning ํ๋ก์ธ์ค๋ฅผ ๋ณต์ ํ์๋ค. ์ด ํ๋ก์ธ์ค๋ ์ฌ๋์ ๋
ธ๋ ฅ์ ์ค์ฌ์ฃผ์ง๋ง, teacher model์ ์๋นํ ์์กด์ ์ด๋ค. ์ด ๋
ผ๋ฌธ์์๋ ์ฌ๋์ ๋
ธ๋์ด ๊ฑฐ์ ํ์ํ์ง ์๊ณ pre-aligned LLM์ ์์กดํ์ง ์๋ ์๋ก์ด ํ๋ ์์ํฌ๋ฅผ ์๊ฐํ์๋ค. ์ด ํ๋ ์์ํฌ์ ํ๋ก์ธ์ค๋ ๋ค..
Paper Reading ๐/Alignment Problem of LLM
The overview of this paper instruction learning์ instruction tuning๊ณผ RLHF๋ฅผ ํฌํจํ๋ fune-tuning ๋ฌธ์ ๋ก ์ ๊ทผ๋์๋ค. ์ฌ๊ธฐ์ LLM์ ๋ค์ํ task์์ instruction๊ณผ ํจ๊ป ๋ค์ํ task์์ fine-tune ๋์๋ค. in-context learning์ instruction learning์ ์ ์ฉํ ๊ฒ์ด In-Context Instruction Learning(ICIL)์ด๋ค. ICIL์ pre-trained & instruction-finetned ๋ชจ๋ธ์ zero-shot task ์ผ๋ฐํ ์ฑ๋ฅ์ ์๋นํ ๊ฐ์ ์์ผฐ๋ค. ICIL์ ํ ๊ฐ์ง ํต์ฌ ์ฅ์ ์ ๋ชจ๋ task๋ฅผ ํ๊ฐํ๊ธฐ ์ํด ์ฌ๋ฌ ๊ฐ์ cross-task๋ฅผ ์ฐ๊ฒฐํ ํ๋์ ๊ณ ์ ..
Paper Reading ๐/Alignment Problem of LLM
The overview of this paper LLM์ ๋ ๊ฐ์ง์ ๋จ๊ณ๋ก ํ์ต๋๋ค. general-purpose representation์ ํ์ตํ๊ธฐ ์ํด, raw text๋ก๋ถํฐ unsupervised pre-training์ ์ฌ์ฉ end task์ ์ฌ์ฉ์ ์ ํธ๋ฅผ align ํ๊ธฐ ์ํด ๋๊ท๋ชจ instruction tuning & RL์ ์ฌ์ฉ ์ด ๋ ๊ฐ์ง stage์ ์ค์์ฑ์ ์ธก์ ํ๊ธฐ ์ํด ์ด๋ ํ RL ๋๋ human preference modeling ์์ด ์ค์ง 1000๊ฐ์ ์ ์คํ๊ฒ ์ ์ ๋ prompt & response์์ ๊ธฐ์กด supervised loss๋ฅผ ์ฌ์ฉํด์ fine-tune ๋ LLaMA-65B์ธ LIMA๋ฅผ ํ์ต์์ผฐ๋ค. LIMA๋ ๋ณต์กํ ์ฟผ๋ฆฌ๋ฅผ ํฌํจํ๋ training ๋ฐ์ดํฐ์ ๋ช ๊ฐ์ง ์..
Paper Reading ๐/Alignment Problem of LLM
The overview of this paper LM์ ์ข
์ข
์์์น ๋ชปํ ๋ฐฉ๋ฒ์ผ๋ก ์ฌ์ฉ์์๊ฒ ํด๋ฅผ ๊ฐํ ์๋ ์๋ค. ์ด์ ์ ์ฐ๊ตฌ๋ค์์๋ human annotator๋ก๋ถํฐ harmful์ ํน์ฑ์ ์ ์ํ๊ฒ ํ๋ ๋ฐฉ์์ ์ฌ์ฉํ์๋ค. ํ์ง๋ง, human annotator๋ ๋น์ฉ์ด ๋น์ธ๊ณ , test case์ ๋ค์์ฑ๊ณผ ์์ ์ ์ฝ์ด ๊ฑธ๋ฆฐ๋ค๋ ๋จ์ ์ด ์๋ค. ์ด ๋
ผ๋ฌธ์์๋ ๋ค๋ฅธ LM์ ์ฌ์ฉํด์ "red teaming" test case๋ฅผ ์ ์ํจ์ผ๋ก์จ ํ๊น LM์ด harmful way๋ก ํ๋ํ๋ ์ผ์ด์ค๋ฅผ ์๋์ ์ผ๋ก ์ฐพ๋ ๋ฐฉ๋ฒ์ ์ ์ํ์๋ค. ๊ทธ๋ฆฌ๊ณ ๊ณต๊ฒฉ์ ์ธ ์ฝํ
์ธ ๋ฅผ ๊ฐ์งํ๋๋ก ํ์ต๋ classifier๋ฅผ ์ฌ์ฉํ์ฌ ์์ฑ๋ ํ
์คํธ ์ง๋ฌธ์ ๋ํ ๋์ LM์ ์๋ต์ ํ๊ฐํ๊ณ 280B LM ์ฑ๋ด์์ ์๋ง ๊ฐ์ ๊ณต๊ฒฉ์ ์ธ ์๋ต์ ๋ฐ๊ฒฌ..
Paper Reading ๐/Alignment Problem of LLM
์ด๋ฒ ๋
ผ๋ฌธ ๋ฆฌ๋ทฐ๋ ๊ธฐ์กด ๋ฐฉ์๊ณผ ๋ค๋ฅด๊ฒ powerpoint๋ก ์์ฑํ์๋ค. ๋
ผ๋ฌธ์ ๊ฐ๋จํ ๊ฐ์๋ ๋ค์๊ณผ ๊ฐ๊ณ , ๋
ผ๋ฌธ์ ๋ํ ์์ธํ ๋ด์ฉ์ ์ฒจ๋ถ๋ powerpoint ํ์ผ์ ํ์ธํ๊ธธ ๋ฐ๋๋ค. powerpoint์ ๋ฉ๋ชจ์ ์ฌ๋ผ์ด๋ ๋
ธํธ์ ์ค๋ช
์ ์ ์ด๋์ผ๋ ์ฐธ๊ณ ํ๊ธธ ๋ฐ๋๋ค. ์ด ํฌ์คํ
์ ๋ค์์ ์ ํ๋ธ๋ฅผ ์ฐธ๊ณ ํ์ฌ ์์ฑ๋์๋ค. The overview of this paper ๋
ผ๋ฌธ์์๋ LM์ด ์ ์ฉ(helpful)ํ๊ณ ์ ํดํ์ง ์๊ฒ(harmless)ํ๊ฒ ์๋ํ๋๋ก preference modeling(PM)๊ณผ ์ฌ๋์ ํผ๋๋ฐฑ์ผ๋ก๋ถํฐ ๊ฐํํ์ต(RLHF)๋ฅผ ์ ์ฉํ์ฌ fine-tune ๋์๋ค. ๋
ผ๋ฌธ์์๋ ์ด๋ฌํ alignment training์ด ๋๋ถ๋ถ์ NLP ํ๊ฐ์์ ์ฑ๋ฅ์ ํฅ์์ํค๊ณ , python ์ฝ๋ฉ ๋๋ ์์ฝ๊ณผ ๊ฐ์ ..
Paper Reading ๐/Alignment Problem of LLM
The overview of this paper ์ต๊ทผ์ multi-task prompted fine-tunig(MT)๋ผ๊ณ ์๋ ค์ ธ ์๋ ๋ค์ํ task์์ instruction-tuneํ๋ LM์ unseen task์ ๋ํด ์ผ๋ฐํํ๋ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค. ์ด์ ์ ์ฐ๊ตฌ์์๋ ๊ฐ๋ ฅํ MT LM์ ๋ง๋๋๋ฐ๋ ํ์ต task์ ์๋ฅผ ๋๋ฆฌ๋ ๊ฒ์ด ์ค์ํ ์์๋ผ๊ณ ๋ฐํ์๋ค. ํ์ง๋ง, ์ด ๋
ผ๋ฌธ์์๋ ์ค์ง ํ๋์ task์์ ํ์ต๋ expert LM์ด 300๊ฐ ์ด์์ ์๋ก ๋ค๋ฅธ task์์ ํ์ต๋ MT LM์ ๋ฅ๊ฐํ๋ค๋ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์คฌ๋ค. ์ด ๋ฐ๊ฒฌ์ ์ด์ ์ task์ ์๋ฅผ ๋๋ฆฌ๋ฉด ๊ฐ๋ ฅํด์ง๋ค๋ ๋ฏฟ์์ ์๋ฌธ์ ์ ๊ธฐํ์๋ค. ์ด ๋ฐ๊ฒฌ์ ํตํด ๋
ผ๋ฌธ์์๋ ๋จ์ผ MT LM ๋์ ํ์ต task ๋น ๋ณ๋์ expert LM์ ํ์ต..
Paper Reading ๐/Alignment Problem of LLM
The overview of this paper LM์ instruction์ผ๋ก ํํ๋์ด ์๋ ๋ฐ์ดํฐ์
๋ชจ์์์ fine-tuneํ๋ ๊ฒ์ ํฅ์๋ ์ฑ๋ฅ๊ณผ unseen task์ ๋ํ ์ผ๋ฐํ๋ฅผ ๋ณด์ฌ์ฃผ๊ณ ์๋ค. ์ด ๋
ผ๋ฌธ์์๋ instruction fine-tuning์ ํน๋ณํ ๊ด์ ์์ ๋ค์ฌ๋ค ๋ณด์๋ค. task์ ์ ๋๋ฆฌ๊ธฐ ๋ชจ๋ธ ์ฌ์ด์ฆ ๋๋ฆฌ๊ธฐ CoT ๋ฐ์ดํฐ์์ fine-tune ์์ ์ธก๋ฉด์ ์ฌ์ฉํ instruction fine-tuning์ ์ฑ๋ฅ์ ์๋นํ ํฅ์์ํค๋ ๋ชจ์ต์ ๋ณด์ฌ์ ๋ค. ์ ๋ฐ์ ์ผ๋ก instruction fine-tuning์ ์ฑ๋ฅ๊ณผ pre-trained LM์ ๊ฐ์ฉ์ฑ์ ํฅ์์ํค๊ธฐ ์ํ ์ผ๋ฐ์ ์ธ ๋ฐฉ๋ฒ์ด๋ค. Table of Contents 1. Introduction 2. Flan Finetuning..
Paper Reading ๐/Alignment Problem of LLM
The overview of this paper Meta-training์ task instruction๊ณผ ์
๋ ฅ ์ธ์คํด์ค๊ฐ ์ฃผ์ด์ง๋ฉด ํ๊น ๋ผ๋ฒจ์ ๊ฐ๋ฅ์ฑ์ ์ต๋ํํจ์ผ๋ก์จ ๋ค์ํ downstream task์์ LM์ fine-tune ํ๋ค. ์ด training์ ๋ชจ๋ธ์ zero-shot task ์ผ๋ฐํ๋ฅผ ํฅ์์ํจ๋ค. ํ์ง๋ง, meta-trained LM๋ meta-training ์ค์ ๋ณธ ์ ์๋ ์๋ก์ด ๋ผ๋ฒจ์ ํฌํจํ๋ task์ ๋ํด์ ์ผ๋ฐํํ๋๋ฐ ์ด๋ ค์์ ๊ฒช๊ณ ์๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด์ ์ด ๋
ผ๋ฌธ์์๋ Flipped Learning์ ์ ์ํ์๋ค. ์ด ๋ฐฉ๋ฒ์ ๊ธฐ์กด์ meta-training๊ณผ ๋ฐ๋๋ก, ์
๋ ฅ ์ธ์คํด์ค์ ๋ผ๋ฒจ์ด ์ฃผ์ด์ง๋ฉด task instruction์ ์์ฑํ๋๋ก LM์ ํ์ต์ํจ๋ค. Flipp..
Paper Reading ๐/Alignment Problem of LLM
The overview of this paper ์ด๋ป๊ฒ NLP ๋ชจ๋ธ๋ค์ task instruction์ด ์ฃผ์ด์ง ๋ ๋ค์ํ unseen task์ ๋ํด์ ๊ทธ๋ ๊ฒ ์ ์ผ๋ฐํํ ์ ์์๊น? ์ด ์ง๋ฌธ์ ํด๊ฒฐํ๊ธฐ ์ํด ๋
ผ๋ฌธ์์๋ 1,616๊ฐ์ ๋ค์ํ NLP task์ ๋ฒค์น๋งํฌ์ ์ด๋ค์ ์ ๋ฌธ๊ฐ๊ฐ ์์ฑํ instruction์ ํฌํจํ๊ณ ์๋ Super-Natural Instructions๋ฅผ ์๊ฐํ์๋ค. ์ด ํฌ๊ณ ๋ค์ํ task์ ๋ชจ์์ instruction ํ์์ cross-task ์ผ๋ฐํ์ ์ฒ ์ ํ ๋ฒค์น๋งํฌ๋ฅผ ๋ณด์ฌ์ฃผ๊ณ ์๋ค - ๋ชจ๋ธ์ด task์ ์๋ธ์
์์ instruction์ ๋ฐ๋ฅด๋๋ก ํ์ต์ํค๊ณ ๋จ์ ์๋ unseen task์ ๋ํด์ ํ๊ฐํ๋๋ก ํ์๋ค. ๊ฒ๋ค๊ฐ ๋
ผ๋ฌธ์์๋ ๋ค์ํ ๋ฌธ๋งฅ instruction์ ๋ฐ๋ฅด๋..
Paper Reading ๐/Alignment Problem of LLM
The overview of this paper ์ด ๋
ผ๋ฌธ์์๋ LM์ zero-shot ํ์ต ๋ฅ๋ ฅ์ ํฅ์์ํค๊ธฐ ์ํ ๊ฐ๋จํ method๋ฅผ ์ ์ํ์๋ค. ์ด ๊ฐ๋จํ method๋ instruction tuning์ผ๋ก instruction์ ํตํด ๋ฌ์ฌ๋ ๋ฐ์ดํฐ์
์ ๋ชจ์์์ LM์ fine-tune ํ๋๋ฐ, unseen task์ ๋ํด zero-shot ์ฑ๋ฅ์ ์๋นํ ํฅ์์ํจ๋ค. ๋
ผ๋ฌธ์์๋ 137B PLM์ ์ฌ์ฉํด์ 60๊ฐ์ NLP ๋ฐ์ดํฐ์
์์ ์์ฐ์ด instruction template์ ํตํด instruction tune์ ํ์๋ค. ์ด instruction-tuned model์ FLAN์ด๋ผ ๋ถ๋ฅด๊ณ unseen task ์ ํ์์ ํ๊ฐํ์๋ค. FLAN์ ์์ ๋์ง ์์ counterpart์ ์ฑ๋ฅ์ ํฌ๊ฒ ์ํํ..
'Paper Reading ๐/Alignment Problem of LLM' ์นดํ
๊ณ ๋ฆฌ์ ๊ธ ๋ชฉ๋ก
๋จ์ถํค
๋ด ๋ธ๋ก๊ทธ
๋ด ๋ธ๋ก๊ทธ - ๊ด๋ฆฌ์ ํ ์ ํ |
Q
Q
|
์ ๊ธ ์ฐ๊ธฐ |
W
W
|
๋ธ๋ก๊ทธ ๊ฒ์๊ธ
๊ธ ์์ (๊ถํ ์๋ ๊ฒฝ์ฐ) |
E
E
|
๋๊ธ ์์ญ์ผ๋ก ์ด๋ |
C
C
|
๋ชจ๋ ์์ญ
์ด ํ์ด์ง์ URL ๋ณต์ฌ |
S
S
|
๋งจ ์๋ก ์ด๋ |
T
T
|
ํฐ์คํ ๋ฆฌ ํ ์ด๋ |
H
H
|
๋จ์ถํค ์๋ด |
Shift + /
โง + /
|
* ๋จ์ถํค๋ ํ๊ธ/์๋ฌธ ๋์๋ฌธ์๋ก ์ด์ฉ ๊ฐ๋ฅํ๋ฉฐ, ํฐ์คํ ๋ฆฌ ๊ธฐ๋ณธ ๋๋ฉ์ธ์์๋ง ๋์ํฉ๋๋ค.