Paper Reading ๐/Natural Language Processing
The preview of Llama3..? ์ต๊ทผ์ HuggingFace๋ฅผ ๋ณด๋ค๊ฐ ์๊ฒ ๋ ๋ชจ๋ธ์ด ํ๋ ์๋ค. ๋ฐ๋ก LLM ์์ฅ์ ๋จ๊ฒ๊ฒ ๋ฌ๊ตฐ ๋ชจ๋ธ์ธ Mistral LM์ด๋ค! ํ์ฑ์ฒ๋ผ Open-source LLM ๊ณ์ ๋ํ๋ Mistral 7B๋ ๊ทธ ๋ฑ์ฅ๋ง์ผ๋ก๋ Open-source LLM๊ณ๋ฅผ ๋จ๊ฒ๊ฒ ๋ฌ๊ตฌ์๋ค. ๊ทธ๋ ๋ค๋ฉด Mistral 7B๋ ๋ฌด์์ ์ด๋ป๊ฒ ํ๊ธธ๋ ๋ชจ๋์ ์ด๋ชฉ์ ์ง์ค์ํฌ ์ ์์๋ ๊ฒ์ผ๊น? ๊ทธ๊ฒ์ Mistral 7B๊ฐ ์ด๋ค๋ธ ์
์ ์ ์ดํด๋ณด๋ฉด ์ ์ ์๋ค: ๋ชจ๋ ๋ฒค์น๋งํฌ์์ Llama2 13B๋ฅผ ๋ฅ๊ฐ ๋ง์ ๋ฒค์น๋งํฌ์์ Llama1 34B๋ฅผ ๋ฅ๊ฐ(๋น๊ต ๋์์ด Llama2๊ฐ ์๋๋ผ Llama1์ด์๋ ์ด์ ๋ Llama2์ 34B ๋ชจ๋ธ์ด ๊ณต๊ฐ๋์์ง ์๊ธฐ ๋๋ฌธ) ์ฝ๋ ๊ด๋ จ ๋ฒค์น๋งํฌ์์ CodeLlam..
Paper Reading ๐/Natural Language Processing
Introduction SelFee SelFee๋ KAIST์ LK Lab์์ ๋ง๋ ์๋ก์ด instruction-following LM์ผ๋ก ์๋ต์์ self-feedback์ ์์ฑํ๊ณ ํผ๋๋ฐฑ์ ๊ธฐ๋ฐํด์ self-revise ํ๋ ๋ชจ๋ธ์ด๋ค. ChatGPT์ ์ํด ์์ฑ๋ self-feedback๊ณผ revision data๋ฅผ ํฌํจํ๋ 178K ๊ฐ์ training instance๋ฅผ ์ฌ์ฉํด์ LLaMA model(7B & 13B)์ fine-tune ํ์๋ค. SelFee์ ์๋ ์์ Vicuna Evaluation์์ ๋ SelFee(7B & 13B) ๋ชจ๋ธ์ LLaMA, Alpaca, Vicuna, Guanaco๋ฅผ ๋ฅ๊ฐํ๊ณ ChatGPT์ ๋น์ทํ ์ฑ๋ฅ์ ๋ณด์ฌ์คฌ๋ค. SelFee๋ ํนํ high-quality te..
Paper Reading ๐/Natural Language Processing
The overview of this paper ์ด ๋
ผ๋ฌธ์์๋ Self-Refine์ ์๊ฐํ์๋ค. Self-Refine์ ๋ฐ๋ณต์ ์ธ ํผ๋๋ฐฑ๊ณผ ๊ฐ์ ์ ํตํด LLM์ ์ด๊ธฐ output์ ๊ฐ์ ์ํค๊ธฐ ์ํ ๋ฐฉ๋ฒ์ด๋ค. Self-Refine์ ์ฃผ๋ ์์ด๋์ด๋ LLM์ ์ฌ์ฉํด ์ด๊ธฐ output์ ์์ฑํ๊ณ , ๊ทธ๋ค์์ ๋๊ฐ์ LLM์ด output์ ๋ํด ํผ๋๋ฐฑ์ ์ ๊ณตํ๊ณ ์ด ํผ๋๋ฐฑ์ ์ฌ์ฉํด ๋ฐ๋ณต์ ์ผ๋ก ์๊ธฐ ์์ ์ ๊ฐ์ ํด ๋๊ฐ๋ ๊ฒ์ด๋ค. ํ ๋ง๋๋ก Self-Refine์ ํ๋์ LLM์ generator, refiner, feedback provider๋ก ์ฌ์ฉํ๋ ๊ฒ์ด๋ค. Self-Refine์ ๋ชจ๋ ํ๊ฐ๋ task์์ Self-Refine์ผ๋ก ์์ฑ๋ output์ ๊ธฐ์กด์ ๋๊ฐ์ LLM์ผ๋ก ์์ฑ๋ output๋ณด๋ค human..
Paper Reading ๐/Natural Language Processing
The overview of this paper ์ด ๋
ผ๋ฌธ์์๋ ๊ฐ์ค์น๋ฅผ ์
๋ฐ์ดํธํ์ง ์๊ณ ๋์ ์ ์ธ์ด์ ํผ๋๋ฐฑ์ ํตํด language agent๋ฅผ ๊ฐํํ๊ธฐ ์ํ ์๋ก์ด ํ๋ ์์ํฌ์ธ Reflexion์ ์๊ฐํ์๋ค. ๊ตฌ์ฒด์ ์ผ๋ก, Reflexion agent๋ task ํผ๋๋ฐฑ ์ ํธ์ ๋ํด ์ธ์ด๋ก ๋ํ๋ด๊ณ , ๊ทธ๋ค์์ ์ดํ์ ์๋์ ๋ ๋์ ์์ฌ ๊ฒฐ์ ์ ์ ๋ฐํ๊ธฐ ์ํด ๋ฉ๋ชจ๋ฆฌ ๋ฒํผ์ ์ด๋ค๋ง์ reflective text๋ฅผ ์ ์งํ๋ค. Reflexion์ ๋ค์ํ ํ์
๊ณผ ์์ค์ ํผ๋๋ฐฑ ์ ํธ๋ฅผ ํฌํจํ ์ ์์ ์ ๋๋ก ์ถฉ๋ถํ ์ ์ฐํ๊ณ , ๋ค์ํ task์ ๊ฑธ์ณ์ baseline agent์ ๋นํด์ ์๋นํ ๊ฐ์ ์ ์ป์๋ค. Table of Contents 1. Introduction 2. Reflexion: reinforceme..
Paper Reading ๐/Natural Language Processing
The overview of this paper LLM์ ์ต๊ทผ์ ์์ฒญ ๋ฐ์ ํ์ผ๋, ์ด๋ค์ API ํธ์ถ์ ํตํ ํจ๊ณผ์ ์ธ ํด ์ฌ์ฉ์ ๋ํ ์ ์ฌ์ฑ์ ๋ง์กฑ๋์ง ์์ ์ฑ ๋จ์์๋ค. ์ด ๋
ผ๋ฌธ์์๋ API ํธ์ถ ์์ฑ์์ GPT-4์ ์ฑ๋ฅ์ ๋ฅ๊ฐํ๋ fine-tuned LLaMA-based model์ธ Gorilla๐ฆ๋ฅผ ์๊ฐํ์๋ค. Gorilla๋ document retriever์ ํจ๊ป ์ฌ์ฉ๋ ๋, test-time ๋ฌธ์ ๋ณํ์ ์ ์ํ๊ธฐ ์ํ ๊ฐ๋ ฅํ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ๊ณ , ์ ์ฐํ ์ฌ์ฉ์ ์
๋ฐ์ดํธ ๋๋ ๋ฒ์ ๋ณํ๋ฅผ ๊ฐ๋ฅํ๊ฒ ํด ์ฃผ์๋ค. ์ด๊ฒ์ LLM์ direct ํ๊ฒ prompting ํ ๋ ์ผ๋ฐ์ ์ผ๋ก ๋ง๋ฅ๋จ๋ฆฌ๋ hallucination์ ๋ฌธ์ ์ ์ ์๋นํ ์ํํ์๋ค. ๋ํ ๋
ผ๋ฌธ์์๋ Gorilla์ ๋ฅ๋ ฅ์ ํ๊ฐํ๊ธฐ ์ํด ..
Paper Reading ๐/Natural Language Processing
The overview of this paper open-domain instruction๊ณผ ํจ๊ป LLM์ ํ์ต์ํค๋ ๊ฒ์ ์๋นํ ์ฑ๊ณต์ ๊ฐ์ ธ์๋ค. ์ด ๋
ผ๋ฌธ์์๋ ์ฌ๋ ๋์ ์ LLM์ ์ฌ์ฉํด์ ๋ค์ํ ๋ ๋ฒจ์ ๋ณต์ก๋๋ฅผ ๊ฐ์ง๋ ๋ง์ ์์ instruction data๋ฅผ ์์ฑํ๊ธฐ ์ํ ๋ฐฉ์์ ๋ณด์ฌ์ค๋ค. ์ด๊ธฐ instruction set์ ํจ๊ป ์์ํด์, ์ด instruction set๋ฅผ Evol-instruct๋ฅผ ์ฌ์ฉํด์ ๋์ฑ ๋ณต์กํ instruction์ผ๋ก step-by-step ์์ฑํ์๋ค. ๊ทธ๋ค์์, ๋ชจ๋ ์์ฑ๋ instruction ๋ฐ์ดํฐ๋ฅผ LLaMA๋ฅผ fine-tune ํ๊ธฐ ์ํด ์์๋ค. ์ด๋ ๊ฒ ํด์ ๋์จ ๋ชจ๋ธ์ด ๋ฐ๋ก WizardLM์ด๋ค. Human Evaluation & Vicuna Evaluatio..
Paper Reading ๐/Natural Language Processing
The overview of this paper ๋
ผ๋ฌธ์์๋ ๋ค๋ฅธ ๋ชจ๋ธ๋ณด๋ค ํจ์ฌ ์๊ณ code๋ฅผ ์ํ LLM์ธ phi-1์ ์๊ฐํ์๋ค. phi-1์ 1.3B Transformer model์ด๊ณ , ์น์ผ๋ก๋ถํฐ textbook ํ๋ฆฌํฐ ๋ฐ์ดํฐ์ ์ ํ์ ๋ชจ์๊ณผ ์ข
ํฉ์ ์ผ๋ก ์์ฑ๋ textbook์ ์ฌ์ฉํ๊ณ , GPT-3.5๋ก ํ๋ จ๋์๋ค. phi-1์ ์์ ๊ท๋ชจ์๋ ๋ถ๊ตฌํ๊ณ ๋์ pass@1 accuracy๋ฅผ ๋ฌ์ฑํ์๋ค. Table of Contents 1. Introduction 2. Training details and the importance of high-quality data 3. Spikes of model capability after finetuning on CodeExercises 4. Evaluati..
Paper Reading ๐/Natural Language Processing
The overview of this paper ์ต๊ทผ์ ์ฐ๊ตฌ๋ LLM์ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ ํฅ์์ ์ ์ฌ์ฑ์ ๋ณด์ฌ์คฌ๋ค. ํ์ง๋ง, ์ด์ ์ฐ๊ตฌ๋ค์ ๊ธฐ์กด ํด์ ๊ฐ์ฉ์ฑ์ ์๋นํ ์์กดํ๋ค. ์ด ๋
ผ๋ฌธ์์๋ ์ด๋ฌํ ์์กด์ฑ์ ์ ๊ฑฐํ๊ธฐ ์ํด closed-loop ํ๋ ์์ํฌ์ธ LLM As Tool Makers(LATM)์ ์ ์ํ์๋ค. LATM์์ LLM์ ๋ฌธ์ ํด๊ฒฐ์ ์ํ ์์ ๋ง์ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ํด์ ์์ฑํ๋ค. LATM์ 2๊ฐ์ ๋ฉ์ธ ํ์ด์ฆ๋ก ๊ตฌ์ฑ๋์ด ์๋ค: tool making & tool using. tool making์ LLM์ด ์๋ก ๋ค๋ฅธ ์์ฒญ์ ์ ์ฉ๋ ์ ์๋ tool์ ๊ณ์์ ์ผ๋ก ์์ฑํ ์ ์๊ฒ ํด ์ค์ ํฅํ ์์ฒญ์ task๋ฅผ ํด๊ฒฐํ ๋ ์ฐ์ตํ๋ค๊ณ ์๊ฐ๋ ๋ ํด๋น APT๋ฅผ ๋ถ๋ฌ์ฌ ์ ์๊ฒ ํด ์ค๋ค. ์ด๋ ๊ฒ ํด์ ์ด ..
Paper Reading ๐/Natural Language Processing
The overview of this paper ์ต๊ทผ์ ์ฐ๊ตฌ๋ค์ smaller model์ ์ญ๋์ ํฅ์์ํค๊ธฐ ์ํด imitation learning์ ํตํด large foundation models(LFM)์ ์ํด ์์ฑ๋ output๊ณผ ํจ๊ป ํฅ์์ํค๊ณ ์ ํ์๋ค. ํ์ง๋ง ์ฌ๊ธฐ์๋ ์ฌ๋ฌ ๊ฐ์ง ๋ฌธ์ ์ ๋ค์ด ์กด์ฌํ๋ค. ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด Orca๋ฅผ ์๊ฐํ์๋ค. Orca๋ LFM์ ์ถ๋ก ํ๋ก์ธ์ค๋ฅผ ๋ชจ๋ฐฉํ๊ธฐ ์ํด ํ์ตํ๋ 13B ๋ชจ๋ธ์ด๋ค. Orca๋ explanation trace(step-by-step process)๋ฅผ ํฌํจํ๋ GPT-4 ๋ก๋ถํฐ ํ๋ถํ ์๊ทธ๋์ ํ์ตํ๊ณ , ChatGPT teacher assistant์ ์ํด ์ง๋๋๋ ๋ค๋ฅธ ๋ณต์กํ instruction์์ ํ์ต๋์๋ค. ์ด๋ฌํ progress..