The overview of this paper
์ต๊ทผ์ ์ฐ๊ตฌ๋ LLM์ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ ํฅ์์ ์ ์ฌ์ฑ์ ๋ณด์ฌ์คฌ๋ค. ํ์ง๋ง, ์ด์ ์ฐ๊ตฌ๋ค์ ๊ธฐ์กด ํด์ ๊ฐ์ฉ์ฑ์ ์๋นํ ์์กดํ๋ค. ์ด ๋ ผ๋ฌธ์์๋ ์ด๋ฌํ ์์กด์ฑ์ ์ ๊ฑฐํ๊ธฐ ์ํด closed-loop ํ๋ ์์ํฌ์ธ LLM As Tool Makers(LATM)์ ์ ์ํ์๋ค. LATM์์ LLM์ ๋ฌธ์ ํด๊ฒฐ์ ์ํ ์์ ๋ง์ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ ํด์ ์์ฑํ๋ค. LATM์ 2๊ฐ์ ๋ฉ์ธ ํ์ด์ฆ๋ก ๊ตฌ์ฑ๋์ด ์๋ค: tool making & tool using.
tool making์ LLM์ด ์๋ก ๋ค๋ฅธ ์์ฒญ์ ์ ์ฉ๋ ์ ์๋ tool์ ๊ณ์์ ์ผ๋ก ์์ฑํ ์ ์๊ฒ ํด ์ค์ ํฅํ ์์ฒญ์ task๋ฅผ ํด๊ฒฐํ ๋ ์ฐ์ตํ๋ค๊ณ ์๊ฐ๋ ๋ ํด๋น APT๋ฅผ ๋ถ๋ฌ์ฌ ์ ์๊ฒ ํด ์ค๋ค. ์ด๋ ๊ฒ ํด์ ์ด 2 ํ์ด์ฆ๋ ์์ฑ๋ ํด๊ณผ ๋ฌธ์ ์๋ฃจ์ ์ ํ๋ฆฌํฐ ์ ํ ์์ด ๋น์ฉ ํจ์จ์ฑ์ ๋ฌ์ฑํ ์ ์๋ ๊ธฐํ๋ฅผ ์ค๋ค. ๋ ผ๋ฌธ์์๋ GPT-4๋ฅผ tool maker๋ก, GPT-3.5๋ฅผ tool user๋ก ์ฌ์ฉํ์๋ค.
Table of Contents
1. Introduction
2. LLM as Tool Maker(LATM)
3. Experiments
1. Introduction
์ธ๊ฐ์ ์งํ ์ญ์ฌ๋ฅผ ์ดํด๋ณด๋ฉด ์ฌ๋๋ค์ ๋ฐ์ํ๋ ๋ฌธ์ ๋ค์ ํด๊ฒฐํ๊ธฐ ์ํด ์ด๋ค๋ง์ ํด์ ๋ง๋ค์ด์ ํด๊ฒฐํ๋ ๋ฐฉ์์ผ๋ก ์งํํ์๋ค. ์ธ๊ฐ์ ์ญ์ฌ์์ ๋ณธ tool-making์ ์ค์์ฑ์ ์๊ฐ์ ๋ฐ์์ ์ด๋ฌํ ์งํ์ ๊ฐ๋ ์ LLM์ ์์ญ์ ์ ์ฉํ๊ณ ์ ํ์๋ค. ์ด๋ฅผ ์ํด ๋ ผ๋ฌธ์์๋ closed-loop ํ๋ ์์ํฌ์ธ LATM์ ์ ์ํ์๋ค. ์ด method๋ LLM์ด ์๋ก์ด task์ ๋์ ํ๊ธฐ ์ํด ์ด๋ค๋ง์ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ tool์ ๋ง๋ค ์ ์๊ฒ ํด์ค๋ค. ์ด LATM์ ๋ค์์ 2๊ฐ์ ์ค์ ์คํ ์ด์ง๋ก ๊ตฌ์ฑ๋์ด ์๋ค:
- Tool Making: tool maker๋ก ์๋ ค์ง LLM์ผ๋ก ์ฃผ์ด์ง task์ ๋ํ tool์ ๋์์ธํจ → ๊ฐ๋ ฅํ ๋ชจ๋ธ์ ํ์๋ก ํจ
- Tool Using: tool user๋ก ์๋ ค์ง ๋ค๋ฅธ LLM์ ์๋ก์ด ์์ฒญ์ ์ฒ๋ฆฌํ๊ธฐ ์ํด tool์ ์ ์ฉํจ → lightweight ๋ชจ๋ธ์ ํ์๋ก ํจ
์ด๋ฌํ 2 ์คํ ์ด์ง๋ LATM์ด ๊ฐ ์คํ ์ด์ง์์ job์ ๊ฐ์ฅ ์ ํฉํ LLM์๊ฒ ํ ๋นํ๋๋ก ํ๋ฝํด์ค๋ค. ์ด๋ฌํ ๋ฐฉ์์ LLM์ ๋ฌธ์ ํด๊ฒฐ ๋ฅ๋ ฅ์ ํฅ์์ํฌ ๋ฟ๋ง ์๋๋ผ, ๋ฌธ์ ํด๊ฒฐ์ ํ์ํ ๊ณ์ฐ ๋น์ฉ๋ ์๋นํ ๊ฐ์์ํจ๋ค.
2. LLM as Tool Maker(LATM)
2-1. Making New Tools and Reuse Them
LATM ํจ๋ฌ๋ค์์์ ๋ฉ์ธ ํ๋ก์ธ์ค๋ 2๊ฐ์ ์คํ ์ด์ง๋ก ๋ถํ ๋ ์ ์๋ค: tool making & tool using. ๊ฐ ์คํ ์ด์ง๋ ์ฑ๋ฅ๊ณผ ๋น์ฉ ํจ์จ์ ๋ฐธ๋ฐ์ค๋ฅผ ๋ง์ถ๊ธฐ ์ํด LLM์ ์๋ก ๋ค๋ฅธ ์ ํ์ ํ์ฉํ๋ค.
Tool Making. ์ด ์คํ ์ด์ง์์๋ ๊ฐ๋ ฅํ์ง๋ง ๋น์ฉ์ด ๋น์ผ ๋ชจ๋ธ์ธ GPT-4 ๊ฐ์ ๋ชจ๋ธ์ tool maker๋ก ํ์ฉํ๋ค. ์ฌ๊ธฐ์ tool maker์ ์ญํ ์ task์ ์ ์ ์ค๋ช ์ผ๋ก๋ถํฐ ์ผ๋ฐ์ ์ด๊ณ ์ฌ์ฌ์ฉ ๊ฐ๋ฅํ tool์ ์์ฑํ๋ ๊ฒ์ด๋ค. ์ด ์คํ ์ด์ง๋ 3๊ฐ์ sub-stage๋ก ๋๋ ์ง ์ ์๋ค:
- Tool Proposing: ์ด ์คํ ์ด์ง์์ tool maker๋ ์ฃผ์ด์ง task์ ์ค๋ช ์ ํด๊ฒฐํ๊ธฐ ์ํด Python ํจ์ ์์ฑ์ ์๋ํ๋ค. ์ด ํ๋ก์ธ์ค๋ ์ฌ๋ฌ ์ค๋ช ์ด ์ ๊ณต๋๊ณ , ๋ชจ๋ธ์ ์ค๋ช ํ ํน์ฑ์ ์์ฑํ๋ ํ๋ก๊ทธ๋จ์ ์์ฑํ๋๋ก ์๊ตฌ๋๋ PbE ํจ๋ฌ๋ค์์ ๋ฐ๋ฅธ๋ค. ๋ ผ๋ฌธ์ ์คํ์์๋ ์ด ์คํ ์ด์ง์์ 3๊ฐ์ ์ค๋ช ์ด ์ฌ์ฉ๋์๋ค. ๋ง์ฝ ์ ์๋ ํด์ด ์คํ ๋ถ๊ฐ๋ฅํ๊ฑฐ๋ ์๋ฌ๋ฅผ ๋ง์ฃผ์น๋ฉด tool maker๋ ํ์คํ ๋ฆฌ์ ์๋ฌ ๋ฉ์์ง๋ฅผ ์ถ๊ฐํ๊ณ ๋ค๋ฅธ ์๋๋ ํ๋ค.
- Tool Verification: ์ด ์คํ
์ด์ง์์ validation ์ํ์ ์ฌ์ฉํด์ unit test๋ฅผ ์์ฑํ๊ณ , ์ ์๋ tool์์ ํ
์คํธ๋ฅผ ์คํํ๋ค. ๋
ผ๋ฌธ์์๋ 3๊ฐ์ validation ์ํ์ ํ์ฉํด์ ์คํ์ ์งํํ๊ณ , tool์ด ์คํจ๋ฅผ ํ๋ฉด, tool maker๋ ํ์คํ ๋ฆฌ์ ์๋ฌ๋ฅผ ๊ธฐ๋กํ๊ณ , unit test์์ ๋ฌธ์ ์ ์ ํด๊ฒฐํ๊ธฐ ์ํด ์๋ํ๋ค. ํ์ง๋ง LATM ํ์ดํ๋ผ์ธ์ verification stage๋ ์ด์ง ๋ค๋ฅด๊ฒ ์ฌ์ฉ๋ผ์ ๋ค์์ 2๊ฐ์ง ์ค์ ์ญํ ์ ๋ง์กฑํ๋ค.
- ์์ฐ์ด question์ ์ด๋ป๊ฒ ํจ์ ํธ์ถ๋ก ๋ณํํ๋์ง๋ฅผ ์ค๋ช ํ๋ ์์๋ฅผ ์ ๊ณตํด์ค
- tool์ ์ ๋ขฐ๋๋ฅผ ์ ์ฆํด์, ์ ์ฒด ํ๋ก์ธ์ค๊ฐ ์์ ํ ์๋ํ๋๋๋ก ํ๋ฝํด ์ค
- Tool Wrapping: tool maker๊ฐ tool user๋ฅผ ์ํ wrapping up๊ณผ task๋ฅผ ์ด๋ป๊ฒ ํจ์ ํธ์ถ๋ก ๋ณํํ๋์ง์ ๋ํ ์ค๋ช ์ ์ ๊ณตํด ์ค๋ค.
Tool Using. ๋ ผ๋ฌธ์์๋ tool user๋ก lightweight & ๋น์ฉ ํจ๊ณผ์ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ค. tool user์ ์ญํ ์ task์ ๋ค์ํ ์ธ์คํด์ค๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ธ์ฆ๋ ํด์ ์ฌ์ฉํ๋ ๊ฒ์ด๋ค. ์ด ์คํ ์ด์ง์ ๋ํ prompt๋ task๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ํจ์์ task ์ฟผ๋ฆฌ๋ฅผ ์ด๋ป๊ฒ ํจ์ ํธ์ถ๋ก ๋ณํํ๊ธฐ ์ํ ์ค๋ช ์ ํฌํจํ๋ wrapped tool์ด๋ค. ์ค๋ช ์ ์ฌ์ฉํ์ฌ tool user๋ ์๊ตฌ๋ ํจ์ ํธ์ถ์ in-context learning์ผ๋ก ์์ฑํ ์ ์๊ฒ ํด ์ค๋ค. task ํด๊ฒฐ์ ์ํด ํจ์ ํธ์ถ์ด ์คํ๋๋ค. ๊ทธ๋ฆฌ๊ณ task์ ํฌ๋งท์ ๋ง์ถ๊ธฐ ์ํด ํ์ฒ๋ฆฌ๊ฐ ์ ์ฉ๋๋ค.
๊ฐ task ์ ํ์ ๋ํด tool-making stage๋ ์ค์ง ํ ๋ฒ๋ง ์ํ๋์ด์ผ ํ๋ค. ๊ฒฐ๊ณผ๋ก ๋์จ tool์ task์ ๋ชจ๋ instance์ ๋ํด ์ฌ์ฌ์ฉ๋ ์ ์๋ค. ์ด๊ฒ์ LATM์ด ๊ฐ๋ ฅํ ๋ชจ๋ธ ํผ์๋ง ์ฌ์ฉํ๋ ๊ฒ๋ณด๋ค ์๋นํ ํจ์จ์ ์ด๊ณ ๋น์ฉ ํจ๊ณผ์ ์ด๊ฒ ๋ง๋ ๋ค.
๊ทธ๋ฆผ 3์ ์ด๋ป๊ฒ tool maker๊ฐ tool์ ์์ฑํจ์ผ๋ก์จ Big-Bench์ ๋ ผ๋ฆฌ์ ์ถ๋ก task๋ฅผ ํด๊ฒฐํ๋์ง์ ์์๋ฅผ ์ ๊ณตํด ์ฃผ๊ณ , tool maker๊ฐ ์ด๋ป๊ฒ tool์ ์ฌ์ฉํ๋์ง์ ์์๋ฅผ ์ ๊ณตํด์ค๋ค. task๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, tool maker๋ question์ผ๋ก๋ถํฐ ์ ์์ ์ถ์ถํจ์ผ๋ก์จ task๋ฅผ ํด๊ฒฐํ๋ ์ผ๋ฐ์ ํ๋ก๊ทธ๋จ์ ์์ฑํ ๋ค์, ๊ฒฐ๊ณผ์ ๋ํ ํ ํฐ ์์ด์ ๊ฒ์ํ๋ค. tool user๋ ์ด ํ๋ก๊ทธ๋จ์ task๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด ์ฌ์ฉํ ์ ์๊ณ , task์ ์์ฐ์ด instance๋ก๋ถํฐ ๊ด๋ จ ์ ๋ณด๋ฅผ ์ถ์ถํ๋ ํจ์ ํธ์ถ์ ์ฌ์ฉํ๋ค.
2-2. Handling Streaming Data with Dispatcher
real-world ์๋๋ฆฌ์ค์์ task instance๋ ์ ํ์ ์ผ๋ก ์ํ์ค๋ก ๋๋ํ๋ค. ์ด๋ฌํ ๋ฐ์ดํฐ์ ํ๋ฆ์ ์์ฉํ๊ธฐ ์ํด ๊ฐ incoming task์ ๋ํด tool user์ tool maker๋ฅผ ์ฐธ์ฌ์ํฌ์ง ๋ง์ง๋ฅผ ๊ฒฐ์ ํ๋ 3๋ฒ์งธ LLM์ธ dispatcher๋ฅผ ์ค๋ช ํ๋ค. ๋ ผ๋ฌธ์ dispatcher๋ ๊ธฐ์กด ํด๋ก ํด๊ฒฐ๋ ์ ์๋ ์๋ก์ด task๋ฅผ ์๋ณํ๊ธฐ ์ํ ๋ฅ๋ ฅ์ผ๋ก ๋๋ ทํด์ง๊ณ , ์ด๋ฌํ task์ ๋ํ ์๋ก์ด tool์ ์์ฑํ๊ธฐ ์ํด tool maker๋ฅผ ์ฐธ์ฌ์ํจ๋ค.
๊ตฌ์ฒด์ ์ผ๋ก dispatcher๋ tool maker์ ์ํด ์์ฑ๋ ๊ธฐ์กด tool์ ๊ธฐ๋ก์ ์ ์งํ๋ค. ์๋ก์ด task instance๊ฐ ๋ค์ด์ค๋ฉด dispatcher๋ task์ ๋ํ ์ ํฉํ tool์ด ์๋์ง๋ฅผ ์ด๊ธฐ์ ๊ฒฐ์ ํ๋ค. ๋ง์ฝ ์ ์ ํ tool์ด ์์ผ๋ฉด instance์ ํด๋น ํด์ tool user์๊ฒ ์ ๋ฌํ๋ค. ๊ทธ๋ ์ง ์๊ณ ๋ง์ฝ ์ ์ ํ ํด์ด ์์ผ๋ฉด tool maker์๊ฒ instance๋ฅผ ์ ๋ฌํด์ ์๋ก์ด tool์ ๋ง๋ค๊ฒ ํ๋ค. dispatcher์ workflow๊ฐ ๊ทธ๋ฆผ 4์ ๋ํ๋์๋ค. dispatching task์ ๊ฐ๋จํจ์ด ์ฃผ์ด์ง๋ฉด dispatcher๋ ์ ์ ํ prompt๋ฅผ ์ฌ์ฉํ๋ lightweight ๋ชจ๋ธ์ด ๋ ์๋ ์๋ค.
3. Experiments
3-1. Experimental Setup
Datasets. ๋ ผ๋ฌธ์์๋ LATM์ Big-Bench์ 5๊ฐ์ task(Logical Deduction, Tracking Shuffled Objects, Dyck Language, Word Sorting, Chinese Remainder Theorem)์์ ํ๊ฐํ์๋ค. ๊ทธ๋ฆฌ๊ณ LATM์ real-world ์๋๋ฆฌ์ค ์์์ ํจ๊ณผ๋ฅผ ์ค๋ช ํ๊ธฐ ์ํด Scheduling Meeting task๋ฅผ ๋ง๋ค์ด์ ํ๊ฐํ์๋ค.
3-2. Effectiveness of the Tool-Making Stage
tool-making ์คํ ์ด์ง์์๋ ๊ตฌ์ฒด์ task ํด๊ฒฐ์ ์ํ ์ผ๋ฐ์ ์ธ Python ํจ์๋ฅผ ์์ฑํ๊ธฐ ์ํด ๊ฐ๋ ฅํ์ง๋ง ๋๋ฆฐ ๋ชจ๋ธ์ ์ฌ์ฉํ์๋ค. ์ด ์คํ ์ ์ค์ง ํ ๋ฒ๋ง ์ํ๋๋ค. ๋ ผ๋ฌธ์ ์คํ์์ GPT-4๋ฅผ tool maker๋ก ์ฌ์ฉํ์๋ค. ๊ทธ๋ฆฌ๊ณ LM์๊ฒ ์ฌ๋ฌ few-shot ์์๋ฅผ ์ ๊ณตํด์ฃผ๊ณ ๊ทธ๋ฆผ 3์ฒ๋ผ ์ผ๋ฐ์ ์ธ Python ํ๋ก๊ทธ๋จ์ ์์ฑํ ์ ์๋๋ก ์ ์ํ์๋ค.
๋ ผ๋ฌธ์์๋ GPT-4๊ฐ tool maker๋ก ์ฌ์ฉ๋ ๋, ๋ชจ๋ธ์ task๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํ ์ ์ ํ ์๊ณ ๋ฆฌ์ฆ์ ์์ฃผ ๊ณ ์ํ๋ค๋ ๊ฒ์ ๋ฐ๊ฒฌํ์๋ค. ๋ ผ๋ฌธ์ ์คํ์์ tool-verification ์คํ ์ด์ง๋ ์ฃผ๋ก ์์ฐ์ด question์ ์ด๋ป๊ฒ ํจ์ ํธ์ถ๋ก ๋ณํํ ์ ์๋์ง๋ฅผ ์ค๋ช ํ๋ ์์๋ฅผ ์ ๊ณตํ๋ ๋ฐ ์ฌ์ฉ๋์๋ค. ๊ทธ๋ฆฌ๊ณ ๋ ผ๋ฌธ์์๋ tool maker๊ฐ ์ค๋ฅ ๋ฉ์์ง ์๋ด๋ก ์ค์๋ฅผ ์์ ํ ์ ์๋ 60๊ฐ์ง ์๋ ์ค 2๊ฐ์ง ๊ฒฝ์ฐ๋ง ๊ด์ฐฐํ์๋ค.
3-3. LATM Improves the Performance of Lightweight LLMs
ํ 2์์๋ CoT์ ์ฑ๋ฅ์ LATM์ ๋น๊ตํ์๋ค. GPT-4๋ฅผ 6๊ฐ์ task์ ๋ํ tool์ ์์ฑํ๊ธฐ ์ํ tool maker๋ก ์ฌ์ฉํ๊ณ GPT-3.5 Turbo & GPT-4๋ฅผ tool user๋ก ์ฌ์ฉํด์ ์ฑ๋ฅ์ ํ๊ฐํ์๋ค. ๊ฒฐ๊ณผ๋ tool์ ๋์์ผ๋ก GPT-3.5 Turbo ๊ฐ์ lightweight ๋ชจ๋ธ์ CoT prompting์ ์ฑ๋ฅ์ ์๋นํ ๋ฅ๊ฐํ๊ณ , GPT-4์ ๋๋ฑํ ์ฑ๋ฅ์ ๋ฌ์ฑํ๋ค๋ ๊ฒ์ ๋ณด์ฌ์คฌ๋ค. ๋ฐ๋ฉด์ GPT-4์ ๋นํด ๋น์ฉ์ ์๋นํ ๊ฐ์ํ์๋ค. ํฅ๋ฏธ๋ก์ ๋ ์ ์ Dyck Language task์์๋ GPT-3.5 Turbo๊ฐ GPT-4๋ฅผ ๋ฅ๊ฐํ๋ ๋ชจ์ต์ ๋ณด์ฌ์คฌ๋ค๋ ์ ์ด๋ค! ์คํจ ์ฌ๋ก๋ฅผ ์กฐ์ฌํ ๊ฒฐ๊ณผ, question์ ํจ์ ํธ์ถ๋ก ๋ณํํ ๋ GPT-4๊ฐ ๋๋๋ก ๋ฌธ์ ์ ์ผ๋ถ๋ฅผ ๋ถํ์ํ๊ฒ ํด๊ฒฐํ์ฌ ์๋ชป๋ ํจ์ ์ถ๋ ฅ์ผ๋ก ์ด์ด์ง๋ ๊ฒ์ ๋ฐ๊ฒฌํ์๋ค.
3-4. Extending LATM to a Streaming Setting with a Mixture of Tasks
LATM์ streaming ์ธํ ์ผ๋ก ํ์ฅ ๊ฐ๋ฅํ๋ฐ, ์ด ๊ฒฝ์ฐ์๋ dispatcher๋ฅผ ๋ฐ๋ก ํ์๋ก ํ๋ค. ๋ ผ๋ฌธ์์๋ GPT-3.5 Turbo๋ฅผ dispatcher๋ก ์ฌ์ฉํ๊ณ ์ด๊ฒ์ ๋ฅ๋ ฅ์ ๋ค์๊ณผ ๊ฐ์ด ํ๊ฐํ์๋ค:
- ๊ธฐ์กด tool incoming instance๋ฅผ ํด๊ฒฐ ๊ฐ๋ฅํ์ง ํ๋ณ
- unseen task์ instance์ ๋ํด tool-making์ ํ์๋ก ํจ
Identifying existing tools. ๋ ผ๋ฌธ์์๋ ์ฃผ์ด์ง instance์ ๋ํด tool-making์ ํ์๋ก ํ๋ dispatcher์ ๋ฅ๋ ฅ์ ํ๊ฐํ์๋ค. test set์ ๊ฐ instance์ ๋ํด dispatcher๋ฅผ ์ฌ์ฉํด์ ๊ธฐ์กด tool๊ณผ ์ฐ๊ด๋ task ์์๋ฅผ ํฌํจํ๋ prompt์ ํจ๊ป ์ ์ ํ ๊ธฐ์กด ํด์ ์ธ์ํ์๋ค. ์๋ง์ ํด์ ๊ฒฐ์ ํ๋ ์ ํ๋๋ฅผ ํ๊ฐํ ๊ฒฐ๊ณผ $94% \pm 2%$์ ์ ํ๋๋ฅผ ๋ณด์ฌ์คฌ๋ค.
Requesting tool-making. ๊ทธ๋ค์์ unseen task์ instance๋ฅผ ์ํ tool-making์ ์์ฒญํ๊ธฐ ์ํ dispatcher์ ๋ฅ๋ ฅ์ ํ๊ฐํ์๋ค. test set์ ๊ฐ instance์ ๋ํด dispatcher์ ์ฌ์ฉํด์ tool-making์ ์์ฒญํด์ผ ํ ํ์๊ฐ ์๋์ง ๋๋ instance๊ฐ ๊ธฐ์กด ํด์ ์ํด ํด๊ฒฐ๋ ์ ์๋์ง ๊ฒฐ์ ํ๋ค. ์๋ง์ ์์ฒญ์ ๋ง๋ค์ด๋ด๋ ์ ํ๋๋ $95% \pm 4%$์๋ค.
๊ฒฐ๊ณผ๋ dispatcher๊ฐ unseen task์ ๋ํด ํจ๊ณผ์ ์ผ๋ก ๊ธฐ์กด ํด์ ํ๋ณํ๊ณ tool-making์ ์์ฒญํ๋ค๋ ๊ฒ์ ๋ณด์ฌ์คฌ๋ค. ์ด๊ฒ์ LATM์ด task์ ๋ฌถ์๊ณผ ํจ๊ป streaming ์ธํ ์ผ๋ก ๋ถ๋๋ฝ๊ฒ ์ฐ์ฅ๋ ์ ์๋ค๋ ๊ฒ์ ์ ์ํ๋ค.
์ถ์ฒ
https://arxiv.org/abs/2305.17126