์ค์ Sparks of AGI: with GPT-4 ๋ ผ๋ฌธ์ 155ํ์ด์ง์ ์ก๋ฐํ ์ ๋๋ก ์์ฒญ๋ ์์ ์คํ์ ์งํํด ๋ณด๋ฉฐ GPT-4๋ฅผ ๋ค๋ฐฉ๋ฉด์ผ๋ก ํ์ฉํด ๋ณด์ง๋ง, ๋ณธ ํฌ์คํ ์์๋ ๊ทธ ๋ง์ ๋ด์ฉ์ ๋ค๋ฃจ๊ธฐ์๋ ํ์ด ๋ฒ ์ฐจ์ ์ค์ ๋ถ๋ถ๋ค๋ง ๋ฐ๋ก ์ดํด๋ณด์๋ค. ์ด ํฌ์คํ ์ ๋ค์์ ์ ํ๋ธ๋ฅผ ์ฐธ๊ณ ํ์ฌ ์์ฑ๋์๋ค.
์ ํ๋ธ: https://www.youtube.com/watch?v=Mqg3aTGNxZ0
The overview of this paper
AI ์ฐ๊ตฌ์๋ค์ ๋ค์ํ ๋๋ฉ์ธ๊ณผ task์์ ๊ด๋ชฉํ ๋งํ ๋ฅ๋ ฅ์ ๋ณด์ฌ์ฃผ๋ LLM์ ๊ฐ๋ฐํ๊ณ ๊ฐ์ ์ํค๊ณ ์๋ค. OpenAI์์ ๊ฐ๋ฐํ GPT-4๋ ์ ๋ก ์๋ ๊ท๋ชจ์ ๊ณ์ฐ๋๊ณผ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด์ ํ์ต๋์๋ค. ์ด ๋ ผ๋ฌธ์์๋ GPT-4๊ฐ ์ด์ AI ๋ชจ๋ธ๋ณด๋ค ๋ ์ผ๋ฐ์ ์ธ ์ง๋ฅ์ ๋ํ๋ด๋ ์๋ก์ด LLM ์ง๋จ์ ์ผ๋ถ๋ผ๊ณ ์ฃผ์ฅํ๋ค. ๋ ผ๋ฌธ์์๋ ๋ชจ๋ธ์ ์ฆ๊ฐํ๋ ๋ฅ๋ ฅ๊ณผ ์ํฅ์ ๋ํด ๋ ผ์ํ์๋ค.
๋ ผ๋ฌธ์์๋ GPT-4๊ฐ mathematics, coding, vision, medicine, law, psychology์ธ์๋ ๋ ๋ง์ ๋๋ฉ์ธ์ ์๋กญ๊ณ ์ด๋ ค์ด task์์ ์ด๋ ํ ์คํ์ prompting ์์ด ํด๊ฒฐํ ์ ์๋ค๊ณ ์ค๋ช ํ์๋ค. ๊ฒ๋ค๊ฐ, ์ด ๋ชจ๋ task์์ GPT-4์ ์ฑ๋ฅ์ ๋๋ผ์ธ ์ ๋๋ก human performance์ ๊ฐ๊น์ ๊ณ , ์ข ์ข ChatGPT ๊ฐ์ ์ด์ ๋ชจ๋ธ๋ค์ ํฌ๊ฒ ๋ฅ๊ฐํ๊ธฐ๋ ํ๋ค. GPT-4์ ๋ฅ๋ ฅ์ ํญ๊ณผ ๊น์ด๊ฐ ์ฃผ์ด์ง๋ฉด, ์ด๊ฒ์ด aritifical general intelligence(AGI)์ ์ด๊ธฐ ๋ฒ์ ์ด๋ผ๊ณ ๋ณผ ์ ์๋ค๊ณ ํ๋ค.
GPT-4๋ฅผ ํ์ํ๋ฉด์ ๋ ผ๋ฌธ์์๋ ๊ทธ ํ๊ณ๋ฅผ ๋ฐ๊ฒฌํ๋ ๋ฐ ํน๋ณํ ์ค์ ์ ๋์๊ณ , ์ฐจ์ธ๋ ์์ธก์ ๋์ด์๋ ์๋ก์ด ํจ๋ฌ๋ค์์ ์ถ๊ตฌํด์ผ ํ ํ์์ฑ์ ํฌํจํ์ฌ AGI์ ๋ ๊น๊ณ ํฌ๊ด์ ์ธ ๋ฒ์ ์ผ๋ก ๋ฐ์ ํ๊ธฐ ์ํด ์์ผ๋ก์ ๊ณผ์ ์ ๋ํด ๋ ผ์ํ๋ค. ๋ง์ง๋ง์ผ๋ก ์ต๊ทผ์ ๊ธฐ์ ๋์ฝ์ ๋ฐ๋ฅธ ์ฌํ์ ์ํฅ๊ณผ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ ๋ํ ์ฑ์ฐฐ๋ก ๊ฒฐ๋ก ์ ๋งบ๋๋ค.
1. Introduction
๋ ผ๋ฌธ์์๋ GPT-4์ ์ฌ๋ฌ๊ฐ์ง ์ํธ์์ฉ์ ํ๋ฉด์ GPT-4์ ์ฅ๋จ์ ์ ๋ถ์ํ์๋ค. ๊ทธ๋ ๊ฒ ๋ฐํ๋ธ GPT-4์ ๋น๋ฐ 15๊ฐ์ง์ ๋ํด์ ์๊ฐํด๋ณด๊ณ ์ ํ๋ค.
2. Revelations
2-1. Tool Use
ChatGPT๋ ๋๊ตฌ๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ด ๋ถ๊ฐ๋ฅํ๋๋ฐ GPT-4๋ ์์์ instruction & X demonstration์ผ๋ก ๋๊ตฌ๋ฅผ ์ฌ์ฉํ ์ ์๋ค! ์ฌ๊ธฐ์ ๋งํ๋ ๋๊ตฌ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ ๊ฐ์ ์ญํ ๋ก ์๋ฅผ ๋ค์ด ์ธํฐ๋ท์์ ์ ๋ณด๋ฅผ ๊ฒ์ํ๋ 'SEARCH("query")' ๋๋ ๊ณ์ฐ์ ํ๋ 'CALC(expression)' ๋ฑ์ ์ฌ์ฉํ ์ ์๋ค๋ ์๋ฏธ์ด๋ค.
ChatGPT๋ ๋ถ๊ฐ๋ฅํ๋ ๋๊ตฌ ์ฌ์ฉ์ GPT-4๋ ํด๋ผ ์ ์์๋ค. ์ด๋ฌํ ๋ฐ์ ์ ๋ง์น ์ฌ๋์ด ์ฒ์์ผ๋ก ๋๊ตฌ๋ฅผ ์ฐ๋ฉด์ ์งํํ ๊ฒ๊ณผ ์ ์ฌํ๋ค๊ณ ์ค๋ช ํ๋ค. ๋ค์์ ๊ทธ๋ฆผ 1์ GPT-4๊ฐ ์ง๋ฌธ์ ๋๋ตํ๊ธฐ ์ํด ์ฌ๋ฌ ๋๊ตฌ๋ฅผ ์ฌ์ฉํ๋ ์์์ด๋ค.
2-2. Image Understanding
GPT-4๋ text prompt์ ๊ธฐ๋ฐํด์ stable diffusion์ ์ฌ์ฉํ์ฌ ๋ํ ์ผํ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ ์ ์๋ค. ์ด๋ฌํ ์์๋ LM์ด tool์ ์ด๋ป๊ฒ ์ฌ์ฉํด์ผ ํ๋์ง์ ๋ํด ์ ๋๋ก ์ดํดํ ๊ฒ์ด๋ผ๊ณ ๋ณผ ์ ์๋ค! ์ด๋ ํ ๋์์ ๋ํด ์ค๋ช ์ ํด์ฃผ๋ฉด GPT-4 w/ stable diffusion์ ์๋นํ ๊ด์ฐฎ์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋ค.
2-3. Code
GPT-4๋ ์ฝ๋ฉ ์ธก๋ฉด์์๋ ์ฌ๋๊ณผ ์ ์ฌํ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค. ์ฝ๋ฉ ๋ฌธ์ ์ ๋ํด์ GPT-4, text-davinci-003, ์ฌ๋์ ์ฑ๋ฅ์ ๋น๊ตํ ๊ฒฐ๊ณผ ๋ค์์ ํ 1๊ณผ ๊ฐ์ ๊ฒฐ๊ณผ๊ฐ ๋์๋ค. ๊ฒฐ๊ณผ๋ฅผ ์ดํด๋ณด๋ฉด GPT-4๋ ์ฌ๋๋ณด๋ค ๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค!
2-4. 3D Game Development
GPT-4๋ zero-shot ๋ฐฉ์์ ์ฌ์ฉํ์ฌ ๊ตฌ๋ ๊ฐ๋ฅํ 3D game์ ๊ฐ๋ฐํ ์ ์๋ค. ๊ทธ๋ฆผ 3์ GPT-4๊ฐ ๋ง๋ ๊ตฌ์ฒด๋ค์ด ์ฅ์ ๋ฌผ์ ํผํ๋ ๊ฒ์์ด๋ค.
2-5. Mathematics
GPT-4๋ ์ฌ๋ฐ๋ฅธ ์ฆ๊ฑฐ๋ฅผ ์ ์ํ๋ฉฐ ์ํ ๋ฌธ์ ๋ฅผ ํ ์ ์๋ค. ๋ค์์ ๊ทธ๋ฆผ 4๋ GPT-4๋ฅผ ์ฌ์ฉํ์ฌ IMO ์ํ ๋ฌธ์ ๋ฅผ ํผ ๊ฒ์ผ๋ก ๋ ผ๋ฆฌ ์ ์ฐํ๊ฒ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๊ฒ์ ํ์ธํ ์ ์๋ค.
2-6. Fermi Questions
Fermi Question์ ์ํ์ ๋ชจ๋ธ๋ง ๋ฌธ์ ์ ๊ตฌ์ฒด์ ์ ํ์ด๋ค. Fermi Question์๋ ๋ ผ๋ฆฌ, ๊ทผ์ฌ์น ๋ฐ ๋๊ท๋ชจ ์ถ๋ก ์ ์ฌ์ฉํ์ฌ ์ง์ ์ธก์ ํ๊ธฐ ์ด๋ ต๊ฑฐ๋ ๋ถ๊ฐ๋ฅํ ์ ๋๋ ํ์์ ๋ํ ๊ต์ก์ ์ธ ์ถ์ธก์ด ํฌํจ๋๋ค. ์๋ฅผ ๋ค์ด ์ ์๋ ค์ง Fermi Question์ ๋ค์๊ณผ ๊ฐ๋ค: '์์์ฅ์ ๊ณจํ๊ณต์ ๋ช ๊ฐ๋ ์ฑ์ธ ์ ์์๊น?'. GPT-4์ ์ต์ข ๋ต๋ณ์ ์์ง ์ ๋ต์์ ๋ฉ์์ง๋ง ์ด๋ฌํ ๋ฌธ์ ์ ๋ํด ์ธ์์ ์ธ ํด๊ฒฐ ์๋๋ฅผ ๋ณด์ฌ์คฌ๋ค.
2-7. Personal Assistant
GPT-4๋ ๊ธฐ์กด์ ๋ค๋ฅธ assistant๋ณด๋ค ๋ ๋ค์ฌ๋ค๋ฅํ๊ณ ์ ๋ฅํ ๋ชจ์ต์ ๋ณด์ฌ์คฌ๋ค. ์๋ฅผ ๋ค์ด์ ์บ๋ฆฐ๋๋ก๋ถํฐ ์ผ์ ์ ๊ฐ์ ธ์ค๊ฑฐ๋ ์ด๋ฉ์ผ์ ๋ณด๋ด๊ฑฐ๋ ์ฝ๋ ๋ฑ์ ์ ๋ฌด๋ ์ํ์ด ๊ฐ๋ฅํ๋ค. ๊ทธ ์์๊ฐ ๋ค์์ ๊ทธ๋ฆผ 6์ ๋ํ๋ ์๋ค.
2-8. AI Handyman
์ง์์ ๋ฌธ์ ๊ฐ ์๊ฒผ์ ๋ GPT-4์๊ฒ ํด๊ฒฐ ๋ฐฉ์์ ๋ฌผ์ด๋ณด๊ณ ๊ทธ๋๋ก ๊ทธ ์ง์๋ฅผ ๋ฐ๋ผ๋ณด๋ ๋ฌธ์ ๊ฐ ํด๊ฒฐ๋์๋ค. ์ด๊ฒ์ GPT-4๊ฐ ์ฃผ๋ถ๋ก์์ ์ญํ ๋ ์ํํ ์ ์๋ค๋ ๊ฒ์ ๋ณด์ฌ์ค๋ค. ๋ค์์ ๊ทธ๋ฆผ 7์ ์ง์์ ์๊ธด ๋ฌธ์ ์ ๋ํด GPT-4์๊ฒ ํด๊ฒฐ ๋ฐฉ์์ ๋ฌผ์ด๋ณธ ๊ฒฐ๊ณผ์ด๋ค.
2-9. Mapping
GPT-4๋ ์ง์์ ๊ตฌ์กฐ์ ๋ํด์ ์ค๋ช ํด ์ฃผ๋ฉด ์ด๋ฅผ ๊ทธ๋ฆผ์ผ๋ก ๊ทธ๋ ค๋ผ ์ ์๋ค. ๋ค์์ ๊ทธ๋ฆผ 8์ ์ผ์ชฝ์ด ์ค์ ์ง์ ๊ตฌ์กฐ์ด๊ณ , ์ค๋ฅธ์ชฝ์ด GPT-4๊ฐ ๊ทธ๋ ค๋ธ ์ง์์ ๊ตฌ์กฐ์ด๋ค. ์๋นํ ์ ์ฌํ ๋ชจ์ต์ธ ๊ฒ์ ์ ์ ์๋ค.
2-10. Theory of Mind
GPT-4๋ ์ฌ๋์ด ์๊ฐํ๋ mental model์ ๋ง๋ค ์ ์๋ค. ๋ํ์ ์ผ๋ก Theory of Mind์์ ๋งค์ฐ ์ ๋ช ํ ์์์ธ Sally-Anne ํ ์คํธ๊ฐ ์๋๋ฐ GPT-4๋ ์ด ํ ์คํธ๋ฅผ ์ฑ๊ณต์ ์ผ๋ก ํต๊ณผํ๋ ๋ชจ์ต์ ๋ณด์ฌ์คฌ๋ค. Sally-Anne test๋ ๋งค์ฐ ๋ํ์ ์ธ ์ฌ๋ฆฌ์ task๋ก ์์ธํ ์ค๋ช ์ ์ฌ๊ธฐ๋ฅผ ์ฐธ๊ณ ํ๊ธธ ๋ฐ๋๋ค.
2-11. Autoregressive Model
๋ ผ๋ฌธ์์๋ GPT-4๊ฐ ์ด๋ป๊ฒ AR ๋ชจ๋ธ์ธ์ง ๋ถ์ํ๋ค. ์ฌ๊ธฐ์ AR ๋ชจ๋ธ์ ์์ํ๊ธฐ ์ ์๋ output์ด ์ธ์ ๋๋ ์ง ๋ชจ๋ฅด๋ ๋ชจ๋ธ์ ์๋ฏธํ๋ค. ์ด๋ฅผ ํ์ธํ๊ธฐ ์ํด์ ๋ ผ๋ฌธ์์๋ ์ฌ๋ฌ ์คํ์ ์งํํ๋ค.
- ์์ ์ฒ์๊ณผ ๋์ด ๋๊ฐ์ ๋จ์ด๋ฅผ ๊ฐ์ง๊ณ ๋ฐ๋๋๋ ์์๋ก ๋ง๋ค ์ ์์๊น? → GPT-4๋ AR ๋ชจ๋ธ์ด๋ผ์ ์ด๋ฅผ ํ ์ ์์๋ค.
- GPT-4๋ incremental task์์๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์คฌ์ง๋ง, discontinuous task์์๋ ๋จ์ด์ง๋ ์ฑ๋ฅ์ ๋ณด์ฌ์คฌ๋ค.
- ์กฐํฌ๋ฅผ ํ ๋๋ ํ์น ๋ผ์ธ์ด ์กด์ฌํ๊ธฐ์ ์กฐํฌ์์๋ ์ข์ง ์์ ๋ชจ์ต์ ๋ณด์ฌ์คฌ๋ค.
2-12. Misinfo
GPT-4๋ ์๋ชป๋ ์ ๋ณด๋ฅผ ๋ง๋ค์ด๋ด๊ณ ๋งํฌ์ ์ด๋ฏธ์ง๋ฅผ ๋ง๋ค์ด๋ด๊ธฐ๋ ํ๋ ๋ฑ์ ๋ฌธ์ ์ ์ ๋ณด์ฌ์คฌ๋ค.
2-13. Data Admission
์ฌ๋๋ค์ ์ด๋ค ์ฝํ ์ธ ๋ฅผ ํฌ๋กค๋งํ๊ณ ํ๋ จ ๋ฐ์ดํฐ๋ก ์ฌ์ฉํ๊ธฐ๋ฅผ ์ํ๊ฑฐ๋ ์ํ์ง ์๋์ง, ๊ทธ๋ฆฌ๊ณ ๊ฐ์ธ์ ์ญํ ๊ณผ ํน์ฑ์ ์ค๋ช ํ๋ ์ถ์ฒ ์ ๋ณด๋ก ํ์ํ๊ณ ์ถ์ contribution์ ๊ฒฐ์ ํ๊ณ ์ง์ ํ ์ ์๋ ์ธ๊ฐ์ ๋ฅ๋ ฅ๊ณผ ๊ถ๋ฆฌ๋ฅผ ์์ฒญํ ์ ์๋ค.
2-14. Intrinsic Motivation
๋ ผ๋ฌธ์์๋ GPT-4์ futue work์ ๋ํ ๋ฐฉํฅ์ฑ์ด ์กํ๊ธธ ๋ฐ๋๋ค๊ณ ๋งํ๊ณ ์๋ค. ์ด๋ ์๋ชป๋ ํ์ฉ์ด ์ค๋ฆฌ์ & ์์ ์ฑ ๋ฌธ์ ๋ฅผ ์ผ์ผํฌ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค.
2-15. Conclusion
์ด๋ ๊ฒ GPT-4๋ ์ ๋ฅํ ๋ชจ์ต์ ๋ณด์ฌ์ฃผ๋๋ฐ ์ GPT-4๊ฐ ์ด๋ ๊ฒ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๋์ง๋ ์์ธํ๊ฒ ์ ์ ์๋ค. ํ ๋ง๋๋ก ์ด๋ค ๊ฒฝ์๋ก ์ธํด์ ์ด๊ฒ์ด ๊ฐ๋ฅํ ๊ฒ์ธ์ง ์ค๋ช ํ ์๊ฐ ์๋ค๋ ๊ฒ์ด๋ค. GPT-4๊ฐ ๋ฌด์์ด ๊ฐ๋ฅํ์ง๋ ์ ์ ์์ผ๋ ์ ๊ฐ๋ฅํ์ง๋ ์ ์ ์์๋ ๊ฒ์ด๋ค.
์ถ์ฒ
https://www.youtube.com/watch?v=Mqg3aTGNxZ0
https://arxiv.org/abs/2303.12712