ํ ๋จ๊ณ, ํ ๋จ๊ณ์ฉ ์ธ๊ฐ์ฒ๋ผ ์๊ฐํด๋ณด์! ๐ง ๐ค
Let's think step-by-step! ๐ช
ํฌ์คํ ์ ์ ๋ชฉ๊ณผ ์ด ์น์ ์ ์ ๋ชฉ์ ๋ดค์ ๋ ์์ํ๊ฒ ์๊ฐํ๋ ์ฌ๋๋ค์ด ์์ ๊ฒ์ด๋ค. '์๋ ์ด ์ฌ๋, NLP ๊ด๋ จ ์๊ธฐ ์๋ง ํ๋ค๊ฐ ๊ฐ์๊ธฐ ๋ฌด์จ ๋ฑ๋ด์ง๊ฐ์ ์๋ฆฌ๋? ๐คจ' ์ถฉ๋ถํ ๊ทธ๋ด ์ ์๋ค! ํ์ง๋ง, NLP ๊ด๋ จ ๋ ผ๋ฌธ์ ์ฝ์ด๋ดค๊ฑฐ๋ ์ต์ method๋ค์ ๋ํด ์ ์๊ณ ์๋ ์ฌ๋์ด๋ฉด ํ์๊ฐ ๋ฌด์จ ์๋ฆฌ๋ฅผ ํ๊ณ ์ถ์ด ํ๋ ๊ฒ์ธ์ง๋ฅผ ์ ๊ฒ์ด๋ผ ์๊ฐํ๋ค. ์๋ํ๋ฉด ์ด ์น์ ์ ์ ๋ชฉ์ด 'Let's think step-by-step'์ ์ด ํฌ์คํ ์ ๊ดํตํ๋ ๋ฌธ์ฅ์ด์, ์ ๋ช ํ ๋ ผ๋ฌธ์์ ์ฌ์ฉ๋ method์ด๊ธฐ ๋๋ฌธ์ด๋ค. ์ด๊ฒ ๋ฌด์จ ์๋ฆฌ๋๊ตฌ์? ๊ถ๊ธํ์๋ค๋ฉด, LM์ด ์ฌ๋๊ณผ ๋น์ทํ ๋ฐฉ์์ผ๋ก ์ฌ๊ณ ๋ฅผ ํด์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ฒ ํ๊ณ ์ ํ method๋ค์ ๋ํด ์์๋ณด๋ ์ด๋ฒ ํฌ์คํ ์ ๋๊น์ง ์ฝ์ด์ฃผ์๋ฉด ๋ ๊ฒ ๊ฐ์ต๋๋ค! ๐ ๋ฐ๋ก ์์ํด ๋ณด๋๋ก ํ๊ฒ ์ต๋๋ค!
The differences between human and LM ๐
LM๊ณผ ์ฌ๋์ ๊ฐ์ฅ ํฐ ์ฐจ์ด์ ์ ๋ฌด์์ผ๊น? ๋ฌผ๋ก , ์์ฒญ๋๊ฒ ๋ง์ ์ฐจ์ด์ ์ด ์กด์ฌํ๋ค. ํ์ต ๋ฐฉ์๋ ๋ค๋ฅด๊ณ , ํ์ต ์๋ ๋ค๋ฅด๊ณ , ์๋๋ ๋ค๋ฅด๊ณ , ... ์ ๋ง ์ ์๋ ์์ด ๋ง์ ์ฐจ์ด์ ์ ๊ฐ์ง๊ณ ์๋๋ฐ, ํ์๊ฐ ์๊ฐํ๋, ์๋ ์์ผ๋ก ์ด ํฌ์คํ ์์ ์๊ฐํ ๋ ผ๋ฌธ๋ค์ ์ ์๋ค์ด ์๊ฐํ ๊ฐ์ฅ ํฐ ์ฐจ์ด์ ์ ์๊ฐํ๋ ๋ฐฉ์์ ์๋ค๊ณ ์ฃผ์ฅํ์๋ค. (ํ์๋ ๋น์ทํ ์๊ฐ์ ๊ฐ์ง๊ณ ์๋ค!) ์๊ฐํ๋ ๋ฐฉ์? ๊ทธ๊ฒ ์ด๋ป๊ฒ ๋ค๋ฅด๋ค๋ ๊ฑฐ์ง? ์ด๋ฐ ์๋ฌธ์ด ๋ค ์ ์์ํ ๋ฐ, ํ๋์ ์์๋ฅผ ๋ค์ด ์ด๋ฅผ ์ค๋ช ํด๋ณด๊ณ ์ ํ๋ค.
์ฒ ์๊ฐ ๋งํธ์ ๊ฐ์ ์ฌ๊ณผ 3๊ฐ, ๋ฐ๋๋ 7๊ฐ, ์๋ฐ 2๊ฐ๋ฅผ ์ฌ์๋ค. ๊ฐ๊ฐ ์ฌ๊ณผ๋
300์, ๋ฐ๋๋๋ 200์, ์๋ฐ์ 500์ ์ผ ๋, ์ฒ ์๋ ์ผ๋ง๋ฅผ
์ง๋ถํ์๋๊ฐ?
์, ์์ ๊ฐ์ ์ํ ๋ฌธ์ ๊ฐ ์๋ค๊ณ ๊ฐ์ ํด๋ณด์. ์ฐ๋ฆฌ์ ๋๋ํ ๋ ์๋ถ๋ค์ ์ด ์ ๋ ๊ณ์ฐ์ ์์ ์ฃฝ ๋จน๊ธฐ๋ก ๋ฌธ์ ๋ฅผ ๋ณด์๋ง์ ํด๊ฒฐํ์์ ํ ์ง๋ง, ๊ทธ ์งง์ ์๊ฐ์๋ ์ฐ๋ฆฌ์ ๋๋ ๋ช ๊ฐ์ง ๋จ๊ณ๋ฅผ ๊ฑฐ์ณ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์์ ๊ฒ์ด๋ค. ์, ํ์ธํด ๋ณด์.
- ๐์ ๊ฐ์๊ฐ 3, ํ๋๋น ๊ฐ๊ฒฉ์ด 300์ → 3 × 300 = 900์
- ๐์ ๊ฐ์๊ฐ 7, ํ๋๋น ๊ฐ๊ฒฉ์ด 200์ → 7 × 200 = 1,400์
- ๐์ ๊ฐ์๊ฐ 2, ํ๋๋น ๊ฐ๊ฒฉ์ด 500์ → 2 × 500 = 1,000์
- ์ด๊ฑฐ๋ฅผ ๋ค ๋ํด์ 900 + 1,400 + 1,000 = 3,300์
- Answer: 3,300์ !!
์ด์ ๊ฐ์ด ์ฐ๋ฆฌ์ ๋๋ ์๋ฌด๋ฆฌ ์ฌ์ํ ๋ฌธ์ ์ ๋ํด์๋ ์ด๋ ๊ฒ ์ฌ๋ฌ ๊ฐ์ง ๋จ๊ณ๋ฅผ ๊ฑฐ์ณ์ ๊ฒฐ๋ก ์ ๋์ถํ๊ฒ ๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ด ๊ณผ์ ์ ํตํด ๋์ฑ ์ ๊ตํ๊ฒ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ค. ๊ทธ๋ ๋ค๋ฉด LM์ ์ด๋ป๊ฒ ์๊ฐํ ๊น? ๋ฌผ๋ก ๊ทธ ์๋ด๋ฅผ ์๋ฒฝํ๊ฒ ์ ์๋ ์์ง๋ง, LM์ ๋ณดํต ๋ค์๊ณผ ๊ฐ์ ๋ต๋ณ์ ๋ด๋๊ฒ ๋๋ค.
'3,300์ ์ ๋๋ค.'
์ด์ฏค ๋๋ฉด ์ฌ๋๊ณผ LM์ ์ฐจ์ด์ ์ ๋ํด์ ์ ์ ์์ ๊ฒ์ด๋ผ๊ณ ์๊ฐํ๋ค. ๐ซก ๋ฐ๋ก ๊ทธ๊ฒ์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐฉ์์ด๋ค! ์ฌ๋์ ํ๋์ ํฐ ๋ฌธ์ ๋ฅผ ์์ ๋ฌธ์ ์ฌ๋ฌ ๊ฐ๋ก ์ชผ๊ฐ์ ํด๊ฒฐํ๋ ๋ฐ๋ฉด์, LM์ ํ๋์ ํฐ ๋ฌธ์ ๋ฅผ ๊ทธ๋ฅ ํต์งธ๋ก ํด๊ฒฐํ๋ ค๊ณ ํ๋ค. ์ด๋ค ๋ฐฉ์์ด ๋ ์ด๋ก์ธ๊น? ๋น์ฐํ ์ ์์ ๋ฐฉ์์ด๋ค! ์ฌ์ด ๋ฌธ์ ๋ฅผ ๋ง์ด ํผ๋ค๊ณ ํด์ ํฐ ์ด๋ ค์์ด ์๋ ๊ฒ์ ์๋์ง๋ง, ์ด๋ ค์ด ๋ฌธ์ ๋ฅผ ํธ๋ ๊ฒ์ ๊ทธ์ ๋ฐ๋ฅธ ๋ ธ๋ ฅ์ ํ์๋ก ํ๊ธฐ ๋๋ฌธ์ด๋ค. ๐ฅ
์ด๋ ๋ฏ ์ฌ๋๊ณผ LM ์ฌ์ด์๋ ์๊ฐ ๋ถ๋ถ์์ ์ฌ์ํด ๋ณด์ด์ง๋ง, ํฐ ์ฐจ์ด์ ์ ๊ฐ์ง๊ณ ์๋ค. ์ด๋ฒ ํฌ์คํ ์์๋ ์ด๋ ๊ฒ ์ฌ๋๊ณผ ๋น์ทํ ์ฌ๊ณ ๋ฐฉ์์ ํตํด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํด๋ณด๊ณ ์ ํ method๋ค์ ๋ํด ์์๋ณด๋ ค๊ณ ํ๋ค. ๐
Chain-of-Thought ๐ง โ๏ธ
Chain-of-Thought Prompting Elicits Reasoning in Large Language Models (Wei et al., 2022)
์ฒ์์ผ๋ก ์๊ฐํด๋ณด๊ณ ์ ํ๋ ๋ ผ๋ฌธ์ ์ฌ๋์ ์๊ฐ ๊ณผ์ ์ ์๊ฐ์ ๊ณ ๋ฆฌ ์ฆ, 'Chain-of-Thought'๋ผ๊ณ ์ง์นญ์ ํ๋ฉฐ method ๋ํ ๋๊ฐ์ ์ด๋ฆ์ ๊ฐ์ง๋ CoT(Chain-of-Thought)์ด๋ค. CoT๋ ๋ง ๊ทธ๋๋ก ์๊ฐ์ ๊ณ ๋ฆฌ์ด๋ฉฐ ์์ ์์๋ก ์ค๋ช ํ๋ ๋ฌธ์ ์ ์๊ฐ ๊ณผ์ ์ ๋ ์ฌ๋ฆฌ๋ฉด ์ฝ๊ฒ ์ดํด๊ฐ ๊ฐ ๊ฒ์ด๋ค.
๊ทธ๋ ๋ค๋ฉด CoT๋ ์ด๋ป๊ฒ LM์๊ฒ step-by-step ์ถ๋ก ์ ํ ์ ์๋ ๋ฅ๋ ฅ์ ์ค ์ ์์์๊น? CoT๋ ์ด๋ฅผ ์ํด ๋ชจ๋ธ์ prompt์ ์ด์ง ์์ ์ ๊ฐํ๋ ๋ฐฉ๋ฒ์ ์ ํํ๋ค. ๊ธฐ์กด์ prompting์ด ์ฌ๋ฌ question๊ณผ answer๋ฅผ example๋ก ์ฃผ๊ณ ๋ง์ง๋ง์ ๋ต์ ์ป๊ณ ์ถ์ question์ ์ค ๋ค์ answer๋ฅผ ์ถ๋ ฅํ๋ ๋ฐฉ์์ ์ฌ์ฉํ๋ค๋ฉด, CoT prompting์ ๊ธฐ์กด์ question์ example๋ก ์ฃผ๋ ๊ฒ์ ๋๊ฐ์ด ์ ์ง์ํค๊ณ , ๋์ ์ answer์ ๋ฌธ์ ๋ฅผ step-by-step์ผ๋ก ํด๊ฒฐํ๋ ๊ณผ์ ์ ํจ๊ป ์ค์ผ๋ก์จ ๋ชจ๋ธ์ด step-by-step ์ถ๋ก ์ ํ ์ ์๊ฒ ๋ง๋ค์ด์คฌ๋ค. ๋ง๋ก๋ง ๋ณด๋ฉด ์ดํด๊ฐ ์ ์ ๊ฐ๋ CoT paper์ ์๋ ๊ทธ๋ฆผ์ ๋ณด๋ฉด์ ์ดํดํด ๋ณด๋๋ก ํ์! ๐
์์ ๊ทธ๋ฆผ์ ๋ณด๋ฉด ์ ์ ์๋ฏ์ด, CoT reasoning(์ถ๋ก )์ ๋ณต์กํ ๋ฌธ์ ๋ฅผ ์ฌ๋ฌ ๊ฐ์ ๊ฐ์ํ๋ ๋ฌธ์ ๋ก ๋ถํดํ์ฌ ํด๊ฒฐํ ์ ์๊ฒ ๋์์ค๋ค. ๊ทธ๋ฆฌ๊ณ ๋น์ฐํ๊ฒ๋ ์ฌ๋ฌ question & answer example์ ์ ๊ณตํด์ค์ผ ํ๋ few-shot learning์ด๋ผ๊ณ ํ ์ ์๋ค. ๐
๊ทธ๋ ๋ค๋ฉด CoT reasoning์ ์คํ ๊ฒฐ๊ณผ๋ ์ด๋ ํ ๊น? ์คํ ๊ฒฐ๊ณผ์์๋ ๊ณผ์ฐ ์ข์ ๋ชจ์ต์ ๋ณด์ฌ์คฌ์๊น? CoT reasoning์ ์คํ ๊ฒฐ๊ณผ๋ ์ด์ง ๋ ํนํ ํํ๋ฅผ ๋ณด์ฌ์ฃผ์๋ค. ๋น์ฐํ ์ฑ๋ฅ์ด ์ข์์ง๊ธด ํ์์ผ๋, ๊ทธ ์ฑ๋ฅ ํฅ์์ด ์กฐ๊ฑด๋ถ์ ์ด์๋ค๋ ์ฌ์ค์ ์ ์ธํ๋ฉด ๋ง์ด๋ค! ๐ฃ ๋ค์์ ํ๋ฅผ ๋ณด๋ฉด ์ ์ ์๋ฏ์ด, CoT reasoning์ ๊ฒฝ์ฐ ์์ ์ฌ์ด์ฆ์ ๋ชจ๋ธ์ ๋ํด์๋ ๋ณ ํจ๊ณผ๊ฐ ์์์ผ๋, ๋ชจ๋ธ์ ์ฌ์ด์ฆ๊ฐ ์ปค์ง๋ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๊ธฐ ์์ํ์๋ค. ์ด๋ก ๋ฏธ๋ฃจ์ด ๋ณด์ 'CoT reasoning์๋ ์ ๋นํ ์ฌ์ด์ฆ์ ๋ชจ๋ธ์ด ํ์ํ ๊ฒ ์๋๊น?'์ ๊ฐ์ ๊ฐ์ค์ ๋ ์ฌ๋ฆด ์ ์๊ฒ ๋๋ค.
์ด๋ ๊ฒ ์๋ฒฝํด ๋ณด์ด๋ CoT๋ ํฐ ์ฌ์ด์ฆ์ ๋ชจ๋ธ์ด ์๋ ๊ฒฝ์ฐ์๋ ๋ณ ํจ๊ณผ๊ฐ ์๋ ๊ฒ์ฒ๋ผ, ๋ ๋ค๋ฅธ ๋จ์ ์ด ์กด์ฌํ๋๋ฐ, ๊ทธ๊ฑด ๋ฐ๋ก CoT example์ ํํ์ ๋ฐ๋ผ ์ฑ๋ฅ์ด ๋ ์ฒ์ฐจ๋ง๋ณ๋ก ๋ฌ๋ผ์ก๋ค๋ ์ ์ด๋ค. ๋ฐ๋ผ์ ์์ง์ ๋ถ์กฑํ ์ ์ด ๋ง๊ธด ํ์ง๋ง, ๊ทธ๋ผ์๋ ๋ชจ๋ธ์๊ฒ ์ฌ๋๊ณผ ๋น์ทํ ์๊ฐ ํ๋ก์ธ์ค๋ฅผ ๊ฐ์ง๊ฒ ํ๋ค๋ ๊ฒ๋ง์ผ๋ก๋ ์ถฉ๋ถํ ๋๋ผ์ด ์๋๋ฅผ ํ ๋ ผ๋ฌธ์ด์๋ค.
CoT์ ๋ํ ์ค๋ช ์ ์ฌ๊ธฐ์ ๋ง์น๋, ๋์ฑ ์์ธํ๊ฒ ์๊ณ ์ถ๋ค๋ฉด CoT paper ๋ฆฌ๋ทฐ๋ฅผ ํ์ธํ๊ธธ ๋ฐ๋๋ค!
Large Language Models are Zero-shot Reasoners (Kojima et al., 2022)
CoT์ ๋๋ผ์ด ๊ฒฐ๊ณผ๋ฅผ ํ์ธํ ํ, CoT์ ๋ํ ๊ด์ฌ์ ์ฝ๊ฒ ์ฌ๊ทธ๋ผ๋ค์ง ์์๊ณ , ๊ทธ ๊ด์ฌ์ ๊ธฐ์กด์ Few-shot CoT๋ฅผ Zero-shot์ผ๋ก ๋ฐ๊พธ๊ธฐ๊น์ง ์ด๋ฅด๋ ๋ค. ์ด ๋ ผ๋ฌธ์์๋ Zero-shot CoT์ ๋ํด ์ ์ํ์๋๋ฐ, ์ด๋ป๊ฒ ๊ฐ๋ฅํ๋ ๊ฒ์ผ๊น? ๊ธฐ์กด์ CoT์์๋ few-shot์ ํตํด ์ฌ๋ฌ CoT example์ด ์ฃผ์ด์ง๋ฉด ์ด๋ฅผ ํ์ฉํด CoT reasoning์ ํ ์ ์์๋ ๊ฒ์ธ๋ฐ, ๋ง์ฝ ์ด example์ด ์ฃผ์ด์ง์ง ์๋๋ค๋ฉด? ์ด๋ป๊ฒ ํด์ผ ํ ๊น? ์ ์ง ์ด๋ ต๊ฒ ๋๊ปด์ง ์๋ ์๊ฒ ์ง๋ง, ์ฌ์ค ์ผ๋ฐ CoT๋ณด๋ค ํจ์ฌ ์ฌ์ฐ๋ ๋๋ฌด ๊ฑฑ์ ํ์ง ๋ง๋ผ! ๐ฎ๐จ
์ด ํฌ์คํ ์ ์ด๋ฐ์ ํ์๋ ๋ง์ธ 'Let's think step-by-step'์ ๊ธฐ์ตํ๋๊ฐ? ์ด๋ฐ๋ถ์ ์ด ๋ฌธ์ฅ์ด ์ค์ํ method๋ก ์ฌ์ฉ๋ ๋ ผ๋ฌธ์ด ์๋ค๊ณ ์ค๋ช ํ๋๋ฐ, ๋ฐ๋ก ๊ทธ ๋ ผ๋ฌธ์ด ์ด ๋ ผ๋ฌธ์ด๋ค!! ๐ Zero-shot CoT์์๋ ๋ชจ๋ธ์๊ฒ CoT ๋ฅ๋ ฅ์ ๋ถ์ฌํ๊ธฐ ์ํด 'Let's think step-by-step'์ด ํ ๋ฌธ์ฅ๋ง์ ์ฌ์ฉํ๋ค. ๐ ๊ธฐ์กด์ Few-shot CoT์ Zero-shot CoT๋ฅผ ๋น๊ตํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค. ์ ๋ง์ด์ง ๋๋ฌด ๊ฐ๋จํ์ง ์์๊ฐ? ๋ฌผ๋ก ์ฑ๋ฅ์ Few-shot์ ๋นํด ์ด์ง ๋จ์ด์ง๊ธฐ๋ ํ๋, ๊ทธ๋ผ์๋ ๋ถ๊ตฌํ๊ณ Few-shot CoT์ ๋นํด ํจ์ฌ ๋ ๊ฐ๋จํ๋ค! ๐ซข
๋ฌผ๋ก , Zero-shot CoT์ ๊ฒฝ์ฐ ์๋ฒฝํ๊ฒ ๋ต์ ์ถ๋ ฅํ๊ธฐ ์ํด์๋ ๋ค์๊ณผ ๊ฐ์ ํ ๊ฐ์ง ๋จ๊ณ๊ฐ ๋ ํ์ํ๊ธด ํ๋ค. ํ์ง๋ง ๊ทธ๋ผ์๋ ์ ๋ง ๊ฐ๋จํ ๋ฐฉ์์ด๊ธฐ์ ํ์ฌ๋ Zero-shot CoT๋ ๋ง์ด ์ฌ์ฉ๋๊ณ ์๋ค.
Zero-shot CoT์ ๋ํ ์ค๋ช ์ ์ฌ๊ธฐ์ ๋ง์น๋, ๋์ฑ ์์ธํ ๋ด์ฉ์ด ๊ถ๊ธํ๋ค๋ฉด Zero-shot CoT ๋ฆฌ๋ทฐ๋ฅผ ํ์ธํ๊ธธ ๋ฐ๋๋ค.
Self-Consistency Improves Chain of Thought Reasoning in Language Models (Wang et al., 2022)
Self-Consistency๋ CoT์ ๊ฒฐ๊ณผ๋ฅผ ์ข ๋ ๊ฐ์ ์ํค๊ณ ์ ํ method๋ก majority vote๋ฅผ ์ฌ์ฉํด ์ฌ๋ฌ ๋ฒ์ CoT๋ฅผ ํ์ฌ ๊ฐ์ฅ ๋ง์ด ๋์จ answer๋ฅผ ์ต์ข answer๋ก ์ผ๋ ๋ฐฉ์์ด๋ค. ์ด๋ ๊ฒ๋ง ์๊ธฐ๋ฅผ ํ๋ฉด ์ ๋๋ก ์ดํด๊ฐ ๊ฐ์ง ์์ผ๋, ์๋ฅผ ๋ค์ด์ ์ค๋ช ํด ๋ณด๋๋ก ํ๊ฒ ๋ค.
CoT๋ ํ ๋ฌธ์ ๋ฅผ ์ฌ๋ฌ ๊ฐ์ ์์ ๋ฌธ์ ๋ก ๋๋์ด์ ์์ฐจ์ ์ผ๋ก ํด๊ฒฐํ๋ ๋ฐฉ์์ด๋ค. ๊ทธ๋ฐ๋ฐ ์ด๋ ๋ง์ฝ ์ค๊ฐ ์คํ ์์ ์ค๋ต์ ๋ด๋๊ฒ ๋๋ค๋ฉด, ์ต์ข answer๋ ์ด๋ป๊ฒ ๋ณํํ ๊น? ์ํ ๋ฌธ์ ๋ก ์๊ฐํด ๋ณด์. ์ํ ๋ฌธ์ ์์ ์ค๊ฐ์ ๊ณ์ฐ ์ค์๊ฐ ํ ๋ฒ ๋ฐ์ํ๋ฉด ์ต์ข ๋ต์ ์ ๋ต๊ณผ ๋ค๋ฅด๊ฒ ๋์ค๊ฒ ๋๋ค. CoT๋ ๋ง์ฐฌ๊ฐ์ง์ด๋ค. ์ค๊ฐ์ ์ค๋ต์ ๋ด๋๊ฒ ๋๋ฉด ์ต์ข answer๋ ์ ๋ต๊ณผ๋ ๋ค๋ฅธ ๋ต์ ์ป๊ฒ ๋๋ค. ๊ทธ๋ ๋ค๋ฉด ์ด๋ฅผ ์ด๋ป๊ฒ ํด๊ฒฐํ ์ ์์๊น? Self-consistency๋ ์ฌ๋ฌ ๋ฒ์ CoT๋ฅผ ์ํํจ์ผ๋ก์จ ๋์จ ๋ค์ํ ๋ต๋ค ์ค์์ ๊ฐ์ฅ ๋น๋๊ฐ ๋์ ๋ต์ ์ต์ข ๋ต์ผ๋ก ์ ํ๋ ๋ฐฉ์์ ์ฌ์ฉํ์๋ค. ์ด๋ ๊ฒ ํจ์ผ๋ก์จ ์ข ๋ ์ต์ ์ ๋ต์ ์ป๊ฒ ๋ง๋ค๊ณ ์ ํ ๋ฐฉ์์ด Self-consistency์ด๋ค.
Tree of Thoughts: Deliberate Problem Solving with Large Language Models (Yao et al., 2023)
๋ง์ง๋ง์ผ๋ก ์์๋ณผ method๋ Tree-of-Thought์ด๋ค. ToT๋ ์ด๋ฆ์์๋ถํฐ ์ ์ ์๋ฏ์ด CoT ๊ณผ์ ์ ํธ๋ฆฌ ๊ตฌ์กฐ๋ฅผ ํ์ฉํ ๋ฐฉ๋ฒ์ธ๋ฐ, ์ด๋ฅผ ํตํด Self-Consistency ๋ณด๋ค ๋์ฑ ์ ๊ตํ๊ฒ ์ฌ๋ฐ๋ฅธ ๋ต์ ๋์ถํด ๋ผ ์ ์๋ method์ด๋ค. ToT๋ ํ๋์ CoT ์คํ ์์๋ ์ฌ๋ฌ ๊ฐ์ ๋ต์ ๋ง๋ค์ด ๋ด๋ LM์ ํน์ฑ์ ํ์ฉํ์ฌ ๊ฐ ์คํ ๋ง๋ค ๊ฐ์ง๋ฅผ ๋ป์ด๋๊ฐ๋ ํํ๋ก ํธ๋ฆฌ๋ฅผ ๊ตฌ์ฑํ์ฌ ์ต์ ์ ๋ต์ ๋์ถํ ์ ์๋๋ก ํธ๋ฆฌ ํ์์ ํตํด ์ต์ ์ answer๋ฅผ ์ฐพ์๊ฐ๋ฉฐ ์ต์ข ์ ์ผ๋ก ์ฌ๋ฐ๋ฅธ ๋ต์ ๋์ถํ ์ ์๋๋ก ๋ง๋ ๋ฐฉ์์ด๋ค.
ToT์ ๋ํ ์ค๋ช ์ ์ฌ๊ธฐ์ ๋ง์น๋, ๋์ฑ ์์ธํ ๋ด์ฉ์ด ๊ถ๊ธํ๋ค๋ฉด ToT paper ๋ฆฌ๋ทฐ๋ฅผ ํ์ธํ๊ธธ ๋ฐ๋๋ค.
At the end of positing.. ๐
CoT๋ฅผ ๋ณด๋ฉด์ ํ์๋ ์ ๋ง์ด์ง ๋๋ผ์์ ๊ธ์น ๋ชป ํ์๋ค. ์์งํ ๋งํด์ ํ์๋ ์ง๊ธ๊น์ง์ model answering ๋ฐฉ์์ ๋ฌธ์ ๊ฐ ์๋ค๊ณ ๋ ์๊ฐ์กฐ์ฐจ ํ์ง ๋ชป ํ์๋ค. ์ ๋ฌผ๋ก ๋ฌธ์ ๊ฐ ์๋ค๊ณ ๋งํ๋ ๊ฒ์ ์๋๋, ๋ฌธ์ ํด๊ฒฐ ๋ฐฉ์์ ์๊ฐํ์ ๋, CoT์ ๊ทธ๋ฅ ์ถ๋ก ์๋ ์๋นํ ํฐ ์ฐจ์ด๊ฐ ์๋ค๊ณ ์๊ฐํ๋ค. ๋งจ๋ ์ ํค๋ฉ๊ณผ ์ฐจ๊ทผ์ฐจ๊ทผ ์ ์คํ๊ฒ๋ ์์ ํ ๋ค๋ฅด๋ ๋ง์ด๋ค! ๐ CoT ๋ง์ผ๋ก๋ ์ถฉ๋ถํ ๋๋ผ์ ์ผ๋ ์ดํ์ Self-Consistency, ToT๋ ๋๋ผ์์ ๋๋ผ์์ ๋ํด์ฃผ์๋ค. ์ด๋ ๋ฏ ๋ชจ๋ธ์ ์์ ์ฑ๋ฅ์ ์ฌ๋ฆฌ๋ ๊ฒ๋ ๋ฌผ๋ก ์ค์ํ์ง๋ง, CoT ๊ฐ์ด ํ๊ธฐ์ ์ธ ๋ฐฉ์์ผ๋ก ๋ชจ๋ธ์๊ฒ ์๋ก์ด ๋ฅ๋ ฅ์ ๋ถ์ฌํด ์ฃผ๋ ์ฐ๊ตฌ๋ค๋ ์ค์ํ๋ค๊ณ ์๊ฐํ๋ค. ๋ค์ ํ๋ฒ ์ด๋ฐ ํ๊ธฐ์ ์ธ ์ฐ๊ตฌ๋ฅผ ์งํํด ์ฃผ์ ๋ชจ๋ ์ฐ๊ตฌ์๋ถ๋ค๊ป ๊ฐ์ฌ๋ฅผ ํํ๋ฉฐ, ํ์์ ๋ ์๋ ์ฐ๊ตฌ๊ณ์ ํ ํ์ ๊ธ๋ ์ฐ๊ตฌ๋ฅผ ํ ์ ์์ ๋๊น์ง ๋ชจ๋ ์ด์ฌํ ๋์๊ฐ ์ ์๊ธธ ๋ฐ๋๋ค! ๐