Introduction
GPT-4λ real-worldμμλ μ¬λλ³΄λ€ μ‘°κΈ λͺ»ν λ₯λ ₯μ 보μ¬μ£Όμ§λ§, κ·Έλλ μ λ¬Έμ λ° νλ¬Έμ λ²€μΉλ§ν¬μμ μ¬λ μμ€μ μ±λ₯μ 보μ¬μ£Όλ large multimodel model$($μ΄λ―Έμ§μ ν μ€νΈλ₯Ό μ λ ₯μΌλ‘ λ°κ³ , ν μ€νΈ μΆλ ₯μ λ΄λμ$)$ μ΄λ€. μλ₯Ό λ€μ΄ λ³νΈμ¬ μκ²©μ¦ μν$($simulated bar exam$)$μμ GPT-3.5μ νμ 10% κΈ°λ‘κ³Ό μλ°λκ² μμ 10%μ μ±μ μ κΈ°λ‘νμλ€. 6κ°μ λμ μ λμ ν μ€νΈ νλ‘κ·Έλ¨κ³Ό ChatGPTμ κ΅νμ μ¬μ©νμ¬ GPT-4λ₯Ό λ°λ³΅μ μΌλ‘ μ‘°μ νμ¬ μ¬μ€μ±$($factuality$)$, μ‘°μ’ μ±$($steerability$)$ λ° κ°λλ μΌμ λ²μ΄λμ§ μλ μΈ‘λ©΄μμ$($μλ²½νμ§λ μμ§λ§$)$ μ΅κ³ μ κ²°κ³Όλ₯Ό μ»μλ€.
λΆκ³Ό 1λ μ μ GPT-3.5λ₯Ό νμ΅μμΌ°λλ°, μ¬κΈ°μ λ°κ²¬λ λ²κ·Έλ₯Ό μμ νκ³ μ΄λ‘ μ κΈ°μ΄ λΆλΆμ ν₯μμμΌμ GPT-4λ λ³΄λ€ μμ μ μ΄μκ³ , νλ ¨ μ±λ₯μ μ ννκ² μμΈ‘ν μ μλ μ΅μ΄μ λν λͺ¨λΈμ΄ λμλ€.
Capabilities
μΌλ°μ μΈ λνμμ GPT-3.5μ GPT-4μ μ°¨μ΄λ λ―Έλ¬ν μ μλ€. μ΄ λμ μ°¨μ΄μ μ taskκ° μΌμ μ κΉμ§ μΆ©λΆν 볡μ‘ν λ 보μ΄κ² λλ€. GPT-4λ GPT-3.5λ³΄λ€ λμ± μ λ’°κ° κ°κ³ , λ μ°½μ μ΄κ³ , λ λ§μ λμμ€ κ΅¬μ‘°λ₯Ό λ€λ£° μ μκ² λμλ€.
λ λͺ¨λΈ κ°μ μ°¨μ΄λ₯Ό μ΄ν΄νκΈ° μν΄ μ¬λμ μν΄ λ§λ€μ΄μ§ λͺ¨μ μνμ ν¬ν¨ν λ€μν λ²€μΉλ§ν¬μμ ν μ€νΈλ₯Ό νμλ€. λͺ¨λΈμ νμ΅μν¬ λ μ΄ μνλ€μ μν ꡬ체μ μΈ νμ΅μ μ§ννμ§λ μμλ€. μνμμ μμμ λ¬Έμ κ° κ΅μ‘ μ€μ λͺ¨λΈμ νμλμμ§λ§ κ²°κ³Όκ° λνμ μ΄λΌκ³ μκ°νλ€. μμΈν λ΄μ©μ technial reportλ₯Ό νμΈνκΈΈ λ°λλ€.
λν GPT-4λ₯Ό κΈ°μ‘΄μ λ¨Έμ λ¬λ λ©μλλ₯Ό μν΄ λ§λ€μ΄μ§ λ²€μΉλ§ν¬μ λν΄μλ νκ°λ₯Ό νμλ€. GPT-4λ νμ‘΄νλ LLMλ€μ μλΉν λμ΄μλ μ±λ₯μ 보μ¬μ€¬λ€: SoTA λͺ¨λΈλ€ μ€μλ λ²€μΉλ§ν¬μ νΉνλμ λ§λ€μ΄μ§κ±°λ μΆκ° νμ΅ νλ‘ν μ½μ κ°μ§κ³ μλ λͺ¨λΈλ€λ μ‘΄μ¬νλ€.
λ§μ ML λ²€μΉλ§ν¬λ€μ μμ΄λ‘ μ¨μ Έ μλ€. λ€λ₯Έ μΈμ΄λ€μ λν μ΄κΈ° λ₯λ ₯ κ°κ°μ μ΅νκΈ° μν΄ MMLU λ²€μΉλ§ν¬λ₯Ό$($57κ°μ μ£Όμ μμ 14,000μ¬ κ°μ λ€μ€ μ ν λ¬Έμ $)$ Azure Translateλ₯Ό μ¬μ©νμ¬ λ€μν μΈμ΄λ‘ λ²μνμλ€. 26κ°μ μΈμ΄ ν μ€νΈ μ€μμ 24κ°μ λΆλ¬Έμμ GPT-4λ GPT-3.5μ μμ΄ μ±λ₯κ³Ό λ€λ₯Έ LLMμ μ±λ₯λ€μ λ₯κ°νλ λͺ¨μ΅μ 보μ¬μ€¬λ€. μ΄ μΈμ΄ μ€μλ 리μμ€κ° μ μ Lativian, Welsh, Swahili λ±μ΄ ν¬ν¨λμ΄ μλ€.
μ€μ λ‘ OpenAIμμλ GPT-4λ₯Ό λ΄λΆμ μΌλ‘ νμ©νκ³ μλλ° μ§μ, ν맀, λ΄μ© μ‘°μ , νλ‘κ·Έλλ° λΆλΆμμ μλΉν μν₯μ μ£Όκ³ μλ€. λν μ λ ¬ μ λ΅μ λ λ²μ§Έ λ¨κ³λ₯Ό μμνλ©΄μ μΈκ°μ΄ AI μΆλ ₯μ νκ°νλ λ° λμμ μ£ΌκΈ° μν΄ μ΄λ₯Ό μ¬μ©νκ³ μλ€.
Visual Inputs
GPT-4λ ν μ€νΈ λ° μ΄λ―Έμ§ promptλ₯Ό μλ½ν μ μμΌλ©° ν μ€νΈ μ μ© μ€μ κ³Ό λ§μ°¬κ°μ§λ‘ μ¬μ©μκ° μκ° λλ μΈμ΄ μμ μ μ§μ ν μ μλ€. ꡬ체μ μΌλ‘ GPT-4λ ν μ€νΈμ μ΄λ―Έμ§κ° ν¨κ» μλ μ λ ₯μ΄ μ£Όμ΄μ§λ©΄ ν μ€νΈ μΆλ ₯μ λ΄λλλ€. GPT-4λ ν μ€νΈ, μ¬μ§, λ€μ΄μ΄κ·Έλ¨, μ€ν¬λ¦°μ·μ ν¬ν¨νκ³ μλ λ¬Έμμ λν΄μλ text-only μ λ ₯μ 쀬μ λμ λΉμ·ν λ₯λ ₯μ 보μ¬μ€¬λ€. λν few-shot λ° chain-of-thought promptingμ ν¬ν¨νμ¬ ν μ€νΈ μ μ© μΈμ΄ λͺ¨λΈμ©μΌλ‘ κ°λ°λ ν μ€νΈ μκ° κΈ°μ λ‘ λ³΄κ°ν μ μλ€.
GPT-4μ μ±λ₯μ μ’μ λ²μμ νλ¬Έμ μκ° λ²€μΉλ§ν¬μμ νκ°ν¨μΌλ‘μ¨ κ°λ¨νκ² μκ°νμλ€. κ·Έλ¬λ μ΄ μμΉλ λͺ¨λΈμ΄ μ²λ¦¬ν μ μλ μλ‘κ³ ν₯λ―Έλ‘μ΄ μμ μ μ§μμ μΌλ‘ λ°κ²¬νκ³ μκΈ° λλ¬Έμ κΈ°λ₯μ λ²μλ₯Ό μμ ν λνλ΄μ§λ μλλ€.
Steerability
μ΄ κΈμ μμμ λ§νλ κ²μ²λΌ AIμ μ΅μ± μ€ νλμΈ steerability$($μ‘°μ’ κ°λ₯μ±$)$μ μΈ‘λ©΄μμ GPT-4λ₯Ό ν μ€νΈν΄λ³΄μλ€. κ³ μ λ μ₯ν©ν¨, μ΄μ‘° λ° μ€νμΌμ κ°μ§ κ³ μ μ μΈ ChatGPT μ±κ²© λμ κ°λ°μ$($λ° ChatGPT μ¬μ©μ$)$λ μ΄μ "μμ€ν " λ©μμ§μμ μ΄λ¬ν λ°©ν₯μ μ€λͺ νμ¬ AIμ μ€νμΌκ³Ό μμ μ κ·μ ν μ μλ€. μμ€ν λ©μμ§λ₯Ό ν΅ν΄ API userλ€μ λ²μ λ΄μμ μ¬μ©μ κ²½νμ ν¬κ² μ μν μ μλ€.
Limitations
GPT-4μ λ₯λ ₯μλ λΆκ΅¬νκ³ , GPT-4λ μ΄μ μ GPT λͺ¨λΈλ€κ³Ό λ§μ°¬κ°μ§λ‘ λΉμ·ν νκ³λ₯Ό κ°μ§κ³ μλ€. κ°μ₯ μ€μν κ²μ μμ§λ μμ ν μ λ’°ν μ μλ€λ κ²μ΄λ€. νΉμ μ¬μ© μ¬λ‘μ μꡬ μ¬νκ³Ό μΌμΉνλ μ νν νλ‘ν μ½$($μ: μΈμ κ²ν , μΆκ° 컨ν μ€νΈ κΈ°λ° λλ κ³ λΆλ΄ μ¬μ© λͺ¨λ λ°©μ§$)$κ³Ό ν¨κ» νΉν κ³ λΆλ΄ μν©μμμμ LMμ μΆλ ₯μ μ¬μ©ν λ μΈμ¬ν μ£Όμλ₯Ό κΈ°μΈμ¬μΌ νλ€.
μ€μ μ΄μμμ GPT-4λ μ΄μ μ λͺ¨λΈλ€μ λΉν΄ μλΉν κ°μλ hallucinationμ 보μ¬μ€λ€. GPT-4λ λ΄λΆ μ λμ μ¬μ€μ± νκ°μμ GPT-3.5λ³΄λ€ 40% μ λ λμ μ±λ₯μ 보μ¬μ€¬λ€.
λν μ λμ μΌλ‘ μ νλ λΆμ νν statementμ μΈνΈμ μ¬μ€μ λΆλ¦¬νκΈ° μν λͺ¨λΈμ λ₯λ ₯μ νκ°νλ TruthfulQA μΈλΆ λ²€μΉλ§ν¬μμ νκ°λ₯Ό μ§ννμλ€. TruthfulQAμ μ§λ¬Έλ€μ ν΅κ³μ μΌλ‘ λ리λ μ¬μ€μ μΌλ‘ λΆμ νν λλ΅μ μ¬μ©νμ¬ μ§μ΄ μ΄λ£¨μ΄μ Έμλ€.
μ΄ taskμμ GPT-4 base modelμ GPT-3.5λ³΄λ€ μ΄μ§ λμ μ±λ₯μ 보μ¬μ€¬λ€; νμ§λ§ RLHFλ₯Ό μ¬μ©νμ¬ νλ ¨μ μ§ννλ ν° μ°¨μ΄κ° λ¬λ€. μλμ μμλ€μ μ‘°μ¬ν΄λ³΄λ©΄ GPT-4λ μΌλ°μ μΈ μλ΅μ μ ννλ κ²μ κ±°λΆνμ§λ§, μμ§ μ¬μν λν μΌμ λμΉλ λ¬Έμ μ μ κ°μ§κ³ μλ€.
λͺ¨λΈμ μΆλ ₯μλ λ§μ νΈν₯λ€μ΄ μμ μ μλ€. μ΄μ λν΄ μ¬λ¬κ°μ§ νλ‘κ·Έλ μ€λ₯Ό λ§λ€μ΄ λμΌλ μμ§λ ν΄μΌν κ²μ΄ λ§λ€.
GPT-4λ μΌλ°μ μΌλ‘ νμ΅λ λ°μ΄ν°$($2021λ 9μ$)$ μ΄νμ μΌμ΄λ μ¬κ±΄λ€μ λν΄μλ μ§μμ΄ λΆμ‘±νκ³ , κ²½νμΌλ‘λΆν° νμ΅νμ§λ μλλ€. μ΄λ κ°λ κ°λ¨ν μΆλ‘ μ€λ₯λ₯Ό λ§λ€μ΄λ΄λλ° λ무 λ§μ μμμμ λ₯λ ₯μ λ°ννμ§ λͺ»νλ κ² κ°κ±°λ μ¬μ©μμ λͺ λ°±ν κ±°μ§ μ§μ μ λ°μλ€μ΄λ λ° μ§λμΉκ² μκΈ° μ¬μ΄ κ² κ°λ€. κ·Έλ¦¬κ³ κ°λμ GPT-4κ° μ¬λμ΄ κ·Έλ¬λ κ²μ²λΌ μμ±νλ μ½λμ μ·¨μ½μ μ λμ νλ κ²κ³Ό κ°μ΄ μ΄λ €μ΄ λ¬Έμ μ λν΄μ μ€ν¨νλ λͺ¨μ΅μ 보μ¬μ€λ€.
GPT-4λ λν μμΈ‘μμ μλͺ»λ μλ μλλ°, μ€μκ° λ°μν κ² κ°μ λ λλΈ μ²΄ν¬ μμ μ νμ§ μκΈ° λλ¬Έμ΄λ€. ν₯λ―Έλ‘κ²λ, base pre-trained λͺ¨λΈμ κ³ λλ‘ λ³΄μ λμ΄ μλ€$($λ΅μ λν μμΈ‘ μ λ’°λλ μΌλ°μ μΌλ‘ μ λ΅ νλ₯ κ³Ό μΌμΉν¨$)$. νμ§λ§ νμ¬μ ννμ΅ νλ‘μΈμ€λ₯Ό ν΅ν΄ 보μ μ μ€μ΄λ€κ² λλ€.
Risks & Mitigations
pre-train λ°μ΄ν°μ μ ν λ° νν°λ§, νκ° λ° μ λ¬Έκ° μ°Έμ¬, λͺ¨λΈ μμ κ°μ , λͺ¨λν°λ§ λ° μ§νμ ν¬ν¨ν λ Έλ ₯μ ν΅ν΄ νμ΅ μμλΆν° GPT-4λ₯Ό λ°λ³΅νμ¬ λ μμ νκ³ μ λ ¬λκ² νμλ€.
GPT-4λ μ΄μ μ λͺ¨λΈλ€μ²λΌ ν΄λ‘μ΄ μ‘°μΈ, λ²κ·Έμ± μ½λ, λΆμ νν μ 보λ€μ μμ±νλ 리μ€ν¬λ₯Ό κ°μ§κ³ μμλ€. νμ§λ§ GPT-4μ μΆκ°μ λ₯λ ₯μ μλ‘μ΄ λ¦¬μ€ν¬μ μ§λ©΄νκ² νμλ€. μ΄λ¬ν 리μ€ν¬μ μ λλ₯Ό μ΄ν΄νκΈ° μν΄ AI alignment risk, μ¬μ΄λ² μν리ν°, λ°μ΄μ€λ¦¬μ€ν¬, μ λ’°λ λ° μμ μ±, μΈκ³μ 보μμ λλ©μΈμΌλ‘λΆν° 50λͺ μ΄ λλ μ λ¬Έκ°λ₯Ό κ³ μ©ν΄μ λͺ¨λΈμ μ λμ μΌλ‘ νκ°νμλ€. μ΄λ€μ λ°κ²¬μ νΉν νκ°ν μ λ¬Έ μ§μμ΄ νμν κ³ μν μμμμ λͺ¨λΈ λμμ ν μ€νΈν μ μκ² ν΄μ£Όμλ€. μ΄λ¬ν μ λ¬Έκ°λ€λ‘λΆν° μ»μ λ°μ΄ν°μ νΌλλ°±μ λͺ¨λΈμ μνμν€κ³ ν₯μμν€κΈ° μν΄ μ¬μ©λμλ€. μλ₯Ό λ€μ΄, GPT-4μ μνν νν λ¬Όμ§μ μ΄λ»κ² ν©μΉλμ§μ λν μμ²μ κ±°λΆνλ λ₯λ ₯μ ν₯μμν€κΈ° μν΄ μΆκ°μ μΈ λ°μ΄ν°λ₯Ό μμ§νμλ€.
GPT-4λ RLHF νμ΅ μ€μ μΆκ°μ μΈ safety reward signalμ μ¬μ©νμ¬ λͺ¨λΈμ΄ μ΄λ¬ν λ΄μ©μ λν μꡬλ₯Ό κ±°λΆνλλ‘ νμ΅μν΄μΌλ‘μ¨ ν΄λ‘μ΄ μΆλ ₯μ μ€μ΄λλ‘ νμλ€. 보μμ μμ κ΄λ ¨ ν둬ννΈμμ μμ κ²½κ³ λ° μλ£ μ€νμΌμ νλ¨νλ GPT-4 zero-shot λΆλ₯κΈ°μ μν΄ μ 곡λλ€. μ μ¦λ μꡬλ₯Ό κ±°λΆνλ κ²μΌλ‘λΆν° λͺ¨λΈμ 보νΈνκΈ° μν΄ λ€μν μΆμ²μμ λ€μν λ°μ΄ν°μ μ μμ§νκ³ safety reward signalμ νμ©λκ³ νμ©λμ§ μμ μΉ΄ν κ³ λ¦¬μ μ μ©νμλ€.
GPT-4μ μν$($mitigation$)$μ GPT-3.5μ λΉν΄ GPT-4μ μμ μ±μ μλΉν ν₯μμμΌ°λ€. GPT-3.5μ λΉν΄ νμ©λμ§ μλ μ½ν μΈ μ λν μμ²μ λͺ¨λΈμ΄ μλ΅νλ κ²½ν₯μ΄ 82% κ°μνμΌλ©°, GPT-4λ μ μ± μ λ°λΌ λ―Όκ°ν μμ²$($μ: μνμ μ‘°μΈ λ° μν΄$)$μ 29% λ μμ£Ό μλ΅νλ€.
μ λ°μ μΌλ‘ model-levelμ κ°μμ λμ νλμ μ λνλ μ΄λ €μμ μ¦κ°μν€μ§λ§ κ·Έλ κ² νλ κ²μ μ¬μ ν κ°λ₯νλ€. μΆκ°μ μΌλ‘, μ¬κΈ°μλ μ΄μ© κ°μ΄λλΌμΈμ μλ°νλ μ½ν μΈ λ₯Ό μμ±νκΈ° μν 'jailbreak'κ° μμ§ μ‘΄μ¬νλ€. AI μμ€ν μ 'κ° ν ν° μνλ'κ° μ¦κ°νλ κ²μ²λΌ μ΄ κ°μμμ λ§€μ° λμ μμ€μ μ λ’°λλ₯Ό λ¬μ±νλλ° λ§€μ° μ€μν΄μ§ κ²μ΄λ€. μ§κΈμ μ μ© λͺ¨λν°λ§κ³Ό κ°μ λ°°ν¬ μκ° μμ κΈ°μ λ‘ μ΄λ¬ν μ ν μ¬νμ 보μνλ κ²μ΄ μ€μνλ€.
Training Process
μ΄μ μ GPT modelλ€κ³Ό λ§μ°¬κ°μ§λ‘ GPT-4 base modelμ λ¬Έμμμ λ€μ λ¨μ΄λ₯Ό μμΈ‘νκΈ° μν΄ νμ΅λμκ³ , λμ€μκ² κ³΅κ°λ λ°μ΄ν° λΏλ§ μλλΌ λΌμ΄μΌμ€λ₯Ό κ°μ§κ³ μλ λ°μ΄ν°λ μ¬μ©νμ¬ νμ΅λμλ€. λ°μ΄ν°λ μν λ¬Έμ μ λν μ ννκ³ μλͺ»λ μ루μ , μ½νκ³ κ°λ ₯ν μΆλ‘ , μκΈ° λͺ¨μμ μ΄κ³ μΌκ΄λ μ§μ μ ν¬ν¨νκ³ λ€μν μ΄λ°μ¬λ‘κΈ°μ μμ΄λμ΄λ₯Ό λνλ΄λ μΉ κ·λͺ¨μ λ°μ΄ν° λͺ¨μμ΄λ€.
κ·Έλμ μ§λ¬Έμ μ¬μ©νμ¬ promptλ₯Ό ν λ, base modelμ μ μ μ μλμλ κ±°λ¦¬κ° λ¨Ό λ€μν λ°©μμΌλ‘ μλ΅ν μ μλ€. κ°μ΄λλΌμΈμμ μ μ μ μλλ₯Ό μ¬μ©νμ¬ μ λ ¬νκΈ° μν΄ λͺ¨λΈμ νΉμ±μ RLHFλ₯Ό μ¬μ©νμ¬ fine-tune νμλ€.
λͺ¨λΈμ λ₯λ ₯μ μ£Όλ‘ pre-training κ³Όμ μ€μμ μ€λ κ²μ²λΌ 보μλ€. RLHFλ exam performanceλ₯Ό ν₯μμν€μ§λ μμ§λ§, λͺ¨λΈμ μ‘°μ’ μ post-training κ³Όμ μΌλ‘λΆν° μ¨λ€. base modelμ μ§λ¬Έμ λ΅ν΄μΌ νλ€λ κ²μ μκΈ° μν΄ prompt engineeringμ΄ νμνλ€.
Predictable scaling
GPT-4μ ν° μ΄μ μ μμΈ‘ κ°λ₯νκ² νμ₯λλ λ₯λ¬λ μ€νμ μλ κ²μ΄λ€. μ£Όμν μ΄μ λ GPT-4 κ°μ΄ λ§€μ° ν° νμ΅μ κ΄λ²μν model-specific tuningμ νλλ° μ€ν κ°λ₯νμ§ μλ€. μ΄λ₯Ό μν΄ μ¬λ¬ κ·λͺ¨μ κ±Έμ³μ μμΈ‘ κ°λ₯ν νΉμ±μ κ°μ§λ μΈνλΌμ μ΅μ νλ₯Ό κ°λ°νμλ€. μ΄ scalabilityλ₯Ό μ μ¦νκΈ° μν΄, λμΌν λ°©λ²λ‘ μ μ¬μ©νμ§λ§ 10,000λ°° μ μ μ»΄ν¨ν μ μ¬μ©νμ¬ νλ ¨λ λͺ¨λΈμμ μΈμ½νμ¬ λ΄λΆ μ½λλ² μ΄μ€$($νλ ¨ μΈνΈμ μΌλΆκ° μλ$)$μμ GPT-4μ μ΅μ’ μμ€μ μ¬μ μ μ ννκ² μμΈ‘νμλ€.
μ΄μ νμ΅$($loss$)$ μ€μ μ΅μ ννλ λ©νΈλ¦μ μ ννκ² μμΈ‘ν μ μμΌλ―λ‘ λ ν΄μ κ°λ₯ν λ©νΈλ¦μ μμΈ‘νκΈ° μν λ°©λ²λ‘ μ κ°λ°νκΈ° μμνλ€. μλ₯Ό λ€μ΄ μ»΄ν¨ν μ΄ 1,000λ°° λ μ μ λͺ¨λΈμμ μΈμ½νμ¬ HumanEval λ°μ΄ν°μ μ μλΈμ μμ pass rateλ₯Ό μ±κ³΅μ μΌλ‘ μμΈ‘νμλ€.
μμ§ λͺ κ°μ λ₯λ ₯λ€μ μμΈ‘νκΈ° μ΄λ €μ λ€. μλ₯Ό λ€μ΄ Inverse Scaling Prizeλ λͺ¨λΈμ κ³μ°λμ΄ μ¦κ°ν μλ‘ μ νλλ λ©νΈλ¦μ μ°ΎκΈ° μν λ°©λ²μΈλ°, hindsight neglectλ μ΄κ²μ μΉμ μ€ νλμ΄λ€. λλ€λ₯Έ μ΅κ·Όμ κ²°κ³Όμ κ°μ΄ GPT-4λ νΈλ λλ₯Ό λ€μ§μλ€.
λ―Έλμ λ¨Έμ λ¬λ λ₯λ ₯μ μ ννκ² μμΈ‘νλ κ²μ μ μ¬μ μΈ μν₯μ λΉν΄ μΆ©λΆν κ΄μ¬μ λ°μ§ λͺ»νκ³ μλ μμ μ±μ μ€μν λΆλΆμ΄λ€. λ Έλ ₯μ κ·λͺ¨λ₯Ό λλ €μ μ¬νμ λ λμ λ―Έλ μμ€ν μμ 무μμ κΈ°λν μ μλμ§μ λν μ§λλ₯Ό μ 곡ν΄μ£Όλ λ°©λ²μ κ°λ°νκ³ , μ΄κ²μ΄ μ΄ λΆμΌμμ μΌλ°μ μΈ λͺ©νκ° λκΈΈ λ°λλ€.
My Opinion
GPT-1μ΄ μΈμμ μ²μ λμμ λλΆν°, GPT-2, GPT-3, GPT-3.5 κ·Έλ¦¬κ³ GPT-4κ° λμ€κΈ°κΉμ§ λͺ¨λ νλ κ°μ΄ μΆμν λλ§λ€ μμ²λ νμ λ₯Ό λΆλ¬μΌμΌμΌ°λ€. μ΄ μμ²λ μ£Όλͺ©μ κ±Έλ§κ² κ° λ²μ μ GPTλ€μ μμ²λ μ±λ₯μ 보μ¬μ£ΌκΈ°λ νμλ€. νΉν GPT-3.5λ₯Ό μ¬μ©ν ChatGPTμ μΆμλ μ λ§μ΄μ§ μΈκ°μ μ£Όλͺ©μ λͺ¨λ λμλ€. μλ§μ GPT μ€μμλ ChatGPTκ° μ΄λ¬ν μ£Όλͺ©μ λκ² λ μ΄μ λ‘λ μ΄μ μ GPTλ€κ³Ό λ¬λ¦¬ λ―Όκ°μΈμκ²λ 곡κ°κ° λμκΈ° λλ¬Έμ΄λΌκ³ μκ°νλ€. λΉμ°ν λ―Όκ°μΈμκ²λ 곡κ°κ° λλ λꡬλ ν κ±° μμ΄ μμ λ‘κ² μ¬μ©ν ν κ³ κ·Έλ κ² λλ μ λͺ ν΄μ§λ 건 μκ°μ λ¬Έμ λΌκ³ μκ°νλ€. μ¬μ§μ΄ ChatGPTκ° μ’ μ’μκ°? μ§μ§ μ λ‘ μμ μ λλ‘ λ°μ ν LMμ΄λ μ¬λλ€μκ²λ λ무λλ μ κΈ°νκ³ ν₯λ―Έλ‘μ μ κ²μ΄λΌκ³ μκ°νλ€. νμμ‘°μ°¨λ μ²μ ChatGPTλ₯Ό μ¬μ©νμ λ μ§μ§ λ°€μ μ μ λλ‘ μ¬λ―Έλκ² μ¬μ©νλ κ² κ°λ€.
GPT-4μ Technical ReviewμΈλ°λ μ΄μ GPTλ€μ λν μ΄μΌκΈ°λ₯Ό μ΄λ κ² κΈΈκ² νλ μ΄μ λ λ€λ¦ μλ μμ¬μμ΄ μ§κ² λ¨κΈ° λλ¬Έμ΄λ€. λΆλͺ ν GPT-4λ μ΄μ λͺ¨λΈλ€κ³Όλ λΉκ΅ν μ μμ μ λλ‘ κ³ λλ‘ λ°μ ν LMμ΄λΌλ κ²μ νμ€νλ€. μ¬μ§μ΄ μ΄μ λͺ¨λΈλ€μμλ ν μ€νΈ λ°μ΄ν°λ§μ μ£Όλ‘ λ€λ€μ§λ§ GPT-4λ ν μ€νΈ λ°μ΄ν°μ μ΄λ―Έμ§ λ°μ΄ν°, λμ ν¨κ» λ€λ£° μ€ μλ multimodel modelμΈλ°λ€κ° μ±λ₯λ μ΄μ λ³΄λ€ ν¨μ¬ μμΉνλ€. μ²μμλ λ³νΈμ¬ μκ²©μ¦ μνμμ μμ 10%μ μ±μ μ λ°μλ€λ μ¬μ€μ λ³΄κ³ μΆ©κ²©μ λ°μλλ° μ΄λ―Έμ§κ° μ£Όμ΄μ‘μ λ κ·Έ μ΄λ―Έμ§λ₯Ό ν΄μνκ³ μ²λ¦¬νλ λͺ¨μ΅μ λ³΄κ³ λ€μ ν λ² μΆ©κ²©μ λ°μλ€. μ΄λ λ― GPT-4λ μ λ§ μμ²λ λ°μ μ΄ λ§λ€κ³ μκ°νλ€. νμ§λ§ κ·ΈλΌμλ λΆκ΅¬νκ³ λ무λλ μμ¬μ λ μ μ GPT-4μ λ§μ λΆλΆμ΄ μμ§ λ² μΌμ΄ μΈμ¬μλ€λ μ μ΄λ€.
GPT-4κ° 2023λ 3μ 14μΌμ μ²μ 곡κ°λμ λ μ€λ λ λ§μμ μκ³ μ¬λλ€μ 리뷰λ₯Ό μ°Ύμ보λ λͺ¨λ 곡ν΅μ μΌλ‘ νλ λ§μ΄ μμλ€. λΆλͺ ν μ±λ₯μ΄ μ’μμ§ κ²μ λ§μΌλ λ무 λ§μ λΆλΆμ΄ λ² μΌμ μΈμ¬μμ΄μ μμ§ νλ¨νκΈ° μ΄λ₯΄λ€λ κ²μ΄μλ€. Technical Reivewλ₯Ό μ½κ³ λλ μ μ¬λλ€μ΄ μ΄λ¬ν λ§μ νμλμ§ μ΄ν΄ν μ μμλ€. μ λ§μ΄μ§ μ£Όμ΄μ§ μ λ³΄κ° λ무 κ΅νμ μ΄μλ€! λͺ¨λΈμ ν¬κΈ°λ λ°νμ§μ§ μμκ³ , λͺ¨λΈμ μ¬μ©λ λ°μ΄ν°μ μ μ‘°μ°¨λ 곡κ°λμ§ μμκΈ° λλ¬Έμ΄λ€. μ΄ Technical Reviewμμλ λͺ¨λΈμ μ¬μ©λ λ°©λ²λ³΄λ€λ λͺ¨λΈμ taskμ μ μ©νμμ λμ μ±λ₯κ³Ό κ²°κ³Όλ€ μμ£Όλ‘ λ³΄μ¬μ£Όκ³ λͺ¨λΈμ μμ μ± μ²΄ν¬ λ° μμΈ‘ κ°λ₯μ±μ μ΄μ μ λμλ€. μ΄λ° μ μμ GPT-4μ Technical Reviewλ μ§μ μμ¬μμ΄ λ¨λ κ² κ°λ€. λ¬Όλ‘ μ΄κ±΄ ν μ¬λμ μ견μ λΆκ³Όνμ§λ§ μ€λ λ λ§μμ μκ³ μ½μλ κ²μ λΉνλ©΄ μ΄μ§μ μμ¬μμ΄ λ¨λ κ² νμ€μΈ κ² κ°λ€.
κ·Έλ λ€κ³ ν΄μ GPT-4μ μ μ μ΄ λ¬΄μλ°μμΌ νλ€λ μλ―Έλ μλλ€. LMμμ multimodal modelμ μ±κ³΅μ μΈ μ±λ₯μΌλ‘ ꡬνν κ²μ μ λ§μ΄μ§ λ°μ λ°μ λ§λ νλ€κ³ μκ°νλ€. μ€ν κ²°κ³Όλ€μ μ΄ν΄λ³΄λ μ§μ§λ‘ μ κΈ°νκ³ λλ¨νλ€λΌλ μκ°μ΄ μ λ‘ λ€μλ€. λ°λΌμ GPT-4μ λν΄μ κ΄μ¬μ΄ μκΈ°κ³ κΆκΈν μ μ΄ μλ€λ©΄ ν λ² μ¦μ Technical Reviewλ₯Ό μ½μ΄λ³΄λ κ²μ μΆμ²νλ€. νμ§λ§, μ΄λ ν λ°©λ²μ μ¬μ©ν΄μ μ΄λ κ² λ°μ΄λ λͺ¨λΈμ λ§λ€μμκΉ λΌλ μλ¬Έμ κ°μ§κ³ Technical Reviewλ₯Ό μ½λ κ²μ λ³λ‘ μΆμ²νμ§ μλλ€.
κΈ΄ ν¬μ€νΈλ₯Ό λκΉμ§ μ½μ΄μ£Όμ μ κ°μ¬νκ³ μμΌλ‘λ λ μ’μ κΈλ€λ‘ μ°Ύμλ΅κ² μ΅λλ€!! π€
μΆμ²
https://openai.com/research/gpt-4
https://arxiv.org/abs/2303.08774
'Paper Reading π > Natural Language Processing' μΉ΄ν κ³ λ¦¬μ λ€λ₯Έ κΈ
Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks λ Όλ¬Έ 리뷰 (0) | 2023.04.03 |
---|---|
Data Augmentation methods in NLP (0) | 2023.03.29 |
BigBird: Transformers for Longer Sequences λ Όλ¬Έ 리뷰 (0) | 2023.03.25 |
Sparse Transformers: Generating Long Sequence with Sparse Transformers λ Όλ¬Έ 리뷰 (0) | 2023.03.22 |
GPT-3: Language Models are Few-Shot Learners λ Όλ¬Έ 리뷰 (0) | 2023.03.21 |