Why I read this paper?
fake news detection ๊ณผ์ ์์ ๋ชจ๋ธ์ด ์ฃผ์ด์ง ๋ฐ์ดํฐ์ ์ด๋ ํ ๋จ์ด ๋๋ ๋ฌธ์ฅ์ ๋ํด ์ค์์ฑ์ ๋ณด์ด๋์ง ํ์ ํ๊ธฐ ์ํด CAM๊ณผ Grad-CAM์ ํ์ฉํ์ฌ Visualization์ ์งํํ ๋ถ๋ถ์ ์๊ธฐ ์ํด. Grad-CAM์ ์ด๋ฏธ์ง์ ์ ์ฉํ๊ธฐ ์ํด ๊ฐ๋ฐ๋ ๊ธฐ์ ์ธ๋ฐ ์ด๋ฅผ ์ด๋ป๊ฒ text data์ ์ ์ฉํ๋์ง ๊ถ๊ธํด์ ์ฝ๊ฒ ๋์๋ค.
Table of Contents
1. Introduction
2. Methodology
3. Experiments & Results(์ผ์ ๋ถ๋ถ๋ง)
4. Conclusion
1. Introduction
์ด ๋ ผ๋ฌธ์์๋ representation space์ ํ๋ฆฌํฐ๋ฅผ ์๋ก ๋ค๋ฅธ ๊ฐ์ง์ ์ง์ง ๋ด์ค ๋ฐ์ดํฐ์ ์ ๋ํ linear separability์ ๋ฉด์์ ๋ถ์์ ํ์๋ค. ๊ทธ๋ฆฌ๊ณ classification model์ ํด์ ๋ฅ๋ ฅ์ ์ถ๊ฐ์์ผ์ฃผ๊ธฐ ์ํด ์์ ๋ Class Activation Mapping(CAM)์ ์ ์ํ์๋ค. ์์ ๋ CAM์ prediction์ ์ฃผ์ํ๊ฒ ์ฌ์ฉ๋ ๊ฐ๊ฐ์ word token์ ๋ํ CAM ๊ฐ์ ์ ๊ณตํ๋ค. ์ด๋ฅผ ๋ชจ๋ ์ข ํฉํ ๊ฒฐ๊ณผ, ํ์ต ๊ฐ๋ฅํ ์ ํ ๋ ์ด์ด๋ฅผ ์น์ BERT ๋ชจ๋ธ์ CAM๊ณผ ํธํ๋๋ฉด์ ๊ฐ๋ ฅํ ์ฑ๋ฅ์ ๋ฌ์ฑํ๊ธฐ์ ์ถฉ๋ถํจ์ ๋ณด์ฌ์คฌ๋ค.
fake news detection process๋ ๋ค์๊ณผ ๊ฐ๋ค.
- 1) tokenization
- ํ ํฐํ ๊ณผ์ ์์๋ ์ ์ฒ๋ฆฌ ๊ณผ์ ์ ๊ฑฐ์น๋๋ฐ, ์ฌ๊ธฐ์๋ ๋ฌธ์ฅ์ ๋จ์ด ๋จ์๋ก ์ชผ๊ฐ๋ ๊ฒ, ๋ถ์ฉ์ด๋ฅผ ์ ๊ฑฐํ๋ ๊ฒ, ๊ทธ๋ฆฌ๊ณ ์ด๊ฐ์ ์ถ์ถํ๋ ๊ฒ๋ค์ด ํฌํจ๋๋ค.
- 2) vectorization
- ํ ํฐํ๋ฅผ ๊ฑฐ์น ๋ฐ์ดํฐ์ ๋ํด ๋ฒกํฐํ๋ฅผ ์งํ์์ผ์ฃผ๋๋ฐ, ๋ณดํต ์นด์ดํธ ๊ธฐ๋ฐ ๋ฐฉ์์ธ TF-IDF ๋๋ pre-trained ๋ word embedding matrix์ธ Word2Vec, GloVe, BERT ๋ฑ์ด ์ฌ์ฉ๋๋ค. ์ด ๋ชจ๋ธ๋ค์ ์ฑ๋ฅ์ BERT๊ฐ ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์ฃผ๊ณ , ๊ทธ ๋ค๋ฅผ Word2Vec๊ณผ GloVe๊ฐ ์๊ณ , TF-iDF๊ฐ ๊ทธ ๋ค๋ฅผ ๋ฐ๋ฅธ๋ค. ๊ทธ๋์ ์ด ๋ ผ๋ฌธ์์๋ ์ด์ ๊ฐ์ ์์๋ก ์ฑ๋ฅ์ ๋ณด์ฌ์ค ๊ฒ์ด๋ผ๊ณ ๊ฐ์ ํ๊ณ , ์ด๋ฅผ ์ฐ๊ตฌ ๋ด์ฉ์์ ๋ณด์ฌ์ค๋ค
- 3) classification model
- ์์ ๊ณผ์ ์ ๊ฑฐ์น ๋ฐ์ดํฐ์ ๋ํด classification model์ ์ด์ฉํ์ฌ fake news detection์ ์งํํ๋ ๊ฒ์ด๋ค. ํ์ฌ ์งํ๋๋ ์ฐ๊ตฌ๋ค์ ์ดํด๋ณด๋ฉด ์์์ ์ฌ์ฉ๋๋ method๋ค์ ์ด์ฉํ์ฌ combination์ ๋ง๋ค์ด ์ฌ์ฉํ๋ค.
์ง๊ธ๊น์ง์ ์ฐ๊ตฌ์์๋ ๋ด์ค์ ์ด๋ ํ ์ ์ด ์ด ๋ด์ค๋ฅผ fake news ๋๋ real news๋ก ๋ถ๋ฅํ๋์ง ์ ์ ์์๋ค. ํ์ง๋ง, ์ด ๋ ผ๋ฌธ์์๋ CAM์ ์ฌ์ฉํ์ฌ ์ด ๋ฌธ์ ๋ฅผ ๊ฐ๋จํ๊ฒ๋๋ง ํด๊ฒฐํด ๋ณด์๋ค.
์ด ๋ ผ๋ฌธ์ ์์ฝํ๋ฉด ๋ค์๊ณผ ๊ฐ๋ค.
- classification ์ฑ๋ฅ์ ๋ํ embedding space์ ํ๋ฆฌํฐ ๋ถ์
- CAM์ ํ์ฉํ real and fake news์ ๊ทผ๋ณธ์ ์ธ ํจํด ๋ถ์
- simple BERT๋ฅผ ํ์ฉํ ๋์ ์ฑ๋ฅ๊ณผ ํด์ ๊ฐ๋ฅ์ฑ
์ด ๋ ผ๋ฌธ์์์ Background์ Related Work๋ ๋ค์๊ณผ ๊ฐ๋ค.
- Representation Space, Interpretability, Previous Fake News Detection Methods,
2. Methodology
2-1. Models
๋ค์์ ๊ทธ๋ฆผ 1์์๋ representation space์ ํ๋ฆฌํฐ์ ๋ํ ๋ถ์๊ณผ fake news detection์ ์ํ classification model์ ๋ณด์ฌ์ฃผ๊ณ ์๋ค.
๊ทธ๋ฆผ 1์ (a)๋ฅผ ๋ณด๋ฉด Z์ TF-iDF ๊ฐ์ ์ด๊ฒ์ feature vector์ ์ด๋ ํ semantic๊ณผ temporal dependency๋ฅผ ๊ฐ์ง๊ณ ์์ง ์๋ค. ๊ทธ๋ฆผ 1์ (b)๋ฅผ ๋ณด๋ฉด Z๋ ์๋ก ๋ค๋ฅธ ๋ ๋จ์ด ๊ฐ์ ๊ด๊ณ๋ฅผ ํ์ ํ ์ ์๋ relational semantic์ ๊ฐ์ง๊ณ ์๊ธฐ ๋๋ฌธ์ ์ด์ ์ Z์ TF-iDF๋ณด๋ค ๋ ๋์ representation์ ์ป์ ์ ์๋ค. ํ์ง๋ง, Z๋ GAP layer์ ์ํด ์ค์ด๋ค ์ ์๊ธฐ ๋๋ฌธ์, Z'์ ์ด๋ ํ temporal dependency๋ฅผ ์ธ์ฝ๋ ํ์ง ์์๋ค. ๊ทธ๋ฆผ 1์ (c)๋ฅผ ๋ณด๋ฉด Z์~์ ์๋ ์๋ฒ ๋ฉ์ ํฌํจ์ํฌ ๋ฟ๋ง ์๋๋ผ, positional embedding๊ณผ segment embedding ๋ํ ํฌํจ์ํค๊ณ , BERT์ Transformer์ ์ํด ์ฐธ์กฐ๋๋ค. ๋ฐ๋ผ์ Z'์B๋ relational semantic๋ฟ๋ง ์๋๋ผ global temporal dependency ๋ํ ์ธ์ฝ๋ ํ๋ค. ๊ทธ๋์ representation์ ํ๋ฆฌํฐ๋ Z'์B, Z', Z์TF-iDF ์์ผ๋ก ๋ํ๋ผ ์ ์๋ค. ๋ง์ง๋ง์ผ๋ก, ๊ทธ๋ฆผ 1์ (d)๋ ์ด ๋ ผ๋ฌธ์์ classification model์ด ์ฌ์ฉํ์๋ค.
2-2. CAM-based Interpretation Method
CAM์ ์๋ CNN์ GAP๊ณผ linear layer์ ์ ์ฉ๋๊ธฐ ์ํด ๋ง๋ค์ด์ก๊ธฐ ๋๋ฌธ์, ์ด ๋ ผ๋ฌธ์์๋ ์ด ์์์ ๋ง์ถ๊ธฐ ์ํด ๊ทธ๋ฆผ 1์ (d)์ฒ๋ผ BERT์ ๋ค์ GAP layer์ linear layer์ ์ถ๊ฐํ์๋ค. CAM์ ์์์ ๋ค์๊ณผ ๊ฐ๋ค. CAM์ ๋ํ ์ค๋ช ์ ์ฌ๊ธฐ๋ฅผ ์ฐธ๊ณ ํ๊ธธ ๋ฐ๋๋ค.
์ ์์์ ์(1)์ ํ๊ธฐ๋ฒ์ ์(2)๊ณผ ๊ฐ์ด ๋ชจ๋ธ์ ๋ง๊ฒ ์์ ํ์๋ค. ๊ตฌํ๊ณผ ๊ด๋ จํ์ฌ (x, y) ๊ณต๊ฐ ์ฐจ์ ๋์ l ๊ณต๊ฐ ์ฐจ์์ ์ง์ ํ๊ณ ์ฑ๋ ์ฐจ์ ๋์ D ์ฐจ์์ ์ง์ ํ๋ค๋ ์ ์ ์ ์ธํ๊ณ ๋ ๋ชจ๋ ๊ฒ์ด ๋์ผํ๊ฒ ์ ์ง๋๋ค.
3. Experiments & Results
3-1. Experimental Setup
- Datasets: Kaggle์ "fake and real news dataset" ์ฌ์ฉ. ๋ฐ์ดํฐ์ ์ ์ฌ๊ธฐ์ ๊ตฌํ ์ ์๋ค.
- Tokenizers and Embedding Matrics: ๊ทธ๋ฆผ 1์ (a), TF-iDF vectorizer์๋ scikit-learn ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ tokenizer๊ฐ ์ฌ์ฉ๋์๊ณ , ๊ทธ๋ฆผ 1์ (b), Word2Vec๊ณผ GloVe์๋ nltk.tokenize๊ฐ ์ฌ์ฉ๋์๊ณ , BERT์๋ BertTokenizer๊ฐ ์ฌ์ฉ๋์๋ค. ๊ทธ๋ฆฌ๊ณ ๊ฐ๊ฐ์ embedding matrix์๋ ๋ค์์ด ์ฌ์ฉ๋์๋ค.
Word2Vec: word2vec-google-news-300
GloVe: glove-wiki-gigaword-300
BERT: hugging face ์ฌ์ฉ๋จ
- Training Settings: optimizer๋ก๋ AdamW(lr=0.001, batch_size=128, weight decay={0.1, 0.001, 0.00001}, epochs={1, 2})๊ฐ ์ฌ์ฉ๋์๋ค. ์ค๊ดํธ ์์ ๊ฐ์ ๊ทธ์ค ๊ฐ์ฅ ์ข์ ๋งค๊ฐ๋ณ์๊ฐ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๊ณ ํ๋ ๋ฐ ์ฌ์ฉ๋จ์ ๋ํ๋ธ๋ค. learning rate shceduler๋ก๋ cosine learning rate decay๊ฐ ์ฌ์ฉ๋์๋ค.
3-2. Results and Discussions
Analysis of Representation Space: PCA and Linear Evaluation
๋ชจ๋ ์คํ์ ์์๋ค์ ํ 1์ ์์ฝ๋์ด ์๋ค. ๊ทธ๋ฆฌ๊ณ 2์ฐจ์ PC ๊ณต๊ฐ์์์ representation์ ์๊ฐํ๋ ๊ทธ๋ฆผ 2์ ๋ํ๋์๋ค.
๊ทธ๋ฆผ 2๋ฅผ ๋ณด๋ฉด e, f, g๋ PCA ์๊ฐํ์์ ์ข์ ํด๋ฌ์คํฐ๋ง์ ๋ณด์ฌ์ฃผ์ง๋ง ๋ ํด๋ฌ์คํฐ์๋ ์ ํ ๋ถ๋ฆฌ์ฑ์ ๋ฐฉํดํ๋ ์ผ๋ถ ๊ฒน์น๋ ์์ญ์ด ์์ต๋๋ค. ๊ฒฐ๊ตญ์ BERT์ ๋ชจ๋ ์๋ฒ ๋ฉ ๊ฐ์ ์ค ๋ชจ๋ธ์ด ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๋ณด์ฌ์คฌ๋๋ฐ, ๊ทธ ์ด์ ๋ contextualized word embedding์ด BERT์ transformer encoder์์ ์ด๋ฃจ์ด์ก๊ธฐ ๋๋ฌธ์ด๋ผ๊ณ ํ ์ ์๋ค.
Analysis of Representation Space: Z' vs. Z'์B
Z'๊ณผ Z'์B์ ๊ฐ์ฅ ํฐ ์ฐจ์ด์ ์ contextualization์ด๋ค. ์๋ํ๋ฉด contextualization์ transformer์ self-attention์ ํต๊ณผํ ๋ ์๊ธฐ๋๋ฐ, ๋ฐ๋ผ์ Z'์B์ token์ Z'์ ๋นํด ๋ค๋ฅธ tokens์ semantic relations์ ๋ํด ๋ ๋์ ์๊ด์ฑ์ ๊ฐ์ง ์ ์๋ค. ์ด๋ฅผ ์ฆ๋ช ํ๊ธฐ ์ํด ์์๋ก ํ๋์ ๋ฌธ์ฅ์ ๋ฝ์์ ์๊ฐํ๋ฅผ ํ์๋ค. ๊ทธ ๊ฒฐ๊ณผ๊ฐ ๋ค์์ ๊ทธ๋ฆผ 3์ด๋ค.
๊ทธ๋ฆผ 3์์ ์ฌ๋ฌ ๊ฐ์ง ํจํด์ ์ฐพ์ ์ ์๋๋ฐ, 1) Z'์B์์ ์ ๋ฐ์ ์ธ ์๊ด์ฑ์ด ๋๋ค 2) ์ธ์ ํ token์ positional encoding ๋๋ถ์ ๋ ๋์ ์๊ด์ฑ์ ๊ฐ์ง๋ค. 3) Z'์์๋ ๋๊ฐ์ ๋จ์ด๋ 1์ ์๊ด์ฑ์ ๊ฐ์ง๋๋ฐ, Z'์B์์๋ ๊ทธ๋ ์ง ์๋ค. ๊ทธ ์ด์ ๋ Z'์B๋ positional encoding๊ณผ transformer encoder์ ์ํํ๊ธฐ ๋๋ฌธ์ธ๋ฐ, ์ด๊ฒ์ word relations๋ฅผ ๋ฌธ๋งฅ์ ์ผ๋ก ํด์ํ๊ธฐ ๋๋ฌธ์ด๋ค.
CAM-based Interpretation Method for Pattern Discovery
Mc(l)์ด ๊ฐ์ฅ ๋์ ๋ฌธ์ฅ์์ ๋จ์ด์ 10%๋ ๋นจ๊ฐ์์ผ๋ก ํ์๋๊ณ ๋๋จธ์ง ๋จ์ด๋ ๊ฒ์์์ผ๋ก ํ์๋๋ค. ๊ทธ๋์ ๋นจ๊ฐ ๋จ์ด๋ ์๋นํ '์ฃผ๋ชฉ๋ฐ์' class c๋ก ๋ถ๋ฅ๋ ๊ฒ์ด๋ค. ๋ค์์ ๊ทธ๋ฆผ 4๊ฐ CAM์ ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋ค.
์์ ๊ทธ๋ฆผ 4๋ฅผ ์ดํด๋ณด๋ฉด ์ค์ ๊ธฐ์ฌ์ ๊ฒฝ์ฐ์๋ ์ ํ์ด์ ์ ํ์ด๋ฅผ ์์ฃผ๋ก ํ๊ณ , ๊ฐ์ง ๊ธฐ์ฌ๋ :, (, ), /, @, &, ! ์ ๊ฐ์ ๋น๊ฒฉ์์ด, ๋น๊ฒฉ์์ด๊ตฌ, ๊ตฌ๋์ ์ ์ฃผ๋ก ์ด์ ์ ๋ง์ถ๋ค. ๋ฐ๋ผ์ CAM์ ํตํ ๋ค์ํ ํด๋์ค์ ๋ํ ๊ธฐ๋ณธ ํจํด ๋ฐ๊ฒฌ์ ๋งค์ฐ ํจ๊ณผ์ ์ธ ๊ฒ์ผ๋ก ๋ํ๋ฌ๋ค.
4. Conclusion
์ด ๋ ผ๋ฌธ์ representation spcae์ class-specific pattern discovery ๊ทธ๋ฆฌ๊ณ ๊ฐ์ง ๋ด์ค ๋ฐ์ดํฐ์ ์ ๋ํด ๊ฐ๋จํ classification model์ ์ ์ฉํ๋ ๊ฒ์ ๋ํด ๋ถ์ํ์๋ค. ์ด ๋ ผ๋ฌธ์ main contribution์ ๋ค์๊ณผ ๊ฐ๋ค.
- TF-iDF์ Word2Vec, GloVe, BERT๋ฅผ ์ด์ฉํ representation space์ ๋ํ ๋ถ์์ PCA ์๊ฐํ์ linear evaluation์ ์ด์ฉํ์ฌ ์งํํ์๋ค.
- CAM์ ํ์ฉํ์ฌ class-specific pattern์ ๋ฐ๊ฒฌํ์๋ค.
- simple BERT ๋ชจ๋ธ์ ํ์ฉํ์ฌ ๋์ ์ ํ๋์ interpretability๋ฅผ ๋ฌ์ฑํ์๋ค.
์ถ์ฒ: Lee, Daesoo. "Better Reasoning Behind Classification Predictions with BERT for Fake News Detection." arXiv preprint arXiv:2207.11562 (2022).