| ์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | ||||
| 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| 11 | 12 | 13 | 14 | 15 | 16 | 17 |
| 18 | 19 | 20 | 21 | 22 | 23 | 24 |
| 25 | 26 | 27 | 28 | 29 | 30 | 31 |
- heterogeneous graph
- Rag
- Machine Learning
- gat
- heterogeneous graph neural network
- DeepFM
- digital health
- ์ถ์ฒ์์คํ
- nlp
- mature-food
- Factorization Machine
- retrieval augmented generation
- ์ถ์ฒ ์์คํ
- Neo4j
- graphrag
- retrieval-augmented generation
- GenAI
- heterogeneous graph attention network
- hin
- yum-me
- fooddist
- food recommender system
- food recommendation system
- graph
- Today
- Total
๐ ์ํ์์ AI ๊ณต๋ถํ๊ธฐ
DeepFM ๋ณธ๋ฌธ
๐ก๋ค์ด๊ฐ๋ฉฐ
์ถ์ฒ ์์คํ ์์ ์ฌ์ฉ์์ ์์ดํ ๊ฐ์ ์ํธ์์ฉ(Interaction)์ ํจ๊ณผ์ ์ผ๋ก, ํนํ ๋ค์ํ ์ฐจ์์ ์ํธ์์ฉ์ ๋ชจ๋ ๊ณ ๋ คํ ์ ์๋ ๋ชจ๋ธ์ด ํ์ํฉ๋๋ค. DeepFM์ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด 2017๋ ์ ์ ์๋ ๋ชจ๋ธ๋ก, ๋ฎ์ ์ฐจ์์ ์ํธ์์ฉ(Low-order Interaction)๊ณผ ๋์ ์ฐจ์์ ์ํธ์์ฉ(High-order Interaction)์ ๋์์ ๊ณ ๋ คํ๋ฉด์๋ ๋ณต์กํ ํน์ฑ ๊ณตํ(Feature engineering)์ด๋ ์ฌ์ ํ์ต(Pre-training) ์์ด๋ ํจ๊ณผ์ ์ธ ์ถ์ฒ์ด ๊ฐ๋ฅํฉ๋๋ค.
I. ์ถ์ฒ ์์คํ ์์ ์ํธ์์ฉ์ ์ค์์ฑ
์ถ์ฒ ์์คํ ์์๋ ๋ช ์์ ์ผ๋ก ๋๋ฌ๋์ง ์์ ์ ์ฌ์ ํน์ฑ(Implicit feature) ๊ฐ์ ์ํธ์์ฉ๊น์ง ๊ณ ๋ คํ๋ ๊ฒ์ด ๋งค์ฐ ์ค์ํฉ๋๋ค. ์ผ์์์ ๋ณผ ์ ์๋ ์์๋ฅผ ํตํด ์ด๋ฅผ ์ดํดํด ๋ด ์๋ค:
์ค์ํ์์์ ์ํธ์์ฉ ์์
๐ ์๊ฐ๊ณผ ์ฑ ์ข ๋ฅ์ ์ํธ์์ฉ(Order-2)
- ์์ฌ ์๊ฐ์ ์์ ๋ฐฐ๋ฌ ์ฑ์ ์์ฃผ ๋ค์ด๋ก๋ํ๋ ํจํด
- ์ด๋ '์๊ฐ'๊ณผ '์ฑ ์ข ๋ฅ' ์ฌ์ด์ 2์ฐจ์ ์ํธ์์ฉ์ด ์ฌ์ฉ์์ ํด๋ฆญ๋ฅ (CTR)์ ์์ธกํ๋ ์ค์ํ ์ ํธ๊ฐ ๋ฉ๋๋ค
๐จ๐ฆ ์ฑ๋ณ, ๋์ด, ์ฑ ์ข ๋ฅ์ ์ํธ์์ฉ(Order-3)
- ๋จ์ ์์ด๋ค์ด ์ํ ๊ฒ์๊ณผ RPG ๊ฒ์ ์ฑ์ ์ ํธํ๋ ํจํด
- '์ฑ๋ณ', '๋์ด', '์ฑ ์ข ๋ฅ' ์ฌ์ด์ 3์ฐจ์ ์ํธ์์ฉ์ด ํด๋ฆญ๋ฅ ์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค
์ด์ฒ๋ผ ์์ง์ ์ถ์ฒ์ ์ํด์๋ ๋ฎ์ ์ฐจ์๋ถํฐ ๋์ ์ฐจ์๊น์ง์ ๋ค์ํ ์ํธ์์ฉ์ ๋ชจ๋ ๊ณ ๋ คํด์ผ ํฉ๋๋ค. ๊ทธ๋ฌ๋ ๋ชจ๋ ์ํธ์์ฉ์ ์ธ์์ ์ผ๋ก ๋ชจ๋ธ๋งํ๊ธฐ๋ ๋ถ๊ฐ๋ฅํฉ๋๋ค.
๋ฐ์ดํฐ์ ์จ๊ฒจ์ง ์ํธ์์ฉ
์์ ์์์ฒ๋ผ ๋ถ๋ช ํ๊ฒ ๋๋ฌ๋๋ ์ํธ์์ฉ๋ ์์ง๋ง, ๋๋ถ๋ถ์ ์ํธ์์ฉ์ ๋ฐ์ดํฐ ์์ ์จ๊ฒจ์ ธ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด:
๐ "๊ธฐ์ ๊ท๋ฅผ ๊ตฌ๋งคํ๋ ์ฌ๋์ ๋งฅ์ฃผ๋ฅผ ํจ๊ป ๊ตฌ๋งคํ๋ค"๋ผ๋ ์ ๋ช ํ ๋ง์ผํ ์ฌ๋ก๋ ์ง๊ด์ ์ผ๋ก ์์ํ๊ธฐ ์ด๋ ค์ด 2์ฐจ์ ์ํธ์์ฉ์ ๋๋ค.
๋ํ, ํน์ฑ ๊ฐ ์ํธ์์ฉ์ ๊ธฐํ๊ธ์์ ์ผ๋ก ์ฆ๊ฐํ๊ธฐ ๋๋ฌธ์ ๋ชจ๋ ์ฐจ์์ ์ํธ์์ฉ์ ์์์ ์ผ๋ก ๋ชจ๋ธ๋งํ๋ ๊ฒ์ ํ์ค์ ์ผ๋ก ๋ถ๊ฐ๋ฅํฉ๋๋ค. ๋ฐ๋ผ์ ๋จธ์ ๋ฌ๋ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ๋ค์ํ ์ฐจ์์ ์ํธ์์ฉ์ ์๋์ผ๋ก ํฌ์ฐฉํ ์ ์์ด์ผ ํฉ๋๋ค.
๊ธฐ์กด ๋ชจ๋ธ์ ํ๊ณ
Factorization Machine (FM)
- Order-2๋ถํฐ Order-n๊น์ง์ ์ํธ์์ฉ์ ๋ด์ ์ ํตํด ๋ชจ๋ธ๋ง ๊ฐ๋ฅ
- ์ด๋ก ์์ผ๋ก๋ ์ ํ์ ๋ณต์ก๋๋ฅผ ๊ฐ์ง์ง๋ง, ์ค์ ๋ก๋ ๋์ ๊ณ์ฐ ๋ณต์ก๋๋ก ์ธํด ์ฃผ๋ก Order-2 ๋ชจ๋ธ๋ง๋ง ์ฌ์ฉ๋จ
Wide & Deep
- Linear("wide") ๋ชจ๋ธ๊ณผ neural network("deep") ๋ชจ๋ธ์ ๊ฒฐํฉํ ๊ตฌ์กฐ
- ๋ฎ์ ์ฐจ์๊ณผ ๋์ ์ฐจ์์ ์ํธ์์ฉ์ ๋ชจ๋ ๋ชจ๋ธ๋งํ ์ ์์
- ๊ทธ๋ฌ๋ ๋์ ์ฐจ์์ ์ํธ์์ฉ์ ๋ชจ๋ธ๋งํ๊ธฐ ์ํด ์ง์ ์ ์ ํ ํน์ฑ์ cross-product transformationํ์ฌ ์๋ก์ด ํน์ฑ์ผ๋ก ์ถ๊ฐํด์ผ ํจ
- ์ ๋ฌธ์ ์ธ ํน์ฑ ๊ณตํ ์์ ์ด ํ์ํจ
II. DeepFM: ๋ ์ธ๊ณ์ ์ฅ์ ์ ๊ฒฐํฉํ ๋ชจ๋ธ
DeepFM์ ์์ ์ธ๊ธํ ๋ฌธ์ ๋ค์ ํด๊ฒฐํ๊ธฐ ์ํด ์ค๊ณ๋ ๋ชจ๋ธ๋ก, ๋ค์๊ณผ ๊ฐ์ ์ฃผ์ ํน์ง์ ๊ฐ์ง๋๋ค:
์ฃผ์ ํน์ง
- ๐ End-to-End๋ก ๋ชจ๋ ์ฐจ์์ ์ํธ์์ฉ์ ๋ชจ๋ธ๋งํ ์ ์์
- ๐งฐ ์ ๋ฌธ์ ์ธ ํน์ฑ ๊ณตํ ์์ ์ด ํ์ํ์ง ์์
- ๐ FM ์ปดํฌ๋ํธ์ Deep ์ปดํฌ๋ํธ๊ฐ ๋์ผํ ์ ๋ ฅ๊ณผ ์๋ฒ ๋ฉ์ ๊ณต์ ํจ

๋ชจ๋ธ ๊ตฌ์กฐ
DeepFM์ ๋ ๊ฐ์ง ํต์ฌ ์ปดํฌ๋ํธ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค:
- FM ์ปดํฌ๋ํธ (Low-order): Factorization Machine์ ๊ธฐ๋ฐ์ผ๋ก ํจ
- Deep ์ปดํฌ๋ํธ (High-order): ์ฌ์ธต ์ ๊ฒฝ๋ง์ ๊ธฐ๋ฐ์ผ๋ก ํจ
์ด ๋ ์ปดํฌ๋ํธ๋ ๊ฐ์ ์ ๋ ฅ๊ณผ ์๋ฒ ๋ฉ ๋ ์ด์ด๋ฅผ ๊ณต์ ํ๋ฉฐ, ์ด๋ Wide & Deep ๋ชจ๋ธ๊ณผ์ ์ค์ํ ์ฐจ๋ณ์ ์ ๋๋ค.
1. FM ์ปดํฌ๋ํธ

FM ์ปดํฌ๋ํธ๋ ๊ธฐ์กด์ Factorization Machine๊ณผ ์ ์ฌํ๊ฒ ์๋ํฉ๋๋ค:
- 1์ฐจ์ ์ํธ์์ฉ๋ฟ๋ง ์๋๋ผ, ์ ์ฌ ํน์ฑ์ ๋ด์ ์ ์ฌ์ฉํ์ฌ 2์ฐจ์ ์ํธ์์ฉ๋ ๋ชจ๋ธ๋ง ๊ฐ๋ฅ
- ๋ค์ ์์์ผ๋ก ๊ณ์ฐ๋ฉ๋๋ค:
$$y_{FM} = <w, x> + \sum_{j_1=1}^{d}\sum_{j_2=j_1+1}^{d}<v_{j_1}, v_{j_2}>x_{j_1}x_{j_2}$$
์ฌ๊ธฐ์ $w \in \mathbb{R}^d$, $V_i \in \mathbb{R}^k$์ ๋๋ค.
2. Deep ์ปดํฌ๋ํธ

Deep ์ปดํฌ๋ํธ๋ ํผ๋ํฌ์๋ ์ ๊ฒฝ๋ง์ ์ฌ์ฉํ์ฌ ๋์ ์ฐจ์์ ์ํธ์์ฉ์ ํ์ตํฉ๋๋ค:
- ๋ฒ์ฃผํ ํน์ฑ๊ณผ ์ฐ์ํ ํน์ฑ์ด ํผ์ฌ๋ ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์ฒ๋ฆฌ
- ๋ชจ๋ ํน์ฑ์ ์ ์ฐจ์ ์๋ฒ ๋ฉ์ ์ ๊ฒฝ๋ง์ ์ ๋ ฅ์ผ๋ก ํ์ฉ
- ๋ค์ํ ๊ธธ์ด์ ํน์ฑ ๋ฒกํฐ๋ฅผ ๋์ผํ ํฌ๊ธฐ์ ์๋ฒ ๋ฉ ๋ฒกํฐ๋ก ๋ณํ
ํนํ ์ค์ํ ์ ์ FM ์ปดํฌ๋ํธ์์ 2์ฐจ์ ์ํธ์์ฉ์ ๊ณ์ฐํ๊ธฐ ์ํ ์ ์ฌ ํน์ฑ(latent feature)์ผ๋ก ์ฌ์ฉ๋๋ ๊ฐ์ค์น V๊ฐ Deep ์ปดํฌ๋ํธ์์๋ ์๋ฒ ๋ฉ ๋ ์ด์ด์ ๊ฐ์ค์น ์ญํ ์ ํ๋ค๋ ๊ฒ์ ๋๋ค. ์ด๋ฅผ ํตํด ๋ ์ปดํฌ๋ํธ๊ฐ ๋์ผํ ์๋ฒ ๋ฉ ๋ ์ด์ด๋ฅผ ํจ๊ณผ์ ์ผ๋ก ๊ณต์ ํ ์ ์์ต๋๋ค.
III. DeepFM์ ํจ์จ์ฑ๊ณผ ํจ๊ณผ์ฑ

ํจ์จ์ฑ ์ธก๋ฉด
DeepFM์ ์ฒ๋ฆฌ ์๋ ๋ฉด์์๋ ๋ค๋ฅธ ๋ชจ๋ธ๋ค๊ณผ ๋น๊ตํ์ ๋ ๊ฒฝ์๋ ฅ์ด ์์ต๋๋ค. ํนํ ์ฌ์ ํ์ต ๊ณผ์ ์ด ํ์ํ์ง ์๊ธฐ ๋๋ฌธ์, ์ ์ฒด ํ์ต ์๊ฐ์ด ๋ํญ ๋จ์ถ๋ฉ๋๋ค.
ํจ๊ณผ์ฑ ์ธก๋ฉด
CTR(Click-Through Rate) ์์ธก์ ์์ด์ DeepFM์ ๋ค๋ฅธ ๋ชจ๋ธ๋ค๋ณด๋ค ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ฌ์ค๋๋ค:
- ์ํธ์์ฉ์ ๊ณ ๋ คํ์ง ์๋ LR(Logistic Regression) ๋ชจ๋ธ์ด ๋ค๋ฅธ ๋ชจ๋ธ๋ค์ ๋นํด ์ฑ๋ฅ์ด ๋ฎ์ → ์ํธ์์ฉ ๊ณ ๋ ค์ ์ค์์ฑ ์ ์ฆ
- ๋์ ์ฐจ์์ ์ํธ์์ฉ์ ๊ณ ๋ คํ๋ ๋ชจ๋ธ๋ค์ด ๋ฎ์ ์ฐจ์์ ์ํธ์์ฉ๋ง ๊ณ ๋ คํ๋ ๋ชจ๋ธ๋ณด๋ค ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์
- ์๋ฒ ๋ฉ์ ๊ณต์ ํ๋ DeepFM์ด AUC์ LogLoss ์ธก๋ฉด์์ ๊ฐ์ฅ ์ข์ ์ฑ๋ฅ์ ๊ธฐ๋ก

์ด๋ฌํ ๊ฒฐ๊ณผ๋ ์ถ์ฒ ์์คํ ์์ ๋ค์ํ ์ฐจ์์ ์ํธ์์ฉ์ ๊ณ ๋ คํ๋ ๊ฒ์ ์ค์์ฑ๊ณผ DeepFM ๋ชจ๋ธ์ ํจ๊ณผ์ฑ์ ๋ช ํํ๊ฒ ๋ณด์ฌ์ค๋๋ค.
IV. ๊ฒฐ๋ก ๐ฏ
DeepFM์ ์ถ์ฒ ์์คํ ์์ ๋ฎ์ ์ฐจ์์ ์ํธ์์ฉ๊ณผ ๋์ ์ฐจ์์ ์ํธ์์ฉ์ ๋์์ ๋ชจ๋ธ๋งํ ์ ์๋ ํจ๊ณผ์ ์ธ ์ ๊ทผ ๋ฐฉ์์ ์ ๊ณตํฉ๋๋ค. ํนํ ๋ค์๊ณผ ๊ฐ์ ์ฅ์ ์ ๊ฐ์ง๋๋ค:
- ๋ณต์กํ ํน์ฑ ๊ณตํ ์์ ์์ด๋ ๋ค์ํ ์ฐจ์์ ์ํธ์์ฉ์ End-to-End๋ก ํ์ต ๊ฐ๋ฅ
- FM ์ปดํฌ๋ํธ์ Deep ์ปดํฌ๋ํธ๊ฐ ์๋ฒ ๋ฉ์ ๊ณต์ ํจ์ผ๋ก์จ ๋ชจ๋ธ์ ํํ๋ ฅ ํฅ์
- ๋ค์ํ ์ถ์ฒ ์๋๋ฆฌ์ค์์ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์
์ถ์ฒ ์์คํ ์ ๊ฐ๋ฐํ๊ฑฐ๋ ๊ฐ์ ํ๋ ค๋ ๊ฒฝ์ฐ, DeepFM์ ๊ธฐ์กด ๋ชจ๋ธ์ ํ๊ณ๋ฅผ ๋ฐ์ด๋๋ ํจ๊ณผ์ ์ธ ๋์์ด ๋ ์ ์์ต๋๋ค. ํนํ ์ฌ์ฉ์์ ์์ดํ ๊ฐ์ ๋ณต์กํ ์ํธ์์ฉ์ ํฌ์ฐฉํ์ฌ ๋ณด๋ค ์ ํํ ์ถ์ฒ์ ์ ๊ณตํ๊ณ ์ ํ๋ ๊ฒฝ์ฐ์ ์ ํฉํฉ๋๋ค.
์ฐธ๊ณ ๋ฌธํ:
- Guo, H., Tang, R., Ye, Y., Li, Z., & He, X. (2017). DeepFM: A Factorization-Machine based Neural Network for CTR Prediction. arXiv preprint arXiv:1703.04247.
- Cheng, H. T., Koc, L., Harmsen, J., Shaked, T., Chandra, T., Aradhye, H., ... & Shah, H. (2016). Wide & deep learning for recommender systems. In Proceedings of the 1st workshop on deep learning for recommender systems.
- Rendle, S. (2010). Factorization machines. In 2010 IEEE International Conference on Data Mining.
'Food_Health_AI > ์ถ์ฒ ์์คํ ' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
| Heterogeneous Graph Attention Network์ ์ดํด์ ํ์ฉ (0) | 2025.04.07 |
|---|---|
| ๊ทธ๋ํ ๊ธฐ๋ฐ ์ถ์ฒ ์์คํ : GraphSAGE์ ์๋ฆฌ์ ํ์ฉ (0) | 2025.04.03 |
| ๊ทธ๋ํ ๊ธฐ๋ฐ ์ถ์ฒ ์์คํ (1) | 2025.04.03 |
| Factorization Machine (FM) (2) | 2025.03.30 |