어쩌다데싸
추천 시스템 최신 트렌드와 개인화 전략 본문
이 글은 최신 추천 시스템의 기술 트렌드부터, 실제 서비스에 도입할 때 반드시 고려해야 할 설계·운영 포인트까지 정리했습니다. 데이터, 모델, 아키텍처, 윤리를 아우르는 ‘시스템 전체’ 관점에서 접근하려는 실무자에게 실질적인 가이드를 제공합니다.
추천 시스템 접근 방식

추천 시스템을 처음 시작하면 보통 위의 그림 속 내용들을 가장 먼저 떠올립니다. 콘텐츠 기반, 협업 필터링, 하이브리드 추천 모델로 대표되는 전통적인 추천 시스템 분류죠.
하지만 오늘날 추천 시스템은 이러한 알고리즘 분류만으로 설명하기 어렵습니다. 알고리즘에 집중하기 보다는 데이터 종류와 처리 방식, 실시간성, 대규모 분산 아키텍처, 윤리성, LLM·GNN·강화학습 등의 최신 기법이 함께 고려되는 '시스템 전체' 접근이 주류가 되었습니다.
추천 시스템 아키텍처

추천 시스템은 기본적으로 대규모 아이템 중에서 사용자에게 가장 적합한 아이템을 빠르고 정확하게 추천하는 것을 목표로 합니다. 이 목표를 달성하기 위해 추천 시스템은 오프라인과 온라인이라는 두 가지 영역에서 유기적으로 동작합니다.
오프라인 영역에서는 대규모 데이터를 기반으로 모델을 학습하고, 추천에 필요한 인덱스와 피처(feature)를 미리 준비합니다. 오프라인에서 학습된 모델과 데이터 구조를 이후 온라인 영역인 실시간 추천에 활용합니다.
온라인 영역에서는 사용자의 실시간 요청이 들어올 때마다 빠르게 후보 아이템을 생성하고, 점수화하여 순서를 결정합니다. 이 과정은 보통 추천 아이템 후보 생성(Retrieval & Filtering) → 랭킹(Scoring) → 노출 순서 결정(Ordering)의 단계로 이루어집니다.
이 두 영역은 서로 분리되어 있지만, 데이터의 흐름을 통해 끊임없이 연결됩니다. 사용자의 행동 데이터는 수집되어 오프라인 학습에 반영되고, 업데이트된 모델은 다시 온라인 환경에 배포되어 최신 추천을 제공합니다. 데이터 수집 → 학습/모델 업데이트 → 실시간 서빙의 순환 구조가 현대 추천 시스템의 핵심입니다.
1. Retrieval (검색 단계)
추천 시스템의 첫 번째 단계는 Retrieval, 즉 후보 생성입니다. 이 단계의 목적은 전체 아이템 풀(수백만~수억 개)에서 상위 수백~수천 개의 유망한 후보를 빠르게 추출하는 것입니다. 여기서 핵심은 속도이기 때문에, 랭킹에서 쓰는 복잡한 모델 대신 가볍고 빠른 검색 알고리즘이 사용됩니다.
동작 방식
- 입력 임베딩 생성
- 사용자의 현재 컨텍스트(최근 클릭한 아이템, 검색 쿼리 등)를 벡터 임베딩으로 변환합니다. - 유사도 검색
- 생성된 사용자 벡터와 모든 아이템 벡터를 비교하여 가장 유사한 아이템 N개를 찾습니다.
- 여기서 ANN(Approximate Nearest Neighbor) Index 기법이 사용되어 검색 속도를 크게 줄입니다. - 아이템 임베딩 사전 구축
- 오프라인에서 모든 아이템을 임베딩 벡터로 변환해 저장해 둡니다.
실시간 요청 시에는 ANN 인덱스에서 바로 검색 가능하도록 준비합니다.
2. Filtering (필터링 단계)
Retrieval 단계에서 가져온 수백~수천 개의 후보는 여전히 품질 보장이 필요합니다. 추천 결과에 노출해서는 안 되는 아이템(예: 이미 본 아이템, 품절 상품, 정책 위반 콘텐츠 등)을 걸러내는 단계가 바로 Filtering입니다.
동작 방식
- 유효성 검사
- 아이템이 현재 서비스 정책과 조건에 맞는지 확인합니다.
- 예: 연령 제한, 지역 제한, 재고 여부, 게시 상태 등 - 중복·노출 제한
- 최근에 사용자가 본 아이템, 이미 추천 아이템 등을 제외합니다. - 필터링 알고리즘
- Bloom Filter : 대규모 데이터에서 특정 항목 존재 여부를 빠르게 검사하는 확률적 자료구조
- Rule-based Filter : 명시적인 조건문 기반 필터
3. Scoring (점수화 단계)
Scoring 단계는 추천 시스템의 두뇌라고 할 수 있습니다. Filtering을 거친 후보들에게 정교한 점수를 매겨 최종 순위를 결정하기 위한 핵심 과정입니다.
동작 방식
- 피처 추가
- 후보 아이템과 사용자 정보를 바탕으로 다양한 피처를 생성합니다.
- 예: 사용자 나이, 지역, 최근 클릭 카테고리, 아이템 속성(가격, 카테고리, 인기도), 시간대 등
- 이때 Feature Store에서 피처를 가져와서 실시간으로 조합합니다. - 피처 변환 (Feature Transform)
- 모델이 이해할 수 있는 형식으로 피처를 변환
- 정규화, 해싱, 임베딩 변환 등 - 점수 예측
- Ranking Model이 각 후보에 대해 CTR, CVR, Engagement 등의 예측값을 계산합니다.
- 대표 모델: Wide&Deep, 딥러닝 기반 추천 모델, Transformer 기반 랭킹 모델 등
- 다목적 최적화 : 여러 목표를 동시에 고려하는 Multi-objective Ranking (점수 = 클릭 확률 × 수익 가중치 × 다양성 보정 등)
4. Ordering (노출 순서 결정)
마지막 단계는 Ordering입니다. 여기서는 Scoring 단계에서 나온 점수를 기본으로 하되, 비즈니스 전략과 정책을 반영해 최종 노출 순서를 정합니다.
동작 방식
- 비즈니스 규칙 적용
- 광고 슬롯 삽입, 특정 카테고리 우선 노출, 프로모션 아이템 상단 배치 - 다양성·균형 유지
- 같은 카테고리나 브랜드의 아이템이 지나치게 몰리지 않도록 조정 - 사용자 경험 최적화
- 새로 유입된 아이템, 장기 미노출 아이템을 적절히 섞어 추천
이렇게 완성된 추천 리스트는 최종적으로 사용자 화면에 노출됩니다. 이후 사용자의 반응(클릭, 구매, 시청 등)은 다시 데이터로 수집되어 오프라인 학습 단계로 피드백됩니다. 이 과정을 반복하며 추천 품질은 점점 향상됩니다.
추천 시스템 트렌드
지금까지 살펴본 아키텍처는 추천 시스템의 기본 틀입니다. 이 틀 안의 각 단계는 기술 발전에 따라 계속 진화하고 있습니다. 여러가지 분야에서 발전하고 있지만, 최근 발전 방향을 큰 카테고리로 분류해보면 다음과 같은 4가지로 나눠볼 수 있습니다.

1. 데이터와 표현 (Data & Representation)
어떤 정보가 다양하게 쓰이고 있는가
- 멀티모달 데이터 + 그래프 기반
텍스트, 이미지, 행동 로그, 그래프 신경망(GNN) 등 다양한 데이터 유형과 관계 구조 활용 - 데이터 중심 접근법 (Data-Centric RS)
데이터 수집·정제·평가 방식 혁신, 모델보다 데이터 품질에 집중
2. 모델링 기법 (Modeling Approaches)
어떤 최신 AI 기법이 적용되고 있는가
- 대형 언어모델(LLM) 및 생성 기반 추천
Foundation 모델, Generative Recommenders, Transformer 기반 시퀀스 처리 - 세션 기반·순차적 추천
RNN·Transformer 기반으로 세션 내 행동 패턴을 순차적으로 학습 - 강화학습 기반 추천
RL/DRL로 사용자–시스템 상호작용을 순차적 의사결정 문제로 모델링 - 지식 기반 및 대화형 추천
도메인 지식·대화형 인터페이스를 통한 맞춤형 추천
3. 시스템 설계와 운영 (System Architecture & Operations)
어떻게 실시간·대규모로 운영되는가
- 실시간 & 다중 행동 기반 처리
클릭·조회·장바구니 등 다양한 행동 데이터를 스트리밍 처리 - 분산·온라인 학습, 피드백 루프
(본문에는 없지만 현대 시스템 특징으로 함께 묶어 설명 가능)
4. 신뢰성과 윤리 (Trust & Ethics)
어떻게 신뢰성과 투명성을 보장하는가
- 공정성·편향·프라이버시 고려
XAI, Fairness-aware RS, Federated Learning 등 윤리·투명성 확보 기술
개인화 추천 시스템
위에서 살펴본 최신 트렌드는 데이터, 모델, 시스템, 윤리 등 다양한 영역에서 발전을 이루고 있습니다.
그러나 이 모든 변화의 중심에는 하나의 공통 목표가 있습니다. 바로, 각 사용자에게 가장 적합한 경험을 제공하는 ‘개인화 추천’입니다.
개인화 추천 시스템(Personalized Recommender System)은 모든 사용자에게 동일한 추천을 제공하는 것이 아니라,
각 사용자의 취향, 행동, 맥락에 맞춰 추천 결과를 다르게 제공하는 시스템입니다. 목표는 개별 사용자가 “나를 위한 추천”이라고 느낄 만큼 높은 관련성과 만족도를 제공하는 것입니다. 요즘 시대에 특히 강조되고 있는 추천 방향입니다.
왜 개인화가 중요한가?
오늘날 사용자들은 OTT, 쇼핑, 음악 스트리밍 등 다양한 서비스에서 이미 개인화된 경험에 익숙해져 있습니다.
단순히 인기 있는 상품이나 콘텐츠를 나열하는 것만으로는 만족도를 높이기 어렵습니다. 동일한 상품이라도, 누가 언제 어떤 상황에서 보느냐에 따라 반응은 크게 달라집니다. 따라서 사용자별로 최적화된 노출을 제공하는 것은 전환율과 체류 시간을 높이는 핵심 전략이 됩니다.
또한 광고와 프로모션 측면에서도 개인화는 효율을 극대화합니다. 관심이 높은 사용자에게만 맞춤형 메시지를 전달하면 불필요한 노출을 줄일 수 있고, 그만큼 마케팅 비용은 절감되며 매출은 상승하게 됩니다.
개인화 구현 방식
개인화는 데이터와 모델링 방식에 따라 여러 형태로 구현할 수 있습니다.
- 명시적 프로필 기반 (Explicit Profile-based)
- 사용자가 직접 입력한 관심사, 선호 카테고리를 기반으로 추천
- 장점: 초기 성능이 안정적, Cold-start 완화
- 단점: 사용자가 정보를 주지 않거나 오래된 경우 정확도 저하
- 행동 기반 (Behavior-based)
- 클릭, 검색, 장바구니, 시청 기록 등 암묵적 피드백을 활용
- 대표 방법: 협업 필터링, 콘텐츠 기반 필터링, 하이브리드 방식
- 장점: 대규모 데이터에서 잘 동작, 자동 업데이트 가능
- 단점: Cold-start 문제 존재
- 맥락·상황 기반 (Context-aware Personalization)
- 시간대, 위치, 기기, 날씨, 이벤트 등 사용자 상황(Context)을 반영
- 예: 점심시간에는 근처 식당 메뉴 추천, 주말에는 영화 콘텐츠 추천
- 딥러닝 기반 임베딩(Deep Embedding-based Personalization)
- 사용자의 과거 행동 시퀀스나 멀티모달 데이터를 임베딩 벡터로 학습
- ANN, GNN, Transformer 등을 활용해 유사 사용자·아이템 탐색
개인화 시 유의할 점
개인화는 강력하지만 몇 가지에 대한 주의가 필요합니다. 먼저 콜드 스타트 문제입니다. 신규 사용자와 아이템에는 초기 데이터가 부족하기 때문에 개인화가 어렵습니다. 이 경우에는 콘텐츠 기반이나 지식 기반 등으로 추천을 병행할 필요가 있습니다.
편향과 과도한 개인화 문제도 있습니다. 과거 행동만 반영하면 추천이 점점 좁아져 다양성이 떨어지게 되고, 신규 탐색 경험이 저하됩니다. 개인화 추천과 함께 새로운 아이템을 추천하는 로직을 함께 사용해줘야 합니다.
마지막으로 짚어볼 점은 프라이버시 문제입니다. 유튜브나 포털 사이트에서 내가 방금 관심 가졌던 제품이 광고로 뜨는 걸 보면, 종종 “알고리즘이 내 얘기를 엿듣는 거 아니야?”라는 농담을 하곤 합니다. 하지만 실제로 모든 온라인 활동 기록이 개인화 추천에 활용될 경우, 사용자의 프라이버시 침해로 이어질 수 있습니다. 이를 방지하기 위해 GDPR, CCPA 등 글로벌 개인정보 보호 규제가 시행되고 있으며, 서비스 사업자는 이에 맞춰 데이터 수집·활용 방식을 설계해야 합니다.
Federated Learning : 사용자 데이터를 중앙 서버로 모으지 않고, 데이터가 있는 기기나 서버에서 직접 모델을 학습한 뒤 학습된 모델 파라미터(또는 업데이트)만 중앙 서버로 전송해 통합하는 분산 방식
개인화 추천은 추천 시스템의 핵심 차별화 요소이지만 단순히 사용자별 모델을 만드는 데에 그쳐서는 안됩니다. 데이터 품질, 모델 구조, 윤리적 설계까지 모두 고려해야 장기적으로 유지 가능한 개인화가 완성됩니다.
추천 시스템 도입 시 고민해야 할 8가지
추천 시스템은 이제 많은 서비스에서 '있으면 좋은 기능'이 아니라 '없으면 경쟁에서 뒤쳐지는 핵심 기술'이 되었습니다. 하지만 추천 알고리즘만 고민하는 것으로는 도입할 수 없습니다. 비즈니스 목표, 데이터 전략, 운영 체계까지 '시스템'으로 설계해야만 안정적으로 돌아갈 수 있습니다.
아래는 실무에서 추천 시스템을 구축·운영하며 반드시 고민해야 하는 핵심 지점들입니다. '어떤 모델을 쓰느냐'보다 '어떻게 설계하고 운영할 것인가'에 더 집중해 보겠습니다.
1. 목표와 KPI 설정
추천 시스템은 무엇을 위해 존재하는가를 명확히 해야 합니다. 목표 없이 모델을 만들면 알고리즘은 돌아가지만 비즈니스 효과는 미미할 수 있습니다. 커머스라면 CTR, CVR, LTV와 같은 지표가, OTT라면 Watch Time, 구독 갱신률 등 단기 성과와 장기 성과를 균형 있게 고려해야 합니다. 예를 들어, 클릭률만 목표로 하면 순간 반응은 좋지만 장기 만족도는 떨어질 수 있습니다. 도메인 별로도 고려를 해야 하지만, 현재 추천 시스템으로 얻고자 하는 것이 무엇인지 목표를 분명히하고 그에 맞춰 시스템을 설계해야 합니다.
2. 데이터 파이프라인과 피처 전략
추천 시스템의 품질은 데이터 품질에서 결정됩니다. 어떤 이벤트를 기록할지(클릭, 스크롤, 체류시간 등)와 온라인과 오프라인을 동기화하고 버전 관리할 수 있는 피처 스토어를 설계해야 합니다. Context 피처를 사용하는 경우에는 실시간으로 업데이트 할 수 있어야 합니다. 또한 데이터 품질 모니터링 체계를 갖춰 누락이나 편향을 빠르게 감지해주는 것도 필요합니다.
3. 콜드 스타트 전략
신규 사용자나 아이템에는 데이터가 부족합니다. 이때 협업 필터링처럼 사용자와 아이템의 상호작용 데이터에만 의존하면 추천 품질이 크게 떨어지게 됩니다. 초기에는 인기순이나 콘텐츠 기반 추천으로 상호작용 데이터가 없어도 추천이 가능하도록 보완하고, 온보딩 설문이나 초반 행동을 유도할 수 있는 이벤트로 빠르게 데이터를 확보해야 합니다.
4. 모델과 아키텍처 선택
목표와 데이터가 정해졌다면 모델을 선택해야 합니다. Retrieval + Ranking의 2단계 구조를 채택할지에 대해 고민해보고, 복잡도와 정확성, 응답속도의 균형 있는 모델을 설계해야 합니다. 이 과정에서 LLM이나 GNN 기반 등 최신 기법을 활용할 수 있고 모델이 만들어지면 해당 모델의 재학습 주기나 온라인 학습 적용 여부에 따라 모델 지속성에 대해서도 고민해야 합니다.
5. A/B 테스트와 배포
좋은 모델이라도 반드시 실시간 환경에서 검증해야 합니다. 실험군·통제군 트래픽 배분, 통계적 유의성 확보 기간 등을 실시간 환경에서 점검하며모델 성능을 확인합니다. 성능 저하 시 즉시 롤백할 수 있도록 설계하는 것도 필요합니다.
6. 비즈니스 규칙과 운영 정책
추천 품질이 좋아도 서비스 전략과 맞지 않으면 의미가 없습니다. 사용자가 관심 있을 아이템만 추천하는 게 아니라 팔고 싶은 물건을 추천을 통해 사고 싶게끔 만들어야 하는 경우도 있습니다. 특정 카테고리나 브랜드 비중을 조절하고 광고 프로모션 슬롯을 관리하는 등 다양성과 신규성을 확보할 수 있는 운영 정책을 펼쳐야 합니다.
7. 리스크와 윤리 고려
추천 시스템은 개인 정보와 직결되기 때문에 GDPR, CCPA 규제에 대응해야 합니다. Federated Learning 등 프라이버시 보존 학습을 활용하거나 데이터와 알고리즘에 편향을 방지하는 등 모델 설계에서 이 점도 반드시 고려해야 합니다. 또한 XAI 기반 추천 이유 설명하는 것도 최근 많은 관심을 받고 있는 분야입니다.
8. 운영과 모니터링
추천 시스템을 만드는 것으로 끝나지 않습니다. 실서비스에서는 우리가 설계한 주요 지표(CTR, CVR, Watch Time 등)를 실시간으로 모니터링하고, 성능 저하나 이상 징후를 빠르게 감지해야 합니다. 특히 모델 드리프트가 발생하거나, 피처 결손·시스템 지연·서빙 장애 등의 문제가 생길 경우를 대비해 Fallback 로직을 미리 준비해 두는 것이 필수입니다. 이런 체계가 있어야 추천 품질과 서비스 안정성을 24시간 유지할 수 있습니다.
결론
추천 시스템은 더 이상 특정 알고리즘을 구현하는 기술 과제가 아닙니다.
데이터 수집·처리, 모델 설계, 시스템 아키텍처, 윤리·운영까지 아우르는 종합 엔지니어링이자 비즈니스 전략의 핵심 축이 되었습니다.
오늘날 성공적인 추천 시스템은
- 명확한 목표와 KPI로 방향을 잡고,
- 데이터 품질과 피처 설계에 투자하며,
- 효율적이고 확장 가능한 아키텍처로 안정성을 확보하고,
- 지속적인 실험과 모니터링을 통해 끊임없이 개선됩니다.
기술 트렌드가 LLM, 멀티모달, 강화학습, Federated Learning 등으로 빠르게 확장되고 있지만, 이 모든 변화의 궁극적인 목적은 변하지 않습니다. 바로 사용자에게 가장 가치 있는 경험을 제공하는 것입니다.
추천 시스템을 설계할 때, 이 원칙을 중심에 두고 장기적 관점에서 전략과 기술을 결합한다면, 추천은 단순한 기능을 넘어 비즈니스 성장을 견인하는 핵심 엔진이 될 것입니다.
'Recommedation System' 카테고리의 다른 글
| 효과적인 선호도 예측 : DeepFM (feat. Factorization Machine) (5) | 2024.11.02 |
|---|---|
| 추천 알고리즘 : 콘텐츠 기반 필터링(CBF)과 협업 필터링(CF) (4) | 2024.10.26 |
| AI 추천시스템(Recommender Systems) 시작하기 (1) | 2024.06.19 |
| 추천시스템(Recommender System) 간단 정리 (0) | 2021.07.16 |