[NAVER] 쇼핑 검색 랭킹 개선: 검색의도와 상품 특징을 더 잘 반영하는 Tree 기반 모델
작성일 2022-06-24 09:14:01
조회수 706
|
---|
최근 3년 간 쇼핑 검색 랭킹 모델 개선에 관련된 공지는 아래에서 확인하실 수 있습니다.
AI가 학습하는 네이버쇼핑 검색을 소개합니다 (2020.12.07) 개선된 거대 쇼핑DB 기반 네이버쇼핑 “상품 카테고리 예측 모델”을소개합니다(2021.08.01) AI가 학습하는 네이버쇼핑 검색이 더 개선됩니다.(2021.04.15)
랭킹 수식은 단순하지만, 랭킹 수식에 사용하는 요소들은 상품 선호도, 상품 정보 품질, 상품 인기도를 반영할 수 있는 요소를 AI와 머신러닝에 기반한 고도화된 모델을 통해 추출하는 방식으로 랭킹 품질을 향상시켜 왔습니다
이러한 선형 모델은 적용하기 빠르며 해석이 직관적으로 가능하다는 장점이 있습니다.
그러나 랭킹을 구성하는 요소가 많아질수록 각 가중치의 의미는 흐려질 수 있는데요. 조회 수, 리뷰 수, 상품 판매량같이 복합적으로 연관되어 있는 상품 요소들의 상관관계를 정교하게 반영하지 못한다는 단점이 있습니다.
또한 특정 요소의 가중치에 따라 다른 요소들의 점수가 매우 낮아도 검색 결과 상 위에 노출될 가능성을 내재하고 있어 검색어와의 적합도가 낮은 상품이 도출되거나 검색 결과에 영향을 미치려는 어뷰징에 취약할 수 있다는 단점도 있습니다.
GBDT 모델은 과거 상품 노출 성과와 사용자 반응을 이용해 최상의 검색 결과 만족도를 제공하는 방향으로 학습합니다. 이 모델은 최대 깊이 M인 N개의 Sub-tree를 바탕으로 검색어와 랭킹 요소들 간의 특징을 세밀하게 반영할 수 있다는 장점이 있습니다. 예를 들면, Tree 구조를 이용하여 검색어와 상품 간의 매칭 정확도가 낮은 경우 상품의 인기도가 아무리 높더라도 상위에 랭크되지 않을 수 있습니다. 또한, 사용자 클릭 대비 리뷰나 판매지수가 높은 경우 더 상위에 랭크될 수도 있습니다.
아래는 모델 구조를 도식화한 가상의 예시입니다.
GBDT 알고리즘의 자세한 설명과 상품 검색 랭킹에 사용되는 요소들은 아래 링크를 참고부탁 드립니다.
네이버 쇼핑 > 자주 묻는 질문(FAQ) : 검색 SEO가이드
적용 예정인 TO BE에서는 관련도가 높은 상품 중심으로 노출될 예정입니다.
< 개선 전 : 검색어와 관련이 낮은 상품들이 결과로 노출 >
< 개선 후 : 검색어와 관련이 높은 상품 위주로 검색 결과가 개선 >
위와 같이 비교테스트를 진행한 결과, 상품의 노출 지표와 품질이 낮은 검색결과도 상당수 개선되었음을 알 수 있었습니다.
정성적으로는 단순히 클릭이나 매출이 높다고 검색어와 적합도가 떨어지는 상품이 상위에 노출되는 빈도가 감소했으며, 검색어의 노출 성과 지표도 좋아졌습니다.
네이버 쇼핑 검색은 해당 모델을 6월 말에 네이버 쇼핑 랭킹에 반영하여, 검색어에 더 적합한 상품을 상위에 노출하고, 사용자가 원하는 상품을 잘 탐색하는 것을 도울 예정입니다.
출처: 네이버 검색 공식블로그 |