메뉴 바로가기 본문 바로가기

고객지원

공지사항 내용
[NAVER] 쇼핑 검색 랭킹 개선: 검색의도와 상품 특징을 더 잘 반영하는 Tree 기반 모델

네이버 쇼핑 검색 트래픽과 상품의 다양성은 코로나 팬데믹 이후에도 지속적으로 증가하고 있습니다.



안녕하세요.
비즈니스 시작과 성공을 함께 하는 e-커머스 파트너 가비아 CNS입니다.


네이버는 AI와 머신러닝을 기반으로한 쇼핑 검색 모델을 통해 다양한 검색어에서 14억 건이 넘는 상품에 대한 검색에 대응하고 있으며, 지속적으로 사용자의 니즈를 만족시킬 수 있는 검색 결과를 제공하려 노력 중입니다.

최근 3년 간 쇼핑 검색 랭킹 모델 개선에 관련된 공지는 아래에서 확인하실 수 있습니다.


 


 

AI가 학습하는 네이버쇼핑 검색을 소개합니다 (2020.12.07)

개선된 거대 쇼핑DB 기반 네이버쇼핑 “상품 카테고리 예측 모델”을소개합니다(2021.08.01)

AI가 학습하는 네이버쇼핑 검색이 더 개선됩니다.(2021.04.15)
 


 


그동안 쇼핑 검색은 상품의 대 카테고리에서 중 카테고리, 그리고, 검색어 단위로 랭킹을 학습하는 방식을 취해 왔습니다. 구체적으로 랭킹에 사용하는 점수는 [가중치 * 랭킹요소(Feature)]의 값들을 더한 형태(Linear Weighted Sum)였습니다.

 

랭킹 수식은 단순하지만, 랭킹 수식에 사용하는 요소들은 상품 선호도, 상품 정보 품질, 상품 인기도를 반영할 수 있는 요소를 AI와 머신러닝에 기반한 고도화된 모델을 통해 추출하는 방식으로 랭킹 품질을 향상시켜 왔습니다


 




 

이러한 선형 모델은 적용하기 빠르며 해석이 직관적으로 가능하다는 장점이 있습니다.

 

그러나 랭킹을 구성하는 요소가 많아질수록 각 가중치의 의미는 흐려질 수 있는데요. 조회 수, 리뷰 수, 상품 판매량같이 복합적으로 연관되어 있는 상품 요소들의 상관관계를 정교하게 반영하지 못한다는 단점이 있습니다.

 

또한 특정 요소의 가중치에 따라 다른 요소들의 점수가 매우 낮아도 검색 결과 상 위에 노출될 가능성을 내재하고 있어 검색어와의 적합도가 낮은 상품이 도출되거나 검색 결과에 영향을 미치려는 어뷰징에 취약할 수 있다는 단점도 있습니다.


 





상품 단위의 다양한 랭킹 요소를 고려한 GradientBoosted Tree 기반 Learning to Rank 랭킹 모델 적용




이에 기존 선형 랭킹 모델의 단점을 보완하고 더욱 정교한 결과를 제공하기 위해 Gradient Boosted Decision Tree(GBDT) 기반 learning to rank 모델을 쇼핑 검색에 적용할 예정입니다. 

 

GBDT 모델은 과거 상품 노출 성과와 사용자 반응을 이용해 최상의 검색 결과 만족도를 제공하는 방향으로 학습합니다.

이 모델은 최대 깊이 M인 N개의 Sub-tree를 바탕으로 검색어와 랭킹 요소들 간의 특징을 세밀하게 반영할 수 있다는 장점이 있습니다.

예를 들면, Tree 구조를 이용하여 검색어와 상품 간의 매칭 정확도가 낮은 경우 상품의 인기도가 아무리 높더라도 상위에 랭크되지 않을 수 있습니다. 또한, 사용자 클릭 대비 리뷰나 판매지수가 높은 경우 더 상위에 랭크될 수도 있습니다. 

 

아래는 모델 구조를 도식화한 가상의 예시입니다. 



 

GBDT 알고리즘의 자세한 설명과 상품 검색 랭킹에 사용되는 요소들은 아래 링크를 참고부탁 드립니다.

 


 

위키백과 : Gradient Boosting

네이버 쇼핑 > 자주 묻는 질문(FAQ) : 검색 SEO가이드
 






랭킹 모델 개선의 적용 사례



선형 모델에서 일부 검색어는 상품 카테고리는 유사하나, 연관도가 낮은 상품도 일부 노출되었습니다.

적용 예정인 TO BE에서는 관련도가 높은 상품 중심으로 노출될 예정입니다.


 



 

< 개선 전 : 검색어와 관련이 낮은 상품들이 결과로 노출 >

 



 

< 개선 후 : 검색어와 관련이 높은 상품 위주로 검색 결과가 개선 >



 

위와 같이 비교테스트를 진행한 결과, 상품의 노출 지표와 품질이 낮은 검색결과도 상당수 개선되었음을 알 수 있었습니다.

 

정성적으로는 단순히 클릭이나 매출이 높다고 검색어와 적합도가 떨어지는 상품이 상위에 노출되는 빈도가 감소했으며, 검색어의 노출 성과 지표도 좋아졌습니다.

 

네이버 쇼핑 검색은 해당 모델을 6월 말에 네이버 쇼핑 랭킹에 반영하여, 검색어에 더 적합한 상품을 상위에 노출하고, 사용자가 원하는 상품을 잘 탐색하는 것을 도울 예정입니다.

 

출처: 네이버 검색 공식블로그


그 외 궁금하신 내용은 다이애드 마케팅센터(1644-4527)에 문의 바랍니다.
감사합니다.