[NAVER] 초 거대 AI 언어 모델 HyperCLOVA를 활용한 쇼핑 리뷰 요약
작성일 2021-08-02 09:01:50
조회수 911
|
---|
안녕하세요. 네이버 쇼핑에는 하루에도 수백만 건씩, 구매자분들이 남겨주신 소중한 리뷰가 있습니다. 이 사용자 리뷰는 판매자가 제공하는 정보와 함께, 각 상품의 주요 특성을 사용자 관점에서 살펴볼 수 있는 매우 유용한 정보입니다.
그러나 때로는 이 리뷰가 너무 많아서 모두 읽기 힘들거나, 구매 결정에 도움이 되는 중요한 리뷰만 살펴보고 싶은 경우도 있습니다. 그래서 저희 네이버 NLP팀에서는 많이 언급된 중요한 리뷰를 모아 한 줄로 요약하는 방법을 연구하게 되었고, 네이버에서 자체 개발한 초 대규모 AI 언어 모델인 HyperCLOVA 기술을 활용하여 네이버 쇼핑 검색 서비스에 적용할 수 있게 되었습니다. Ai 리뷰 요약은 아래와 같은 프로세스를 통해 진행합니다. 먼저, 중요한 리뷰를 구분하기 위해, 리뷰에 언급된 주요 키워드를 분석하여 테마(속성)별로 분류합니다. 이 때, 너무 짧은 문장이나, 무의미한 내용이 반복 표현된 낮은 품질의 리뷰들은 제외합니다. 그리고, 의미적으로 유사하거나 비슷한 표현의 내용을 클러스터링 합니다. 이 때, 큰 덩어리로 묶여진 내용은 동일한 의견을 가진 사용자가 많은 중요한 리뷰이므로, 놓치지 않고 반영하도록 합니다. 마지막으로, 초 거대 AI 언어 모델 기술을 이용하여 인공지능이 생성한 자연스러운 한 줄의 요약문을 완성합니다. 이렇게 HyperCLOVA 기술을 활용한 방식은 사용자 리뷰 중 하나를 대표 리뷰로 선정하는 기존 방식과 비교하여, 다수의 사용자가 언급한 내용을 중심으로 반영할 수 있어, 해당 제품의 특성을 대표하는 리뷰로 더 적합한 것으로 평가 되었으며, (블라인드 테스트 결과 기존 방식 대비 14점 이상 품질 우위), 사용자가 잘못 입력한 오탈자나 부적합한 표현도 자동으로 교정하여 주므로, 작성된 문장이 훨씬 자연스럽고, 문법이나 어법에도 적합한 리뷰로 평가 되었습니다. (블라인드 테스트 결과 기존 방식 대비 23점 이상 품질 우위)
또한, 인공지능이 리뷰에 없는 내용을 임의로 언급하는 경우에 대비하여, 생성된 문장이 기존의 문장과 논리적으로 관련이 있는지 평가할 수 있는 NLI (Natural Language Inference) Score 평가 방법을 도입하였고, 또, 가능한 사용자가 입력한 표현 내에서 문장을 생성할 수 있도록 설계하여, 잘못된 내용으로 요약되는 경우를 최대한 방지하였습니다.
다만, 초거대 AI 언어 모델 특성상, 네이버 쇼핑 상품 전체를 대상으로 바로 적용하는 것은 조금 어려운 상황이어서, 서비스 적용은 일부 카테고리부터 순차적으로 적용될 예정이며, 향후에는 모델을 계속 개선하여, 연내에는 전체 카테고리 모든 상품에 대해 적용할 수 있을 것으로 기대하고 있습니다.
이 외에도 앞으로 저희 네이버는, 초거대 AI 언어 모델 HyperCLOVA를 활용한, 새롭고 다양한 서비스들을 확대하여 네이버 검색 사용자들에게 편리한 경험을 제공할 수 있도록 노력하겠습니다. |