국회온라인미디어

국회 온라인 미디어 포털 검색 서비스 (클러스터링과 연관 검색)

쓰리웨어에서는 IDOL 검색엔진의 군집화 기능(문서 클러스터링 기능)을 이용하여 국회 대국민 서비스 검색 품질을 높이는 작업을 진행하였습니다.

2015년 국회에서는 온라인 미디어 포털 구축 사업을 통하여 국회내에서 제공하는 다양한 보도 자료, 멀티미디어 정보, 국회 소식, 의원 소식 등을 멀티미디어 환경, 모바일 환경에 맞는 플랫폼을 이용하여 제공하는 온라인 미디어 포털 사이트를 오픈하였습니다.

국회 온라인 미디어 포털
http://naon.go.kr/

쓰리웨어에서는 그동안 국회내 검색 서비스를 진행한 경험과 노하우를 바탕으로 군집 분석을 비롯한 편리하고 직관적인 이해를 돕는 기능을 구현하였습니다.

검색 군집 모듈(클러스터링 기능)

검색어(query) 를 이용한 풀 텍스트 검색을 수행한 결과 문서를 내용에 기반하여 분류를 수행하는 것을 군집화라고 합니다. (클러스터링 프로세스)
이렇게 처리한 검색 군집 결과를 보게되면, 현재 전체 문서들 중에 내가 찾은 검색어와 관련된 내용이 얼만큼 있는지, 얼마나 관련되어 있는지 직관적으로 알아볼 수 있습니다.

HPE IDOL의 클러스터링 알고리즘을 이용하여 검색 결과를 내용에 따라 분류합니다.

클러스터링(clustering): 의미기반 정보를 기반으로 검색된 문서들을 묶어 주는 기능

이렇게 군집 분석을 한 결과는 시각적으로 쉽게 알 수 있는 다양한 방법을 통하여 쉽게 알아 볼 수 있습니다. 국회 온라인 미디어 포털 naon 에서는 트리맵 방식을 이용하여 제시하고 있습니다.

“예산안 심의”를 검색하게되면 다양한 결과를 얻을 수 있습니다.
검색어 클러스터링 탭을 선택하면, “예산안 심의”와 관련된 다양한 검색 결과들을 클러스터링 분석한 결과를 사각형의 주제어 버튼으로 볼 수 있습니다.

“예산안 심의”와 관련된 검색 결과들 중에는 “예결위”와 연관된 결과들이 가장 많고, “내년 예산안”, “예산안 편성”, “여야 간사” 등의 큰 주제는 물론,”의견 조율”, “여야 합의”, “정회 요청” 등 여러가지 내용을 확인할 수 있습니다.
사각형의 면적이 크면 클 수록 해당 주제와 관련된 검색 결과가 많다는 의미입니다.
이렇게 보면 클러스터링 결과는 내가 검색한 키워드와 관련도가 높은 연관 검색어라고 볼 수 있습니다.

트리맵 형태로 나타난 검색 연관어를 선택하면 해당 키워드를 중심으로 다시 군집분석에 따른 연관 검색어를 확인할 수 있습니다.

  • NAON_01Main Page
  • NAON 04 Search 01 - Query
  • NAON 04 Search 02 Treemap
  • NAON 04 Search 03 Treemap 2
  • NAON 04 Search 04 Search Result
  • NAON 04 Search 05 Timeline
  • NAON_03 Media
  • NAON_02News

쓰리웨어는 HPE IDOL 과 검색 서비스를 통하여 국회 온라인 미디어 정보를 보다 직관적으로 검색하고 효과적으로 파악하도록 지원하였습니다.

정보 분석, 텍스트 마이닝, 비정형 데이터 분류 및 클러스터링도  쓰리웨어의 기술과 제품으로 구현합니다.