무하유, 국회도서관 내 ‘인공지능 법률 Q&A’ 데이터셋 구축
어려운 법률용어, 대화형 문답 통해 보다 쉽게 설명
실용 인공지능 기업 무하유가 ‘국회도서관 융복합서비스 데이터셋 구축 사업’의 주관 사업자로 선정됐다. 이를 통해 국내 법률 관련 인공지능 학습용 데이터셋을 구축하고, 어려운 법률 용어를 대화형 문답으로 보다 쉽게 설명할 수 있을 것으로 보인다.
무하유는 이번 사업을 통해 국회도서관에서 제공 중인 ‘인공지능 법률 Q&A’ 서비스에서 자연어 질의응답 서비스를 실현하기 위한 질의 답변 등의 데이터셋을 구축할 예정이다. 법률에 해당하는 이슈 키워드와 ▲제개정일 ▲의안 ▲회의록 ▲주요 사건 및 인물에 대한 정보는 물론, 통계 표의 제목 및 매칭 키워드 등을 구축할 계획이다.
챗GPT의 등장 이후 AI 학습데이터에 대한 저작권 및 소유권 우려도 해소할 수 있다. 전통적인 데이터베이스 구축 사업은 인력 공급 및 일정 준수에 초점이 맞춰져 있으며, 저작권 등 잠재적 위협에는 상대적으로 취약했다. 반면 무하유의 데이터 팩토리는 작업자별 품질 관리가 가능하고, 저작권 관계를 명확히 할 수 있어 법적 분쟁 요소나 품질 저하 요소 최소화에 기여할 수 있다.