“하이퍼클로바X, 한국판 AI 능력 평가서 美 빅테크보다 높은 점수”

산업·IT 입력 2024-02-27 11:02:44 황혜윤 기자 0개

페이스북 공유하기 트위터 공유하기 카카오톡 공유하기 네이버 블로그 공유하기

네이버클라우드 “한국특화지식 종합한 성능 우수”

45개 분야 3만여 개 전문가 수준 문항 구성

GPT-3.5-Turbo와 Gemini-Pro보다 높은 점수

보안·성능 모두 갖춘 ‘소버린 AI’ 솔루션 발전 계획

[사진=네이버]

[서울경제TV=황혜윤 인턴기자] 네이버클라우드는 하이퍼클로바X가 한국판 인공지능(AI) 성능 평가 체계 ‘KMMLU(Measuring Massive Multitask Language Understanding in Korean)’에서 오픈AI, 구글의 생성형 AI보다 높은 점수를 기록했다고 27일 밝혔다.

KMMLU는 국내의 오픈소스 언어모델 연구팀인 ‘해례(HAE-RAE)’가 이끈 AI 성능 평가 지표 구축 프로젝트다. 인문학, 사회학, 과학·기술 등 45개 분야에서 전문가 수준의 지식을 묻는 3만5,030개 문항으로 구성돼 있다. 수학적 추론 능력과 같이 전세계에서 공통적으로 적용할 수 있는 광범위한 지식을 묻는 문항 비중이 약 80%, 한반도 지리, 국내법 등 한국 특화 문제 해결 능력을 평가하기 위한 문항은 20%다.
이를 통해 AI의 보편적 능력과 로컬 지식을 고르게 측정함으로써 한국 사용자에게 유용한 AI를 종합적으로 판단할 수 있다는 설명이다.

오픈AI, 구글 등 북미 테크 기업들은 자사 AI 성능 확인을 위한 지표로 주로 ‘MMLU’를 사용하고 있다. 그러나 이를 한국어로 번역하는 경우, 문항의 부정확한 번역과 여러 문제에 내재된 영어권 국가만의 문화적 맥락 때문에 AI 모델의 한국어 능력을 제대로 가늠하기 어려운 한계가 있었다.
네이버클라우드는 KMMLU가 한국어 원본의 시험 문제들로 구성돼 국내·외 AI의 한국어 이해 역량도 보다 정확하게 평가할 수 있다고 설명했다.

KMMLU 연구 논문에 따르면, 하이퍼클로바X는 오픈AI GPT-3.5-Turbo와 구글 Gemini-Pro보다 높은 점수를 기록했다.

이에 네이버클라우드는 하이퍼클로바X의 일반 지식과 한국 특화 지식을 종합한 전반적인 성능이 글로벌 빅테크의 AI와 경쟁할 수 있는 수준임이 확인됐다고 설명했다. 또 한국 특화 지식 기준으로는 오픈AI의 GPT-4보다도 높은 점수를 기록해, 교육, 법률 등 로컬 정보의 중요성이 큰 산업 분야에서는 하이퍼클로바X가 유용할 수 있다고 덧붙였다.

네이버클라우드는 KMMLU를 통해 입증된 하이퍼클로바X의 성능 경쟁력을 바탕으로, 하이퍼클로바X를 보안과 성능을 모두 갖춘 ‘소버린(Sovereign) AI’ 솔루션으로 발전시켜나가겠다는 계획이다. 지난해 10월에는 고객사가 폐쇄된 사내망에서 하이퍼클로바X를 사용하며 데이터 유출을 방지할 수 있는 하이브리드 클라우드 서비스 ‘뉴로클라우드 포 하이퍼클로바X’를 출시했고, 향후 다양한 기업용 솔루션도 선보일 방침이다.

성낙호 네이버클라우드 하이퍼스케일(Hyperscale) AI 기술 총괄은 “하이퍼클로바X는 세계 공통의 보편 지식에 한국 특화 문제 해결 능력을 더한 소버린 AI로, 우수한 성능, 강력한 보안을 갖춘 솔루션과 함께 국내 산업계 전반에서 도입이 이뤄지고 있다”며 “자국어 중심 AI에 대한 전세계적 수요가 관찰되는 만큼, 한국에서 확인한 소버린 AI의 경쟁력을 바탕으로 향후 글로벌 시장 진출에도 속도를 낼 것”이라고 말했다. /mohyeyun@sedaily.com

[ⓒ 서울경제TV(www.sentv.co.kr), 무단 전재 및 재배포 금지]

페이스북 공유하기 트위터 공유하기 카카오톡 공유하기 네이버 블로그 공유하기




0/250

0/250