제2 딥시크 되나…中 AI '키미 K2 씽킹' 성능은

경제·산업 입력 2025-11-17 08:54:57 수정 2025-11-17 08:54:57 이채우 기자 0개

페이스북 공유하기 X 공유하기 카카오톡 공유하기 네이버 블로그 공유하기

다수 벤치마크서 챗GPT 5.0보다 높은 점수

키미 홈페이지 [사진=키미 홈페이지 캡처]


[서울경제TV=이채우 인턴기자] 알리바바와 텐센트가 투자한 중국 인공지능(AI) 기업 문샷AI가 최근 내놓은 오픈소스 대형언어모델(LLM) '키미 K2 씽킹(Kimi-K2-Thinking)'이 글로벌 업계의 시선을 끌고 있다.

17일 업계에 따르면, '키미 K2 씽킹'이 주목받는 이유는 성능뿐만이 아니다. 모델 훈련비가 올해 초 '딥시크(V3)'를 공개하며 시장을 뒤흔든 중국 대표 LLM 딥시크보다도 낮은 것으로 알려지면서, 오픈소스 모델이 다시 프론티어 모델과 어깨를 나란히 할 수 있다는 기대감이 커지고 있다.

문샷AI는 지난 6일 홈페이지를 통해 키미 K2 씽킹을 공식 공개했다. 지난 7월 '키미 K2'를 발표한 뒤 넉 달 만에 업그레이드 버전을 다시 내놓은 것으로, 문샷AI가 지난해부터 강조해온 '효율 최적화 모델' 전략이 본격적으로 속도를 내는 모습이다.

국내 이용자도 키미 사이트에 접속하면 곧바로 사용해볼 수 있다. 대화형 모델 기반이라 챗GPT와 사용 방식은 비슷하며 한국어 처리에서도 큰 불편은 없는 것으로 보인다.

공개된 성능 지표를 보면 상승 폭은 더 눈에 띈다. 다양한 분야의 추론·창의적 사고 능력을 평가하는 HLE 테스트에서 '키미 K2 씽킹'은 '도구 사용 모드' 기준 44.9점을 기록했다. 같은 조건에서 챗GPT 5.0은 41.7점, 클로드 소네트 4.5는 32.0점, 딥시크 V3.2는 20.3점이었다.

웹 검색 능력을 평가하는 '브라우즈콤프'에서도 K2 씽킹은 60.2점으로 챗GPT 5.0(54.9점)과 클로드 소네트 4.5(24.1점)를 앞섰다. 최신 정보를 얼마나 잘 수집하는지를 평가하는 'Seal-0' 테스트에서도 두 모델보다 높은 점수를 기록했다고 문샷AI는 밝혔다.

다만 모든 영역에서 우위에 선 것은 아니다. 코딩 능력을 평가하는 SWE 벤치마크에서는 여전히 챗GPT 5.0과 클로드 소네트 4.5에 못 미치는 점수를 받았다.

기술 업계에서도 "추론과 검색에 최적화된 모델"이라는 평가와 함께 "범용성 면에서는 아직 판단을 더 유보해야 한다"는 신중론이 병존한다.

문샷AI의 훈련비용도 화제를 모았다. CNBC는 소식통을 인용해 키미 K2 씽킹의 훈련 비용이 460만 달러(약 67억 원) 수준이라고 전했다. 이는 수십억 달러 규모로 추정되는 오픈AI의 모델 훈련 비용은 물론 딥시크가 밝힌 560만 달러보다도 적은 금액이다.

다만 전문가들은 "해당 비용이 전체 연구개발비인지 특정 학습 라운드 비용인지 명확하지 않다"며 "훈련비만 놓고 모델 효율성을 단정하기는 어렵다"고 지적한다.

키미 K2 씽킹을 출시한 문샷 AI 홈페이지 [사진=문샷 AI 홈페이지 캡처]

국내 전문가들은 키미 K2 씽킹이 보여준 벤치마크 결과는 주목할 필요가 있다고 밝혔다.

한 국내 AI 업계 전문가는 "키미 K2 씽킹은 오픈소스 모델이라 자유롭게 내려받아 활용할 수 있는 모델임에도 공신력 있는 벤치마크 테스트에서도 폐쇄형 프론티어 모델들과 어깨를 나란히 하는 수준의 성능과 높은 효율성을 보여 업계에서도 주목받고 있다"고 말했다.

이어 "추론이나 검색 능력에서 성능이 높고 그에 드는 비용이 아주 적다는 점에서 올해 초 딥시크 모델 공개와 비슷한 상황"이라며 "다만 딥시크 때 중국 AI에 대한 인식에 큰 충격이 있었기에 현재는 그 정도의 이슈화는 되지 않는 것 같다"고 덧붙였다.

또 다른 업계 관계자도 "미국이 중국에 대해 GPU(그래픽 처리장치) 통제를 하는 상황에서 이 같은 성능이 나왔다는 건 엄청난 것"이라며 "우리 업계도 키미 K2 씽킹에 대해 연구해 볼 필요가 있다"고 말했다.

다만, 아직 키미 K2 씽킹에 대해 어떤 판단을 내리기에는 이르다는 의견도 있다.

한 업계 교수는 "벤치마크 성능이 꼭 사용자들의 만족성과 사용성과 비례하진 않는다"며 "공개된 내용만으로는 아직 AI 업계 지형을 바꿀 정도로 엄청난 효율이 있다고 단정하기는 좀 어려워 보인다"고 말했다.
/dlcodn1226@sedaily.com

[ⓒ 서울경제TV(www.sentv.co.kr), 무단 전재 및 재배포 금지]

페이스북 공유하기 X 공유하기 카카오톡 공유하기 네이버 블로그 공유하기

댓글

(0)
※ 댓글 작성시 상대방에 대한 배려와 책임을 담아 깨끗한 댓글 환경에 동참에 주세요. 0 / 300

주요뉴스

공지사항

더보기 +

이 시각 이후 방송더보기