카카오, 가드레일 모델 ‘카나나 세이프가드’ 공개
경제·산업
입력 2025-05-27 09:20:44
수정 2025-05-27 09:20:44
이수빈 기자
0개
국내 기업 최초 오픈소스 배포

최근 다양한 생성형 AI 서비스들이 확산되는 가운데 유해 콘텐츠의 위험성에 대한 사회적 우려가 증대되고 있다. 카카오는 이에 대한 기술적·제도적 장치인 AI 가드레일 시스템 마련에 대한 필요성을 인식하고 Kanana Safeguard 모델을 개발하게 됐다. 주요 빅테크에서는 생성형 AI를 통해 발생할 수 있는 위험 요소를 감지하는데 특화된 모델을 운영 중이다.
Kanana Safeguard는 카카오가 자체 개발한 언어모델 ‘카나나(Kanana)’를 기반 기술로 활용했으며, 한국어 및 한국 문화를 반영한 자체 구축 데이터셋을 활용해 한국어에 특화된 성능을 보유하고 있다. AI 모델의 정밀도와 재현율을 평가하는 수치인 F1 스코어를 기준으로 평가한 결과, 한국어 성능에서 글로벌 모델 이상의 성과를 기록하기도 했다.
이번에 오픈소스로 공개한 모델은 총 3가지로, 각각의 모델은 리스크 유형에 따라 유해성 및 위험성에 대한 효과적 탐지가 가능하다. ▲사용자의 발화 또는 AI의 답변에서 증오, 괴롭힘, 성적 콘텐츠 등에 대한 유해성을 탐지하는 ‘Kanana Safeguard’ ▲개인 정보나 지식재산권 등 법적 측면에서 주의가 필요한 요청을 탐지하는 ‘카나나 세이프가드 사이렌(Kanana Safeguard-Siren)’ ▲AI 서비스를 악용하려는 사용자의 공격을 탐지하는 ‘카나나 세이프가드 프롬프트(Kanana Safeguard-Prompt)’이며, 모두 허깅페이스를 통해 다운로드 할 수 있다.
카카오는 안전한 AI 생태계의 구축에 기여하고자 Kanana Safeguard에 상업적 이용과 수정 및 재배포 등이 자유롭게 가능한 아파치2.0 라이선스를 적용했다. 향후 지속적인 업데이트를 통해 모델을 고도화 할 예정이다.
김경훈 카카오 AI 세이프티 리더는 “생성형 AI의 등장 이래, 기술의 발전과 더불어 AI 윤리와 안전성에 대한 중요성이 국내외에서 점차 부각되고 있다”며 “책임감 있는 AI 구축에 대한 인식을 널리 확산시키고, 사회적 가치를 고려한 기술 개발이 이어질 수 있도록 선제적인 대응을 이어갈 계획”이라고 말했다./q00006@sedaily.com
[ⓒ 서울경제TV(www.sentv.co.kr), 무단 전재 및 재배포 금지]

관련뉴스
- 포스코이앤씨, 고속도로 현장 사고 사과…"전 현장 안전 점검 착수"
- 낙동강 중금속 오염·석포제련소 오염 논란에...여당 대표경선 후보 문제 해결 공언
- 분자X대물섬, 프라이빗 디너 행사 성료…"미식·전통주 페어링"
- KAI, 2분기 영업익 852억…전년比 14.7%↑
- 빌리엔젤, '떠먹케' 시리즈 확대 출시…"디저트 시장 공략"
- KT, AI 보이스피싱 탐지 서비스 2.0 출시
- 공영홈쇼핑, 수해 피해 지역 지원 나서
- 한성숙 중기부 장관 "중소기업 질주하는 고속도로 만들 것"
- 한화오션, 2분기 영업이익 3717억…흑자전환
- 동국제강그룹, 혹서기 근로자 대상 아이스데이 진행
주요뉴스
오늘의 날씨
마포구 상암동℃
강수확률 %
기획/취재
주간 TOP뉴스
- 1‘제27회 기장갯마을축제’ 7월 31일~8월 3일 개최
- 2정남진 장흥 물축제, 글로벌 화합의 장으로 거듭나다
- 3인천 옹진군, 복지시설 급식지원 체계 강화
- 4김찬진 인천 동구청장, 취약계층 청소 봉사 나서
- 5유정복 인천시장, 도시개발·문화현장 점검
- 6지방소멸 대응 민관기구 발족 "지역 맞춤형 균형발전 모델 제시할 것"
- 7해남군, 2027년까지 '생활인구 600만 명 시대' 연다
- 8포스코이앤씨, 고속도로 현장 사고 사과…"전 현장 안전 점검 착수"
- 9김철우 보성군수, 332억 원 투입 '사람이 돌아오는 보성' 실현 박차
- 10남원시, 전국 최초 '스마트경로당'…비대면진료 서비스 본격화
댓글
(0)