본문 바로가기

Nari Labs, 감정을 담는 ‘디아(Dia)’ TTS 모델 공개

131ZIPDAN 2025. 4. 27.
반응형

Nari Labs, Dia, TTS

Nari Labs, 감정을 담는 ‘디아(Dia)’ TTS 모델 공개

— 감정까지 담아내는 오픈소스 음성 AI가 등장했다

한국 스타트업 Nari Labs가 공개한 디아(Dia)는 텍스트를 실감 나는 음성으로 바꾸는 TTS(Text-to-Speech) 모델이다.
특징은 단순한 음성 출력이 아닌, 감정 표현·화자 태그·비언어적 요소(웃음, 기침 등)까지 생성 가능한 고감도 음성 합성 능력에 있다.

Nari Labs

주요 기능 및 특징

  • 1.6B 파라미터 기반 오픈소스 모델
    Hugging Face에 모델 가중치 공개, 누구나 다운받아 사용할 수 있다.
  • ElevenLabs·Sesame보다 우위
    실제 비교 테스트에서 타이밍·표현력·맥락 반영 성능 모두 상용 모델보다 앞섰다는 평가를 받았다.
  • 화자 클로닝과 일관성 유지
    사용자가 직접 녹음한 예시 음성으로도 감정·억양·톤을 유지한 일관된 출력 가능.
  • Apache-2.0 라이선스
    연구 및 교육 목적으로 자유롭게 활용 가능하며, 다국어 지원·경량화 모델도 차후 순차적으로 출시 예정.

AI 목소리, 이젠 감정까지 전한다

디아는 단순한 기술 진보를 넘어, 목소리의 정서적 질감까지 복원하려는 시도다.
두 명의 개발자가 만든 이 오픈소스 모델은, 상용 제품의 벽을 넘는 창작의 힘을 증명해 보이고 있다.

반응형

댓글