Nari Labs, 감정을 담는 ‘디아(Dia)’ TTS 모델 공개
반응형

Nari Labs, 감정을 담는 ‘디아(Dia)’ TTS 모델 공개
— 감정까지 담아내는 오픈소스 음성 AI가 등장했다
한국 스타트업 Nari Labs가 공개한 디아(Dia)는 텍스트를 실감 나는 음성으로 바꾸는 TTS(Text-to-Speech) 모델이다.
특징은 단순한 음성 출력이 아닌, 감정 표현·화자 태그·비언어적 요소(웃음, 기침 등)까지 생성 가능한 고감도 음성 합성 능력에 있다.

주요 기능 및 특징
- 1.6B 파라미터 기반 오픈소스 모델
Hugging Face에 모델 가중치 공개, 누구나 다운받아 사용할 수 있다. - ElevenLabs·Sesame보다 우위
실제 비교 테스트에서 타이밍·표현력·맥락 반영 성능 모두 상용 모델보다 앞섰다는 평가를 받았다. - 화자 클로닝과 일관성 유지
사용자가 직접 녹음한 예시 음성으로도 감정·억양·톤을 유지한 일관된 출력 가능. - Apache-2.0 라이선스
연구 및 교육 목적으로 자유롭게 활용 가능하며, 다국어 지원·경량화 모델도 차후 순차적으로 출시 예정.
AI 목소리, 이젠 감정까지 전한다
디아는 단순한 기술 진보를 넘어, 목소리의 정서적 질감까지 복원하려는 시도다.
두 명의 개발자가 만든 이 오픈소스 모델은, 상용 제품의 벽을 넘는 창작의 힘을 증명해 보이고 있다.
반응형
'AI 소식' 카테고리의 다른 글
OpenAI, DALL·E API 전면 개방 (0) | 2025.04.29 |
---|---|
리퀴드 AI, ‘하이에나 엣지(Hyena Edge)’ 공개 (1) | 2025.04.28 |
데미스 하사비스, AI의 끝을 준비하다 (0) | 2025.04.26 |
메카나이즈, 진짜 AI가 모든 노동을 하는 시대가 온다? (0) | 2025.04.25 |
OpenAI o3 & o4-mini 공개 “AI야, 알아서 좀 해결해줘”가 진짜 되는 시대 (0) | 2025.04.24 |
댓글