코히어, 'Aya Vision' 다국어 비전 모델로 글로벌 비전 도전
반응형
코히어, 'Aya Vision' 다국어 비전 모델로 글로벌 비전 혁신에 도전하다
코히어의 비영리 연구 부서인 Cohere For AI가 다국어 비전 모델 Aya Vision을 공개했습니다. 이 모델은 23개 언어에 걸쳐 이미지와 텍스트를 이해하고 설명할 수 있는 능력을 갖추고 있으며, 전 세계 인구의 절반 이상이 사용하는 언어를 포함하고 있습니다
Aya Vision의 주요 기능
- 다국어 지원
23개 언어로 이미지 캡셔닝, 시각적 질문 답변, 텍스트 생성, 자연스러운 번역 등 다양한 작업을 수행합니다 - 두 가지 모델 사이즈 제공
8B와 32B 두 가지 버전으로 제공되며, 각각 경쟁 모델에 비해 뛰어난 성능을 자랑합니다- 8B 모델은 10배 큰 모델보다 우수한 성능을 보이고, 32B 모델은 2배 큰 모델보다도 더 나은 결과를 보여줍니다
- 오픈 소스와 접근성
Aya Vision은 오픈 소스로 공개되어 연구자와 개발자들이 자유롭게 활용할 수 있습니다. 또한, WhatsApp을 통해 무료로 이용할 수 있는 점도 큰 장점입니다 - 엄격한 벤치마크 공개
코히어는 Aya Vision Benchmark를 오픈 소스로 제공하여, 다국어 다중 모달 평가를 위한 정확한 평가 세트를 마련했습니다
향후 기대
Aya Vision은 다국어 비전 모델 분야에서 새로운 기준을 세우며, 전 세계 사용자들이 다양한 언어로 비전 기반 작업을 수행할 수 있도록 도와줄 것으로 보입니다
반응형
'AI 소식' 카테고리의 다른 글
구글의 'AI 모드' 등장. 검색의 수준을 높이다! (0) | 2025.03.11 |
---|---|
라마인덱스, 'LlamaCloud'로 비정형 데이터 관리의 판을 바꾸다 (0) | 2025.03.10 |
마이크로소프트, 의료 AI 어시스턴트 ‘Dragon Copilot’ (0) | 2025.03.08 |
아마존, 'Alexa+' AI 비서 도전! (0) | 2025.03.06 |
마이크로소프트, Mac 사용자도 누릴 수 있는 'Copilot' 앱 출시 (0) | 2025.03.04 |
댓글