본문 바로가기

코히어, 'Aya Vision' 다국어 비전 모델로 글로벌 비전 도전

131ZIPDAN 2025. 3. 9.
반응형

aya_vision

코히어, 'Aya Vision' 다국어 비전 모델로 글로벌 비전 혁신에 도전하다

코히어의 비영리 연구 부서인 Cohere For AI가 다국어 비전 모델 Aya Vision을 공개했습니다. 이 모델은 23개 언어에 걸쳐 이미지와 텍스트를 이해하고 설명할 수 있는 능력을 갖추고 있으며, 전 세계 인구의 절반 이상이 사용하는 언어를 포함하고 있습니다

aya vision
ⓒ Cohere

Aya Vision의 주요 기능

  • 다국어 지원
    23개 언어로 이미지 캡셔닝, 시각적 질문 답변, 텍스트 생성, 자연스러운 번역 등 다양한 작업을 수행합니다
  • 두 가지 모델 사이즈 제공
    8B와 32B 두 가지 버전으로 제공되며, 각각 경쟁 모델에 비해 뛰어난 성능을 자랑합니다
    • 8B 모델은 10배 큰 모델보다 우수한 성능을 보이고, 32B 모델은 2배 큰 모델보다도 더 나은 결과를 보여줍니다
  • 오픈 소스와 접근성
    Aya Vision은 오픈 소스로 공개되어 연구자와 개발자들이 자유롭게 활용할 수 있습니다. 또한, WhatsApp을 통해 무료로 이용할 수 있는 점도 큰 장점입니다
  • 엄격한 벤치마크 공개
    코히어는 Aya Vision Benchmark를 오픈 소스로 제공하여, 다국어 다중 모달 평가를 위한 정확한 평가 세트를 마련했습니다

aya 다국어 비전 모델
ⓒ Cohere

향후 기대

Aya Vision은 다국어 비전 모델 분야에서 새로운 기준을 세우며, 전 세계 사용자들이 다양한 언어로 비전 기반 작업을 수행할 수 있도록 도와줄 것으로 보입니다

반응형

댓글