본문 바로가기
반응형

멀티모달 ai3

메타, LLaMA 4 공개로 멀티모달 AI 경쟁에 본격 참전

메타, LLaMA 4 공개로 멀티모달 AI 경쟁에 본격 참전— 이제 AI는 ‘말도 하고, 그림도 읽는다’메타가 발표한 LLaMA 4는 텍스트와 이미지를 동시에 이해하고, 그 안에서 연관된 개념을 추론할 수 있는 멀티모달 AI 모델이다. 단순한 ‘이해’를 넘어, 질문에 대한 논리적 분석과 대화 유지 능력까지 겸비했다.주요 기능 및 특징텍스트 + 이미지 통합 처리단순한 객체 인식을 넘어, 배경, 감정, 의도까지 해석한다. AI가 ‘보는 것’을 ‘이해’하는 수준에 다가가고 있다.베타지만 강력한 퍼포먼스아직은 정식 버전이 아니지만, 이미 다양한 실험 환경에서 높은 성능을 입증 중이다.LLaMA Chat의 발전멀티 앵글 응답하나의 질문에 대해 여러 관점으로 분석해주는 기능.장기 대화 기억력이전 맥락을 유지하며 자.. AI 소식 2025. 4. 13.

텐센트, 초거대 언어모델 'Hunyuan'으로 AI 전쟁에 도전

텐센트, 초거대 언어모델 'Hunyuan'으로 AI 전쟁에 도전중국의 빅테크 텐센트가 자사 AI 기술을 한 단계 업그레이드한 초거대 언어모델 Hunyuan을 공개했다. Hunyuan은 특히 중국어에 최적화된 언어 이해 능력을 바탕으로, 문맥 파악과 적절한 답변 생성에 뛰어난 성능을 보여준다. 게다가 멀티모달 기능도 갖추어 텍스트 기반 이미지 생성까지 가능하다.주요 기능 및 특징중국어 최적화 언어 이해중국어를 비롯한 다양한 언어를 효과적으로 처리해, 사용자에게 정확한 정보를 제공한다.멀티모달 기능텍스트 프롬프트에 따라 창의적인 이미지 생성 기능을 지원해, 예를 들어 “우주를 나는 고양이” 같은 요청에 맞는 그림을 만들어 낸다.실무 적용 및 API 지원고객센터 AI 챗봇, 마케팅 이미지 생성, 영상 스크립트.. AI 소식 2025. 4. 2.

바이두, ERNIE 4.5 & ERNIE X1 공개! 챗봇도 무료로?

바이두, ERNIE 4.5 & ERNIE X1 공개! 챗봇도 무료로?중국 IT 기업 바이두가 AI 모델 ERNIE 4.5와 ERNIE X1을 발표하며, AI 기술의 새로운 가능성을 보여주었다. 이 두 모델은 텍스트, 이미지, 오디오, 영상까지 다양한 멀티모달 데이터를 처리할 수 있는 능력을 갖췄으며, 실무에 바로 투입 가능한 기능들을 탑재했다. 또한, 바이두는 AI 챗봇 ‘ERNIE Bot’도 개인 사용자에게 무료로 개방해 누구나 손쉽게 AI를 체험할 수 있도록 했다.주요 기능 및 특징ERNIE 4.5 – 멀티모달 이해력 강화텍스트뿐만 아니라 이미지, 오디오, 영상까지 처리하며, 코딩이나 수학 문제 해결 능력도 크게 향상되었다.문서 정리, 이메일 작성, 콘텐츠 기획 등 다양한 실무 작업에 활용될 수 있는.. AI 소식 2025. 3. 21.
반응형