반응형 멀티모달 ai5 구글 Gemini 2.5 Pro 공개! 구글 Gemini 2.5 Pro 공개!— 더 느리게, 더 똑똑하게 생각하는 실전형 AI 등장구글이 Gemini 2.5 Pro (06-05 프리뷰 버전)을 공개했다. 코딩부터 수학, 추론, 멀티모달, 오디오까지 전 영역 성능을 업그레이드하며 GPT-4o와 Claude 4가 점령한 LLM 전선에 제대로 반격을 시작한 셈이다. 이번 업데이트는 단순 ‘스펙 향상’이 아니라, 실제 업무 투입까지 고려된 장기 안정 릴리즈(LTS) 후보 버전이라는 점에서 더욱 눈길을 끈다.주요 특징Deep Think 모드: 더 깊게 생각하는 AIGPT-4 수준의 멀티스텝 추론을 지원하는 새로운 모드다.생각 시간을 스스로 조절하며 USAMO, LiveCodeBench 등 고난도 벤치마크에서 고성능을 입증했다.요지는 간단하다. 이젠 단.. AI 소식 2025. 6. 13. 더보기 ›› OpenAI o3 & o4-mini 공개 “AI야, 알아서 좀 해결해줘”가 진짜 되는 시대 OpenAI o3 & o4-mini 공개 “AI야, 알아서 좀 해결해줘”가 진짜 되는 시대— “AI야, 알아서 좀 해결해줘”가 진짜 되는 시대OpenAI가 o3 모델과 o4-mini 모델을 새롭게 공개했다.이번 업그레이드는 단순히 더 똑똑한 AI를 넘어, 스스로 도구를 꺼내 쓰는 ‘에이전트형 AI’의 도약을 보여준다.주요 기능 및 특징o3: 도구까지 꺼내는 진짜 문제 해결형 AI복잡한 작업에 스스로 코드 실행, 웹 검색, 이미지 분석, 문서 요약을 시도한다.한마디로 “도구 고르는 것부터 실행까지 AI가 전담”.o4-mini: 작지만 민첩한 경량형빠른 응답, 낮은 비용, 구조화 작업에서 강력한 퍼포먼스.팀 단위 업무, 비즈니스 실무에 최적화된 성능.능동적 AI의 시대두 모델 모두 사용자의 요청을 수동적으로.. AI 소식 2025. 4. 24. 더보기 ›› 메타, LLaMA 4 공개로 멀티모달 AI 경쟁에 본격 참전 메타, LLaMA 4 공개로 멀티모달 AI 경쟁에 본격 참전— 이제 AI는 ‘말도 하고, 그림도 읽는다’메타가 발표한 LLaMA 4는 텍스트와 이미지를 동시에 이해하고, 그 안에서 연관된 개념을 추론할 수 있는 멀티모달 AI 모델이다. 단순한 ‘이해’를 넘어, 질문에 대한 논리적 분석과 대화 유지 능력까지 겸비했다.주요 기능 및 특징텍스트 + 이미지 통합 처리단순한 객체 인식을 넘어, 배경, 감정, 의도까지 해석한다. AI가 ‘보는 것’을 ‘이해’하는 수준에 다가가고 있다.베타지만 강력한 퍼포먼스아직은 정식 버전이 아니지만, 이미 다양한 실험 환경에서 높은 성능을 입증 중이다.LLaMA Chat의 발전멀티 앵글 응답하나의 질문에 대해 여러 관점으로 분석해주는 기능.장기 대화 기억력이전 맥락을 유지하며 자.. AI 소식 2025. 4. 13. 더보기 ›› 텐센트, 초거대 언어모델 'Hunyuan'으로 AI 전쟁에 도전 텐센트, 초거대 언어모델 'Hunyuan'으로 AI 전쟁에 도전중국의 빅테크 텐센트가 자사 AI 기술을 한 단계 업그레이드한 초거대 언어모델 Hunyuan을 공개했다. Hunyuan은 특히 중국어에 최적화된 언어 이해 능력을 바탕으로, 문맥 파악과 적절한 답변 생성에 뛰어난 성능을 보여준다. 게다가 멀티모달 기능도 갖추어 텍스트 기반 이미지 생성까지 가능하다.주요 기능 및 특징중국어 최적화 언어 이해중국어를 비롯한 다양한 언어를 효과적으로 처리해, 사용자에게 정확한 정보를 제공한다.멀티모달 기능텍스트 프롬프트에 따라 창의적인 이미지 생성 기능을 지원해, 예를 들어 “우주를 나는 고양이” 같은 요청에 맞는 그림을 만들어 낸다.실무 적용 및 API 지원고객센터 AI 챗봇, 마케팅 이미지 생성, 영상 스크립트.. AI 소식 2025. 4. 2. 더보기 ›› 바이두, ERNIE 4.5 & ERNIE X1 공개! 챗봇도 무료로? 바이두, ERNIE 4.5 & ERNIE X1 공개! 챗봇도 무료로?중국 IT 기업 바이두가 AI 모델 ERNIE 4.5와 ERNIE X1을 발표하며, AI 기술의 새로운 가능성을 보여주었다. 이 두 모델은 텍스트, 이미지, 오디오, 영상까지 다양한 멀티모달 데이터를 처리할 수 있는 능력을 갖췄으며, 실무에 바로 투입 가능한 기능들을 탑재했다. 또한, 바이두는 AI 챗봇 ‘ERNIE Bot’도 개인 사용자에게 무료로 개방해 누구나 손쉽게 AI를 체험할 수 있도록 했다.주요 기능 및 특징ERNIE 4.5 – 멀티모달 이해력 강화텍스트뿐만 아니라 이미지, 오디오, 영상까지 처리하며, 코딩이나 수학 문제 해결 능력도 크게 향상되었다.문서 정리, 이메일 작성, 콘텐츠 기획 등 다양한 실무 작업에 활용될 수 있는.. AI 소식 2025. 3. 21. 더보기 ›› 반응형 이전 1 다음