본문 바로가기
반응형

전체 글293

Qwen3, 문제마다 다르게 생각하는 유연한 LLM의 등장

Qwen3, 문제마다 다르게 생각하는 유연한 LLM의 등장— 깊게 혹은 빠르게, AI의 두 얼굴을 탑재하다알리바바 산하 AI 연구팀이 발표한 Qwen3는 단순히 더 크고 빠른 모델이 아니라, 질문 난이도에 따라 사고 방식을 유연하게 전환하는 ‘하이브리드 사고’ AI다. 복잡한 건 천천히, 단순한 건 즉시, 그게 Qwen3의 방식이다.주요 기능 및 특징2350억 파라미터의 대표 모델, Qwen3-235B-A22B하지만 실제 작동 시에는 10분의 1 수준만 사용, 덕분에 성능은 유지하면서 자원 사용은 최소화.'생각 모드' On/Off 조정 가능복잡한 문제는 깊게 사고, 간단한 건 빠르게 반응.워크플로우 최적화에 유리한 유연성 제공.119개 언어 지원 + 36조 토큰 학습량영어·중국어·한국어는 물론, 아프리카.. AI 소식 2025. 5. 1.

Adobe 파이어플라이(Firefly) 4.0

Adobe 파이어플라이(Firefly) 4.0— 창작 도구의 경계를 허무는 대규모 업데이트Adobe가 크리에이티브 AI 플랫폼 파이어플라이(Firefly)의 4.0 메이저 업데이트를 발표했다.이미지, 비디오, 오디오, 벡터 생성까지 하나로 통합된 이번 업데이트는, 창작 프로세스를 빠르게, 유연하게, 강력하게 지원한다.주요 기능 및 특징통합 프로 워크플로우파이어플라이 웹 앱, 포토샵 웹, 프리미어 프로 등 Creative Cloud 앱과 연동.곧 iOS·Android 모바일 앱 출시 예정.새로운 이미지·벡터 생성 기능Image Model 4 + Image Model 4 Ultra로 아이디어 스케치부터 극사실주의 표현까지 커버.**텍스트 기반 벡터 생성(Text to Vector)**로 로고·일러스트·패턴 .. AI 소식 2025. 4. 30.

OpenAI, DALL·E API 전면 개방

OpenAI, DALL·E API 전면 개방— 이제 AI 그림 기능을 내 앱에 직접 넣는다OpenAI가 DALL·E 이미지 생성 기능을 API로 전면 개방했다.이제는 단순히 ChatGPT 안에서 쓰는 걸 넘어, 웹사이트, 앱, 서비스 어디에나 자유롭게 통합할 수 있는 시대가 열렸다. 주요 기능 및 특징API 통한 이미지 생성 및 편집텍스트 프롬프트로 새 그림 생성은 기본.인페인팅(Inpainting) 기능으로 부분 수정·리터치도 가능.자연스러운 GPT-4o 연동지시 → 생성 → 수정 → 저장을 한 흐름으로 연결.드래그앤드롭만으로 AI 자동 리터칭까지 지원.쉬운 개발, 빠른 통합간단한 API 호출로 앱이나 서비스에 AI 그림 기능 삽입 가능.쇼핑몰, 교육 서비스, 콘텐츠 제작 툴 등 다양한 분야에 적용 기.. AI 소식 2025. 4. 29.

리퀴드 AI, ‘하이에나 엣지(Hyena Edge)’ 공개

리퀴드 AI, ‘하이에나 엣지(Hyena Edge)’ 공개— 스마트폰에서도 날아다니는 엣지 LLM 시대Liquid AI가 발표한 하이에나 엣지(Hyena Edge)는스마트폰 수준의 소형 디바이스에서도 강력하고 빠르게 작동하는 엣지 AI 모델이다.핵심은 전통적인 어텐션(attention) 구조 대신, 컨볼루션(convolution) 방식을 도입했다는 점이다.주요 기능 및 특징컨볼루션 기반 경량 모델복잡한 어텐션 대신 효율적인 컨볼루션 연산으로 속도 향상 + 메모리 사용량 절감 + 정확도 개선이라는 세 마리 토끼를 잡았다.STAR 자동 설계 도구 활용속도, 메모리, 정확도를 최적화하는 모델 아키텍처 탐색 시스템.하이에나 엣지는 이 과정을 통해 화면 전환, 긴 문장 처리, 빠른 응답 생성까지 최적화됐다.실제 .. AI 소식 2025. 4. 28.

Nari Labs, 감정을 담는 ‘디아(Dia)’ TTS 모델 공개

Nari Labs, 감정을 담는 ‘디아(Dia)’ TTS 모델 공개— 감정까지 담아내는 오픈소스 음성 AI가 등장했다한국 스타트업 Nari Labs가 공개한 디아(Dia)는 텍스트를 실감 나는 음성으로 바꾸는 TTS(Text-to-Speech) 모델이다.특징은 단순한 음성 출력이 아닌, 감정 표현·화자 태그·비언어적 요소(웃음, 기침 등)까지 생성 가능한 고감도 음성 합성 능력에 있다.주요 기능 및 특징1.6B 파라미터 기반 오픈소스 모델Hugging Face에 모델 가중치 공개, 누구나 다운받아 사용할 수 있다.ElevenLabs·Sesame보다 우위실제 비교 테스트에서 타이밍·표현력·맥락 반영 성능 모두 상용 모델보다 앞섰다는 평가를 받았다.화자 클로닝과 일관성 유지사용자가 직접 녹음한 예시 음성으로.. AI 소식 2025. 4. 27.
반응형