본문 바로가기
반응형

131 STORY327

ByteDance 씬 단위로 영상을 찍는다?

ByteDance 씬 단위로 영상을 찍는다?Seedance 1.0 Pro 공개, 텍스트로 영화 한 장면 찍기 가능해져ByteDance가 AI 영상 생성 모델 Seedance 1.0 Pro를 공개했다간단한 텍스트 입력만으로 10초 분량의 고화질 영상을 장면 단위로 자동 생성할 수 있는 모델이다텍스트가 시나리오가 되고, AI가 그 흐름에 맞춰 샷을 구성하는 구조다주요 기능 및 특징내러티브 기반 영상 생성Seedance 1.0 Pro는 단순한 한 컷 영상 생성이 아니라A에서 B를 거쳐 C로 이어지는 영화처럼 장면의 흐름을 구성할 수 있다멀티 입력 학습 방식텍스트 기반 생성뿐만 아니라 이미지 기반 생성도 지원하며장면별 컨텍스트를 분리해 영상의 일관성을 유지한다RLHF 기법 활용사람 눈에 보기 좋은 영상 흐름을 .. AI 소식 2025. 6. 20.

매텔, 오픈AI와 AI 장난감 개발을?

매텔, 오픈AI와 AI 장난감 개발을?Barbie와 Hot Wheels에도 AI 경험이 탑재될까완구 브랜드 매텔(Mattel)이 오픈AI(OpenAI)와 전략적 협업을 체결했다이번 협업은 매텔의 대표 브랜드에 AI를 접목해 지능형 장난감과 디지털 경험을 제공하는 것이 목표다올해 말 첫 제품 출시가 예정되어 있다주요 기능 및 특징AI 인터랙션 장난감매텔은 오픈AI의 ChatGPT 기술을 포함한 다양한 생성형 AI 도구를 제품에 통합할 계획이다Barbie, Hot Wheels, American Girl 같은 브랜드 중심으로 맞춤형 상호작용 기능이 적용될 예정이다내부용 AI 도입매텔은 ChatGPT 엔터프라이즈를 도입해 콘텐츠 개발, 아이디어 발굴, 업무 자동화 등에 AI를 활용 중이다안전성과 책임제품의 안전.. AI 소식 2025. 6. 18.

메타, 물리 추론 가능한 월드 모델 V‑JEPA 2 공개

메타, 물리 추론 가능한 월드 모델 V-JEPA 2 공개비디오 기반 직관 학습으로 로봇 제어까지 지원하는 세계 모델메타(Meta)가 비디오 기반의 월드 모델 V-JEPA 2를 발표했다이 모델은 단순한 비주얼 인식 수준을 넘어서 실제 물리 세계의 상황을 예측하고 계획하는 능력을 갖췄다낯선 물체를 인식하고, 그것을 잡아 다른 위치에 놓는 등의 로봇 행동도 가능해졌다주요 기능 및 특징직관적 물리 추론12억 파라미터 규모로 훈련된 V-JEPA 2는 영상 데이터를 중심으로 학습되었으며인간의 직관처럼 사전 경험 없이도 상황을 예측하고 조작 가능성을 판단할 수 있다비디오 기반 학습 구조기존 이미지 기반 모델들과 달리 시간 흐름 속에서 객체의 움직임을 분석하고그에 따라 행동을 계획할 수 있는 구조를 갖췄다로봇 제어를 .. AI 소식 2025. 6. 16.

구글 Gemini 2.5 Pro 공개!

구글 Gemini 2.5 Pro 공개!— 더 느리게, 더 똑똑하게 생각하는 실전형 AI 등장구글이 Gemini 2.5 Pro (06-05 프리뷰 버전)을 공개했다. 코딩부터 수학, 추론, 멀티모달, 오디오까지 전 영역 성능을 업그레이드하며 GPT-4o와 Claude 4가 점령한 LLM 전선에 제대로 반격을 시작한 셈이다. 이번 업데이트는 단순 ‘스펙 향상’이 아니라, 실제 업무 투입까지 고려된 장기 안정 릴리즈(LTS) 후보 버전이라는 점에서 더욱 눈길을 끈다.주요 특징Deep Think 모드: 더 깊게 생각하는 AIGPT-4 수준의 멀티스텝 추론을 지원하는 새로운 모드다.생각 시간을 스스로 조절하며 USAMO, LiveCodeBench 등 고난도 벤치마크에서 고성능을 입증했다.요지는 간단하다. 이젠 단.. AI 소식 2025. 6. 13.

ChatGPT for Business, 회의도 듣고 요약도 한다

ChatGPT for Business, 회의도 듣고 요약도 한다— “누가 방금 한 말 기억해?”를 AI가 대신 들어준다OpenAI가 기업용 ChatGPT에 대대적인 업데이트를 진행하며, 이젠 회의 녹음과 내부 시스템 연결까지 가능한 협업 도구로 진화하고 있다. 단순히 대화만 하던 AI가 이제는 직접 회의에 참여해 요약하고 정리하는 역할까지 도맡는다.주요 기능 및 특징클라우드 서비스 연동Google Drive, Outlook, Dropbox, SharePoint, Teams 등과 직접 연결돼, 문서 업로드 없이 실시간 정보 검색과 분석이 가능하다.레코드 모드(Record Mode)회의 중 AI가 음성을 녹음하고, 핵심 내용 요약 + 할 일 추출 + 검색 가능 항목으로 정리. “기록보다 집중”이 가능해진다... AI 소식 2025. 6. 11.
반응형