알리바바 AI, 레이어도 지원하고 그 자리에서 편집까지

박스쿤
박스쿤
읽음 3
QWEN 이미지 레이어

알리바바의 Qwen 팀이 2025년 12월 18일 출시한 Qwen-Image-Layered 모델은 이미지를 여러 RGBA 레이어로 분해해 독립적으로 편집할 수 있게 합니다. 전경, 배경, 객체 등을 투명도 포함해 분리하며, 재귀적 분해로 복잡한 수정도 가능합니다.

요즘 AI 기술이 빠르게 발전하면서, 일상적인 작업들이 훨씬 수월해지고 있습니다. 특히 이미지 편집 분야에서 알리바바의 Qwen 팀이 내놓은 Qwen-Image-Layered 모델은 주목할 만하죠. 이 모델은 단순히 이미지를 생성하거나 수정하는 데 그치지 않고, 이미지를 여러 층으로 쪼개서 편집할 수 있게 해줍니다.

Qwen-Image-Layered의 매력은 이미지를 의미 있는 단위로 분해하는 데 있습니다. 예를 들어, 한 장의 사진을 전경 객체, 배경, 텍스트 등으로 나누어 각각 RGBA(색상과 투명도) 레이어로 만듭니다. 이렇게 되면 특정 부분만 수정해도 전체 이미지가 왜곡되지 않아요. 지금 AI들은 사실 투명 배경의 PNG 이미지는 못만들잖아요?

이 모델은 Qwen2.5-VL 기반의 확산 모델을 사용해 이미지를 분석합니다. 입력 이미지를 받아 자동으로 3개에서 8개 이상의 레이어로 분할하죠. 재귀적 분해가 가능해서, 하나의 레이어를 다시 세분화할 수 있습니다. 예를 들어, 배경 레이어를 더 자세히 나누면 하늘과 땅으로 쪼개질 수 있어요. 이 과정에서 AI가 가려진 부분을 추정해 복원해주니, 정말 똑똑합니다.

특징 기존 툴 (e.g., Photoshop) Qwen-Image-Layered
레이어 생성 수동으로 마스킹하고 분리 AI 자동 분해 (RGBA 포함)
편집 독립성 주변 영향 가능 (왜곡 발생) 물리적 격리, 무영향 수정
복원 기능 수동 Inpainting 자동 AI 복원
복잡도 처리 한계 있음 (수동 작업) 재귀 분해로 무한 세분화
접근성 전문 소프트웨어 필요 오픈소스, ComfyUI 통합
알리바바AI 레이어 예시

이 데모처럼 이미지가 레이어로 쪼개진 걸 보니 신기하더라구요. 또 다른 예로, 광고에서 텍스트만 수정해도 전체가 자연스럽게 유지됩니다. 제 블로그 포스트 이미지 편집에도 바로 써보고 싶어요.

기술적으로는 엔드투엔드 확산 모델을 기반으로 합니다. GitHub나 Hugging Face에서 모델을 다운로드할 수 있고, ComfyUI 워크플로우로 쉽게 테스트할 수 있어요. 라이선스가 Apache 2.0이라 상업적 이용도 자유롭습니다. 개발자라면 커스텀해서 더 발전시킬 수 있을 거예요. 다만, 아직 모델 크기나 성능 벤치마크가 자세히 공개되지 않았으니, 실제 사용하며 확인해봐야 합니다.

댓글 0

댓글 0개

댓글을 남기시면 관리자가 최대한 빠르게 확인 후 답글을 남겨드립니다.
구글 간편 로그인 후 댓글 작성시 포인트가 누적되며, 회원전용글 열람이 가능합니다.

댓글 남기기

이 글이 마음에 드시나요?

최신 소식과 유용한 정보를 메일함으로
무료로 받아보세요!

이미 구독 중이신가요? 로그인