알리바바의 Qwen 팀이 2025년 12월 18일 출시한 Qwen-Image-Layered 모델은 이미지를 여러 RGBA 레이어로 분해해 독립적으로 편집할 수 있게 합니다. 전경, 배경, 객체 등을 투명도 포함해 분리하며, 재귀적 분해로 복잡한 수정도 가능합니다.
요즘 AI 기술이 빠르게 발전하면서, 일상적인 작업들이 훨씬 수월해지고 있습니다. 특히 이미지 편집 분야에서 알리바바의 Qwen 팀이 내놓은 Qwen-Image-Layered 모델은 주목할 만하죠. 이 모델은 단순히 이미지를 생성하거나 수정하는 데 그치지 않고, 이미지를 여러 층으로 쪼개서 편집할 수 있게 해줍니다.
Qwen-Image-Layered의 매력은 이미지를 의미 있는 단위로 분해하는 데 있습니다. 예를 들어, 한 장의 사진을 전경 객체, 배경, 텍스트 등으로 나누어 각각 RGBA(색상과 투명도) 레이어로 만듭니다. 이렇게 되면 특정 부분만 수정해도 전체 이미지가 왜곡되지 않아요. 지금 AI들은 사실 투명 배경의 PNG 이미지는 못만들잖아요?
이 모델은 Qwen2.5-VL 기반의 확산 모델을 사용해 이미지를 분석합니다. 입력 이미지를 받아 자동으로 3개에서 8개 이상의 레이어로 분할하죠. 재귀적 분해가 가능해서, 하나의 레이어를 다시 세분화할 수 있습니다. 예를 들어, 배경 레이어를 더 자세히 나누면 하늘과 땅으로 쪼개질 수 있어요. 이 과정에서 AI가 가려진 부분을 추정해 복원해주니, 정말 똑똑합니다.
| 특징 | 기존 툴 (e.g., Photoshop) | Qwen-Image-Layered |
|---|---|---|
| 레이어 생성 | 수동으로 마스킹하고 분리 | AI 자동 분해 (RGBA 포함) |
| 편집 독립성 | 주변 영향 가능 (왜곡 발생) | 물리적 격리, 무영향 수정 |
| 복원 기능 | 수동 Inpainting | 자동 AI 복원 |
| 복잡도 처리 | 한계 있음 (수동 작업) | 재귀 분해로 무한 세분화 |
| 접근성 | 전문 소프트웨어 필요 | 오픈소스, ComfyUI 통합 |
이 데모처럼 이미지가 레이어로 쪼개진 걸 보니 신기하더라구요. 또 다른 예로, 광고에서 텍스트만 수정해도 전체가 자연스럽게 유지됩니다. 제 블로그 포스트 이미지 편집에도 바로 써보고 싶어요.
기술적으로는 엔드투엔드 확산 모델을 기반으로 합니다. GitHub나 Hugging Face에서 모델을 다운로드할 수 있고, ComfyUI 워크플로우로 쉽게 테스트할 수 있어요. 라이선스가 Apache 2.0이라 상업적 이용도 자유롭습니다. 개발자라면 커스텀해서 더 발전시킬 수 있을 거예요. 다만, 아직 모델 크기나 성능 벤치마크가 자세히 공개되지 않았으니, 실제 사용하며 확인해봐야 합니다.
댓글 0개
댓글을 남기시면 관리자가 최대한 빠르게 확인 후 답글을 남겨드립니다.구글 간편 로그인 후 댓글 작성시 포인트가 누적되며, 회원전용글 열람이 가능합니다.
확인되지 않은 URL
본 사이트에서 이동할 시 위험할 수 있으며, 이 후 책임은 이 사이트가 책임지지 않습니다. 이동하시겠습니까?
AI 교정
AI가 내용을 분석하고 있습니다...
원본
AI 교정
교정 내용을 확인하고 '적용하기'를 클릭하세요.
코드 삽입
이미지 추가 (Imgur)
이미지 호스팅 Imgur에 이미지를 업로드한 후,
이미지 주소(Direct Link)를 입력해주세요.