본문 바로가기

Trend Issue

구글 Whisk AI 리뷰: 텍스트 없이 이미지만으로 그림을 만드는 새로운 이미지 생성기

반응형

생성형 AI가 빠르게 발전하면서, 텍스트 프롬프트로 이미지를 만드는 도구는 이제 흔해졌습니다. 그런데 2025년에는 조금 다른 방향의 도구가 등장해 주목을 받고 있습니다. 바로 구글 랩스에서 공개한 Whisk(위스크) AI입니다. Whisk는 긴 텍스트를 쓰지 않고, 이미지 세 장만으로 새로운 이미지를 만들어내는 실험적 AI 이미지 생성 도구입니다.

위스크 메인화면 소개
위스크 메인화면

1. Whisk AI란 무엇인가?

Whisk AI는 구글 Labs에서 제공하는 이미지 생성 실험 도구로, 일반적인 텍스트 프롬프트 방식이 아니라 이미지를 프롬프트로 사용하는 것이 특징입니다. 사용자는 세 가지 요소를 각각 이미지로 넣습니다.

  • Subject(주제) – 캐릭터, 물건, 인물 등 중심 요소
  • Scene(장면) – 배경, 환경, 장소
  • Style(스타일) – 그림체, 질감, 색감, 분위기

이렇게 세 장의 이미지를 올리면, Whisk가 각 이미지를 분석해 주제·장면·스타일을 조합한 새로운 이미지를 만들어 줍니다. 단순히 이미지를 섞는 것이 아니라, 이미지의 특징을 이해하고 다시 그려주는 방식이라 “복붙”이 아니라 “리믹스”에 가깝습니다.

2. Whisk AI의 동작 방식

구글이 공개한 설명에 따르면, Whisk는 내부적으로 멀티모달 AI 모델인 Gemini최신 이미지 생성 모델(VEO3)을 함께 사용합니다.

  • 사용자가 올린 이미지를 보고 AI가 상세한 캡션(텍스트 설명)을 자동 생성
  • 그 설명을 바탕으로 이미지 생성 모델이 새로운 이미지를 다시 생성
  • 결과적으로 원본을 그대로 복사하지 않고, “본질과 분위기만 가져와 새로 그린 이미지” 생성

즉, 겉으로 보기에는 “이미지 세 장 넣고 결과 한 장 받는” 단순한 구조지만, 내부에서는 텍스트 이해·이미지 이해·스타일 분석이 복합적으로 이루어지는 구조입니다.

3. Whisk AI의 핵심 특징

1) 텍스트 없이도 고급 이미지 생성 가능

기존 AI 도구는 “영어로 아주 긴 프롬프트를 잘 써야” 좋은 결과가 나오는 경우가 많았습니다. Whisk는 이 장벽을 낮추기 위해, 이미지를 직접 보여주는 것만으로도 충분한 프롬프트 역할을 하게 설계되었습니다. 그림 실력은 없지만 참고 이미지는 많은 사람들에게 특히 유리한 방식입니다.

2) 주제·장면·스타일을 자유롭게 리믹스

예를 들어 다음과 같은 조합이 가능합니다.

  • 주제: 인물 사진
  • 장면: 해변 풍경 사진
  • 스타일: 수채화 일러스트 이미지

이 조합으로 “해변을 배경으로 한 수채화 스타일 인물 이미지”를 만들 수 있습니다. 반대로 같은 주제 이미지를 두고 장면이나 스타일만 바꿔 여러 버전을 만드는 것도 가능합니다.

3) 상업용 아트·굿즈용 이미지에도 적합한 퀄리티

Whisk에 대한 해외 리뷰들을 보면, 단순한 실험용 장난감 수준을 넘어 상업적 가치가 있는 디지털 아트를 만들 수 있을 정도의 품질이라는 평가도 있습니다. 실제로 스티커, 굿즈, 디지털 다운로드용 아트 소스 등에 활용하려는 크리에이터들이 테스트를 진행하고 있습니다.

4. 실제 사용 시 장점

  • 프롬프트 작성 부담 감소: 영어 문장을 길게 쓰지 않아도 됨
  • 디자인 감각이 부족해도 참고 이미지로 컨셉 전달 가능
  • 주제·배경·스타일을 분리해 생각할 수 있어 콘셉트 기획에 좋음
  • 참고 이미지를 재활용해 다양한 변주 이미지 생산 가능

5. 단점과 한계

Whisk AI는 아직 ‘정식 상용 제품’이라기보다는 실험적 도구에 가깝기 때문에, 몇 가지 제약과 한계도 있습니다.

  • 접근성 제약: 현재 일부 국가(예: 미국 기준 우선 제공) 중심으로 사용 가능
  • 정밀 제어 한계: 텍스트 프롬프트에 비해 세세한 조건(예: 구체적 문장, 복잡한 상황)을 지정하기 어려운 면이 있음
  • 원본 이미지 의존: 좋은 참고 이미지를 준비하지 않으면 결과물도 제한적일 수 있음
  • 라이선스·저작권 이슈는 사용자가 따로 확인 필요

6. Whisk AI는 누구에게 유용할까?

  • 참고 이미지는 많지만, 글로 설명하는 프롬프트에 약한 사람
  • 굿즈·스티커·디지털 아트를 만들고 싶은 크리에이터
  • 컨셉 아트·캐릭터 스타일을 빠르게 여러 버전으로 보고 싶은 디자이너
  • 블로그·SNS용 이미지 아이디어를 뽑아내고 싶은 콘텐츠 기획자

7. 다른 이미지 생성 AI와 비교했을 때 위치

간단히 정리하면 다음과 같은 느낌으로 볼 수 있습니다.

  • Midjourney – 텍스트 프롬프트 기반 예술적 이미지에 강함
  • Stable Diffusion – 커스터마이징·로컬 모델 활용에 강함
  • ImageFX – 텍스트에서 이미지를 만드는 구글의 또 다른 도구
  • Whisk – 텍스트와 이미지를 프롬프트로 쓰는 “이미지로 이미지 만드는 도구”

즉 Whisk는 기존 도구를 대체하기보다는, “텍스트 프롬프트 없이도 직관적으로 이미지를 만들고 싶은 사람”을 위한 새로운 옵션에 가깝습니다.

정리

Whisk AI는 “이미지로 이미지를 만드는” 방식이라는 점에서 기존 생성형 AI와 확실히 구분되는 도구입니다. 아직 실험적 단계이고 접근성은 제한적이지만, 프롬프트 작성 부담이 큰 사용자나, 다양한 레퍼런스를 활용해 새로운 이미지를 리믹스하고 싶은 크리에이터에게는 충분히 매력적인 선택지입니다.

향후 정식 서비스로 확장되거나, 다른 이미지 생성 모델과 결합된다면 블로그·SNS·굿즈 제작 등 실전 작업에서 활용도가 더 높아질 것으로 보입니다.

 

반응형