본문 바로가기

IT issue

나노 바나나 일관성 유지 수준은 어느 정도일까?(Gemini vs Grok vs Chat GPT)

목차

    지난 포스팅에서 나노 바나나에 대한 사용법 설명을 드리면서 나노 바나나는 기존 이미지 생성 AI에 비해 일관성 유지가 잘 된다고 말씀드렸습니다. 일관성 유지가 잘 된다는 뜻은 이곤에 AI가 작업했던 이미지의 화풍이나 색감, 배경등이 유지가 된다는 뜻입니다. 나노 바나나의 일관성 유지 능력은 이전 포스팅에서도 드러난 바 있습니다.

     

    2025.09.15 - [IT issue] - 나노 바나나 더 쉽게 사용해보기

    나노 바나나 일관성 유지 수준
    나노 바나나 일관성 유지 수준

     

    위 이미지를 보면 처음에 생성된 이미지를 반복하여 다른 프롬프트를 넣어도 전체적인 건물의 위치와 구조는 크게 변하지 않는 것을 알 수 있습니다. 이것이 일관성 유지인데 도대체 다른 AI는 어떻길래 나노 바나나에 대해서만 이렇게 난리인것일까요?

    그 이유를 알아보기 위해 이번 포스팅에서는 다른 AI와 나노 바나나의 일관성 유지능력에 대해 비교해 보겠습니다. 나노바나나, Chat GPT와 Grok까지 셋을 비교해 보려고 합니다. Chat GPT와 Grok은 이미지 생성 전문 AI가 아니기에 전문영역이 다르기 때문에 억울할 수도 있습니다. 하지만 나노 바나나는 Gemini와 연계하여 그림을 그려주고 Chat GPT는 DALLE, Grok역시 Flux.1와 연계하여 이미지를 그려주기 때문에 사실 불공정한 대결은 아닙니다. 나노 바나나 역시 Gemini를 이용하여 그릴 수 있기 때문입니다. Gemini vs Grok vs Chat GPT 또는 Nano Banana vs DALLE vs Flux.1의 대결이라고 할 수 있을 것 같습니다.

     

    나노 바나나 일관성 유지 수준-원본 이미지
    나노 바나나 일관성 유지 수준-원본 이미지

     

    비교는 위와 같은 원본사진에서 성당의 옆 모습을 그려달라고 했을 때 얼마나 성당과 유사한지를 기준으로 보려고 합니다. 명령어는 모두 "Draw a picture of the cathedral from the side."로 동일합니다.

     

     


    1. Chat GPT의 일관성 유지 능력

    좌: Chat GPT(무료버전) 우:Chat GPT5
    좌: Chat GPT(무료버전) 우:Chat GPT5

     

    실험을 진행했던 셋 중에 GPT가 가장 처참해 보입니다. 측면이라고 하기도 힘들 뿐더러 원본은 사진이였지만 연필로 그린 일러스트입니다. 일관성도 없고 원하는 결과도 아닙니다.

    나중에 생각해보니 "Draw"라는 단어를 오해한 것 같습니다. 물론 그럼에도 다른 AI는 알아서 잘 그려줬지만 원하는 이미지를 그리도록 프롬프트를 약간 수정해보겠습니다.

     

     

    Chat GPT의 일관성 유지 능력
    Chat GPT의 일관성 유지 능력

     

    Chat GPT5에서 "Please draw the side view of the cathedral rotated 90 degrees to the left, while maintaining as much consistency as possible with the original image."으로 그렸더니 조금 더 그럴듯한 결과가 나왔지만 주변 건물의 지붕이 빨간색이라고 해서 성당도 빨간색은 아닐텐데 그부분이 약간 아쉽습니다.


    2. 그록(Grok) 의 일관성 유지 능력

    그록(Grok) 의 일관성 유지 능력
    그록(Grok) 의 일관성 유지 능력

     

    그록은 두개의 이미지를 그려줬습니다. 1번은 성당 자체는 유사한 느낌이 있지만 날씨는 다르고 주변 건물도 사라졌습니다. 2번은 GPT보다는 낫지만 벽돌이나 날씨, 주변이 다른 성당 사진 같습니다. 다만 GPT와 다르게 두 개의 그림 모두 원본과 같은 사진 느낌의 이미지는 유지하고 있습니다. 그리고 두 이미지 공통적으로 옆 모습보다는 대각선 구도로 이것 또한 프롬프트대로 그렸다기 보다 임의의 구도로 그린것 같은 느낌이 듭니다. 추가로 Chat GPT에서 잘 먹었던 프롬프트는 Grok에서는 원하는대로 동작하지 않았습니다.

    Grok에 적용시킨 두번째 프롬프트
    Grok에 적용시킨 두번째 프롬프트

     


    3. 나노 바나나(nano banana) 의 일관성 유지 능력

    나노 바나나(nano banana) 의 일관성 유지 능력
    나노 바나나(nano banana) 의 일관성 유지 능력

     

    이 사진 하나로 나노 바나나의 일관성 유지 능력을 알 수 있을 것 같습니다. 대상이 되는 건물의 모습이나 주변 건물, 날씨 등은 실제 해당 지역에서 성당의 옆 모습을 찍었다고 해도 믿을 것 같은 일관성을 보여주고 있습니다.

    더이상의 말이 필요없을 정도로 나노 바나나는 우수한 능력을 보여줬고 왜 사람들이 그렇게 충격을 받았었는지 알 수 있었습니다. 

    AI에 계속 관심을 가지고 추후 나노 바나나를 비롯한 AI에 이슈가 생길 때 다시 포스팅 하도록 하겠습니다.