IT/바이오

AI 이미지 1.5로 미세편집까지…오픈AI, 구글 제치고 1위

신민재 기자
입력

생성형 인공지능이 단순 이미지 생성 단계를 넘어 정밀 편집 도구로 진화하고 있다. 오픈AI가 챗GPT에 통합한 새 이미지 모델 챗GPT 이미지 1.5는 전체 그림을 유지하면서도 사용자가 지정한 국소 영역만 미세하게 수정할 수 있는 것이 특징이다. 출시 시점부터 글로벌 평가 플랫폼에서 구글의 최신 모델을 제치고 1위에 오르며, 이미지 기반 AI 서비스 경쟁이 다시 격화되는 양상이다. 업계에서는 오픈AI가 일정까지 앞당기며 공격적인 속도전을 본격화한 것으로 보고 있다.

 

오픈AI는 16일 현지시간 챗GPT 이미지 1.5 업데이트를 공개했다. 가장 눈에 띄는 변화는 기존 결과물을 보존한 채 특정 부분만 선택적으로 바꾸는 편집 기능이다. 이전 세대 모델에서는 눈, 입, 배경과 같은 세부 요소 하나를 고치기 위해 프롬프트를 다시 입력하면 전체 구도가 바뀐 새로운 이미지가 생성되는 경우가 많았다. 이 때문에 여러 장을 한 시리즈로 제작할 때 인물·배경·색감의 일관성이 유지되지 않는 한계가 지적돼 왔다.

새 버전은 텍스트 명령을 세분화해 해석하는 능력을 대폭 끌어올린 것으로 보인다. 사용자가 얼굴에서 입 모양만 웃는 표정으로 바꾸기, 배경의 나무 질감만 더 선명하게 만들기 등과 같이 지시하면 그 영역만 선택적으로 반영되도록 설계했다. 이미지 전체를 다시 합성하는 대신 국소 편집에 최적화된 연산을 수행하는 방식으로, 캐릭터·브랜드 이미지처럼 동일한 구성을 여러 컷에 걸쳐 유지해야 하는 제작 환경에 적합하다는 평가가 나온다.

 

처리 속도도 개선됐다. 오픈AI는 이미지 1.5가 이전 모델 대비 최대 4배 빠르게 작업을 완료한다고 설명했다. 이미지 생성과 편집 모두에서 지연 시간이 줄어들면, 시안 여러 개를 빠르게 반복 제작해야 하는 디자이너나 마케터의 작업 효율이 높아질 수 있다. 다만 구체적인 하드웨어 구성이나 최적화 방식은 공개되지 않았다.

 

텍스트 렌더링 성능 향상도 눈에 띈다. 지금까지 다수의 생성형 이미지 모델은 작은 글자나 복잡한 폰트를 정확히 표현하지 못해, 실제 문자가 아닌 유사한 도형이나 의미 없는 조합을 출력하는 경우가 잦았다. 챗GPT 이미지 1.5는 작은 글자 처리 능력을 개선해 로고, 포스터, 광고 팸플릿 등 텍스트 비중이 높은 디자인에서도 활용성이 높아질 것으로 보인다. 브랜드 이름, 행사 일정 등 오타에 민감한 정보가 이미지 안에 포함되는 경우가 많다는 점에서 실무 수요가 클 수 있는 지점이다.

 

사용자 경험 측면에서도 인터페이스 변화가 이뤄졌다. 챗GPT 화면 왼쪽에 생성 이미지 모아보기 전용 탭을 추가해, 그동안 만든 결과물을 한 번에 확인·비교할 수 있도록 했다. 대화 흐름 속에 묻혀 있던 이미지 히스토리를 정리해주는 기능으로, 반복 편집이나 버전 관리가 필요한 이용자에게 편의성을 제공할 수 있다. 회사 측은 별도 설치 없이 챗GPT 사용자라면 즉시 이미지 1.5를 쓸 수 있도록 접근성을 넓혔다.

 

시장에서는 이번 출시가 샘 올트먼 최고경영자가 주도한 코드 레드 전략의 연장선에 놓여 있다고 본다. 최근 구글, 앤트로픽 등 경쟁사들이 대형 언어모델과 멀티모달 모델을 잇따라 내놓으면서, 오픈AI가 선두 이미지를 되찾기 위해 제품 로드맵을 유연하게 조정하는 모습이라는 분석이다. 특히 이미지 분야에서의 사용자 평가를 가시적인 지표로 확보해, 플랫폼 경쟁에서 우위를 강조하려는 행보로 해석된다.

 

외신에 따르면 오픈AI는 당초 내년 1월 초 새로운 이미지 생성기 공개를 계획했다가 일정을 앞당겼다. 구글이 제미나이 3.0 프로 기반 이미지 생성 도구 나노바나나프로를 예정보다 빠르게 선보이자, 오픈AI도 대응 출시를 선택한 셈이다. 생성형 이미지 모델은 소셜미디어 콘텐츠 제작, 광고, 게임, 전자상거래 등 여러 IT 서비스에 바로 접목되는 영역이어서, 선점 효과의 중요성이 크다고 여겨진다.

 

흥미로운 점은 초반 이용자 평판 경쟁에서 오픈AI가 우세를 점했다는 대목이다. AI 모델 성능을 평가하는 플랫폼 LM 아레나의 이미지 리더보드에서 챗GPT 이미지 1.5는 론칭 직후 구글 나노바나나프로를 제치고 1위에 올랐다. LM 아레나는 이용자가 모델 이름을 모른 채 출력 결과만 보고 선호도를 투표하는 블라인드 방식으로 순위를 정하며, 점수는 실시간으로 변동된다. 완성도, 창의성, 프롬프트 충실도 등에 대한 이용자 체감 품질이 직접 반영된다는 점에서 업계의 참고 지표로 활용되고 있다.

 

글로벌 시장에서는 생성형 이미지 AI를 둘러싼 기술 경쟁이 이미 본격화된 상태다. 오픈AI와 구글 외에도 여러 기업과 오픈소스 커뮤니티가 새로운 모델을 내놓으며, 해상도·속도·프롬프트 이해도·저작권 필터링 수준을 두고 각축전을 벌이고 있다. 이미지 안의 텍스트 재현과 미세 편집은 상용 서비스에 즉시 반영되기 쉬운 기능이라는 점에서, 이번 개선은 플랫폼 우위 경쟁의 주요 변수가 될 수 있다.

 

한편 이미지 생성 AI가 광고·브랜딩에 깊숙이 들어오면서, 저작권과 딥페이크 같은 윤리·규제 이슈도 더 부각될 수 있다는 관측도 나온다. 특정 인물 얼굴의 세부 감정 표현까지 자유롭게 바꿀 수 있는 기능은 정교한 합성물 제작에도 쓰일 수 있어서다. 각국 규제 기관은 생성 이미지 표시 의무, 학습 데이터 출처 투명성 등을 중심으로 제도 논의를 이어가고 있다.

 

전문가들은 챗GPT 이미지 1.5와 같은 정밀 편집형 모델이 크리에이티브 산업의 작업 방식을 빠르게 바꿀 수 있다고 보고 있다. 광고·디자인 분야에서는 초기 콘셉트를 모델이 빠르게 제안하고, 디자이너가 세부 수정을 지시하는 협업 구조가 일반화될 가능성이 있다. 동시에 품질과 속도 경쟁이 심화될수록, 각 회사가 어떻게 데이터 윤리와 저작권, 안전장치를 설계하는지가 브랜드 신뢰를 좌우하는 요소로 부상하고 있다. 산업계는 오픈AI의 새 이미지 도구가 시장에서 실사용 도구로 자리잡을지, 그리고 경쟁사들의 다음 응수 카드가 무엇일지 주의 깊게 지켜보고 있다.

신민재 기자
share-band
밴드
URL복사
#오픈ai#챗gpt이미지1.5#구글나노바나나프로