AI 이미지 생성 초보자로 이미지를 생성하면서 경험했던 내용들을 정리하는 공간 입니다.
모든 내용은 인터넷과 AI 검색, 경험을 통해 작성한 내용으로 실제와 다를 수 있습니다.
본 포스팅에 사용된 이미지는 AI 이미지 생성 도구를 활용해 직접 생성한 가상의 인물 이미지입니다.
실존 인물과는 관련이 없습니다.
AI로 인물 이미지를 생성하다 보면 이런 경험을 하게 된다.
- 처음 만든 이미지가 맘에 듬
- 해당 이미지로 다른 장면이나 동작을 시도하면 얼굴이 달라지고, 체형이 바뀌어서 다른 사람처럼 보인다.
동일 프롬프트를 사용했지만 조건에 따라 계속 결과가 달라져 찾아보니 기준이 되는 사람이 없기 때문이었다.
기준이 되는 사람이 없기 때문에 동일 프롬프트를 사용하더라도 그 사람이 매번 새롭게 만들어 진다.
그래서 기준 모델 만들기를 먼저 시작했다.
최초 실패 사례
처음엔 이런 방식으로 접근을 했다.
- 마음에 드는 이미지 하나 생성
- 그 프롬프트를 그대로 복사하여 배경과 동작만 살짝 수정
하지면 결과는 예상과 달랐다.
- 얼굴 인상이 미묘하게 바뀌거나
- 눈 크기나 턱선이 변경되고
- 다리 비율이 길어졌다가 짧아지고
- 특히 역동적인 동작에서 심해졌다.
같은 프롬프트라도 AI는 같은 사람으로 인식하지 않는다는걸 깨달았다.
기준 모델이란?
하나의 인물을 명확하게 정의해 두고 모든 이미지의 출발점으로 사용되는 기준이 되는 인물 이미지
이 기준 모델에는 다음 요소들이 포함된다.
- 얼굴 형태와 인상
- 체형과 비율
- 헤어 스타일
- 기본적인 표정과 분위기
AI에게 이사람이 누구인지를 먼저 확정해 주는 작업이다.
이 기준이 있어야 이후 의상, 동작, 배경을 바꿔도 같은 사람의 다른 장면으로 인식한다.
기준 모델의 역할은 단순하다.
- 얼굴과 체형은 고정
- 나머지 요소만 변경
이렇게 하면 항상 같은 얼굴 유지, 체형 안정을 가져올 수 있다.
기준 모델은 이미지 생성을 위한 도구로, 기준 모델 자체가 완벽할 필요는 없다.
보통 기준 모델은 아래 요소로 생성한다.
- 중립적인 포즈
- 과하지 않은 표정
- 단순한 의상
- 왜곡 없는 구도
기준 모델 생성하기
먼저 아무 동작도 없는 상태에서 다음 조건만 고정했다.
- 얼굴 형태
- 체형과 비율
- 헤어 스타일
- 표정
의상과 자세, 배경도 심플하게 구성했다.
- 의상 - 스포츠 브라 + 레깅스
- 자세 - 정면 기준 포즈
- 배경 - 화이트
기준 모델 이미지는 정면/후면/측면 및 위에서 내려다보는 구조로 생성했다.
한국 인플루언서 스타일의 여성 캐릭터.
실존 인물이 아닌 가상의 캐릭터.
전체적으로 다리가 길어 보이는 자연스러운 롱 레그 비율,
과장되지 않은 패션 모델 체형의 가느다란 하체.
어깨와 골반이 균형 잡힌 슬림한 허리,
마른 듯하지만 건강한 체구.
슬림한 체형이지만
자연스러운 인체 비율과 구조로 인해
전체 실루엣이 입체적으로 느껴지는 균형 잡힌 체형.
과도한 강조 없이
상·하체 비율이 자연스럽게 조화를 이루는 안정적인 실루엣,
근육이 두드러지지 않는 부드럽고 정돈된 라인.
계란형 얼굴에 부드러운 V라인 턱선,
중간 높이의 이마,
얼굴 길이가 폭보다 약간 긴 균형 잡힌 비율.
중간보다 약간 큰 아몬드형 눈과 과하지 않은 쌍꺼풀,
눈꼬리가 살짝 내려간 순한 인상.
부드러운 일자 눈썹,
작고 곧은 코와 둥근 코끝,
윗입술은 얇고 아랫입술이 살짝 도톰한 자연스러운 입술.
맑고 세련된 인상,
과도한 섹시함 없이 균형 잡힌 분위기.
긴 애쉬 브라운 웨이브 헤어,
자연스럽고 부드러운 물결 형태,
흐르듯 내려오는 자연스러운 질감.
편안한 자세로 서서 정면을 응시.
어깨에 힘이 빠진 자연스러운 포즈,
어깨–골반–다리로 이어지는 안정적인 정렬.
미니멀한 디자인의 크롭티에 하이웨이스트 레깅스 착용.
단색 흰색 컬러.
로고나 패턴이 없는 깔끔한 디자인.
전체 실루엣을 부드럽게 정리해주는 핏
전신 샷 (Full-body shot),
피사체가 프레임 중앙에 위치,
왜곡 없는 중립적인 원근감.
같은 캐릭터를 기준으로 정면, 후면, 측면, 위에서 내려다본 시점의 각각 독립된 이미지로 생성.
모든 뷰에서 얼굴과 신체 비율은 동일하게 유지.
부드럽고 고른 스튜디오 조명,
중립적인 화이트 배경,
그림자 최소화, 조명 일관성 유지.
전문가용 DSLR 촬영,
고해상도 실사 사진 (Photorealistic),
자연스러운 피부 질감,
CGI·일러스트 느낌 배제,
화면 비율 9:16.

이 후 의상만 바꾸거나, 동작만 바꾸거나, 배경을 바꿔가며 실험했지만 결과는 확실히 달라졌다.
이 기준 이미지를 만든 이후부터
- 얼굴 인식이 훨씬 안정적이었고
- 체형 붕괴가 눈에 띄게 줄었으며
- 같은 사람의 다른 장면처럼 보이기 시작했다.


AI 이미지 생성에서 가장 중요한 건 화려한 프롬프트가 아니라 기준이 되는 사람을 먼저 만드는 것이었다.
본 포스팅에 사용된 이미지는 AI 이미지 생성 도구를 활용해 직접 생성한 가상의 인물 이미지입니다.
실존 인물과는 관련이 없습니다.