AI 창작그림 게시판 | 구독자 80명 | 베리썸히비스커스

ai) 후방) 헤으응... 눈나...

아줌마였네




저번에 슬레타-미오리네 두 캐릭터를 드림부스 하나에 학습시켜본 경험을 기반으로

더 과감한 다중 컨셉(8 캐릭터) 드림부스에 도전해봤습니다.


사실 이번에는 thelastben의 fast-dreambooth를 사용해서 처음으로 768*768 해상도에 도전해봤었습니다.

해상도가 높으면 따로 얼굴~상체 부분 크롭 이미지를 넣지 않고 그냥 깡으로 레터박스만 추가해서 정사각형으로 만들어 넣어도 결과물이 잘 나오지 않을까 하는 근거 없는 희망을 가지고 일차적으로 도전해봤는데, 역시 망했습니다.


지난번 글에서 fast-dreambooth가 전반적으로 조금 흐리게 나오는 것 같다는 느낌을 받았다고 했는데 이번에도 좀 흐리게 나오더라고요.

그리고 이미지 수가 많아서 그런지 퀄리티가 영 시원찮아서 그냥 확장기능으로 시도했는데(물론 크롭 이미지를 포함한 512*512), 제법 마음에 드는 수준으로 뽑아줄 것 같습니다.

대충 계획한 학습 스텝 수의 절반정도 왔는데 벌써 캐릭터들의 특징을 많이 잡아주는 모습입니다.

제법 체리피킹을 한 표인데도 바쿠고네 엄마랑 이오리는 상대적으로 많이 불안정하긴 한데, 더 학습 돌리면 나아지길 기대해봐야죠.

자기 전에 마저 돌려놓고 자야지 ㅎㅎ.


암튼 a1111's webui 확장기능으로 학습 돌리시는 분들한테 실제로 의미있을 수도 있는 내용은 지금부터입니다.

학습 시 instance prompt에 [filewords]라고 입력하는 것이 가능합니다.

[filewords]를 입력했을 때,

학습 이미지와 동일한 이름의 텍스트 파일이 존재하는 경우: 인스턴스 프롬프트에 텍스트 파일 안의 내용물이 입력됩니다.

학습 이미지와 동일한 이름의 텍스트 파일이 없는 경우: 학습 이미지 파일 이름이 분석되어서 인스턴스 프롬프트로 입력됩니다.

제작자한테 물어봐서 받은 답변이니까 맞을겁니다.

(If txt files exist, they will be used as the source for caption/tags, otherwise, it will try to parse the filename.)


예를 들어

traindata1.png, traindata1.txt, traindata2.png, traindata2.txt, traindata3.png, traindata4.txt, ...

이런 식으로 데이터가 구성되어 있고, instance prompt에 [filewords]를 입력하면

각 .txt 파일 안에 담겨진 내용물이 instance prompt로 사용됩니다.

wd 1.4 tagger 등을 사용하면 간단하게 태그 등을 입력할 수 있을 것입니다.


반면

dbchara (1).png, dbchara (2).png, dbchara (3).png, ... , dbcharb (1).png, dbcharb (2).png, dbcharb (3).png, ...

이런 식으로 데이터가 구성되어 있고, instance prompt에 [filewords]를 입력하면

괄호와 숫자는 무시되고 dbchara와 dbcharb가 instance prompt로 사용됩니다.

사실 이 부분은 직접 답변받은 부분이 아니긴 한데, fast-dreambooth에서 가져온 내용이었던걸로 기억하니까

아마도 괄호와 숫자 그리고 언더바("_")는 무시될겁니다.

즉, dbchara_특징1_복장1.png 이런 식으로 사용할 수도 있을 것입니다.

아래 이미지는 실제 사용 사례인, 슬레타-미오리네 모델입니다. (훈련 자체는 확장기능이 아닌 fast-dreambooth로 했습니다.)

dbslt_uniform, dbslt_holder_uniform, dbslt_pilotsuit, dbslt_holder_pilotsuit 등으로 자료를 구성해서 훈련 후 프롬프트 입력으로 복장 갈아입히기가 가능한 것을 확인했었습니다.




처음에는 첫 번째 방법(이미지 파일+텍스트 파일)을 사용했었습니다.

wd 1.4 tagger를 이용해 각 이미지 파일에 대응하는 태그를 포함한 텍스트 파일을 만들고,

그 텍스트 파일마다 알맞는 캐릭터 프롬프트(dbbkgm, dbgaham, dbikuyo, dbiori, dbkomim, dblanam, dbshiho, dbtsuki)를 입력해두었습니다.

그으으으런데 망했습니다.

이유야 문과라 모르는데 암튼 망했습니다. 캐릭터별 특징을 거의(아예) 못잡더라고요.

1girl, solo 같은 일반적인 태그가 모든 캐릭터한테 중복되서 그런가 싶기도 합니다.


그래서 두번째 방법(캐릭터명으로 된 이미지 파일들로만 구성)으로 시도한 결과가 최상단의 이미지입니다.

아마도 다중 캐릭터를 학습시킬 때에는, 단순하게 캐릭터 이름 +복장 정보 정도만 입력하는 것이 안전한 것이 아닐까 합니다.


이상입니다.

좋은 밤 되세요





로그인하고 댓글 작성하기
오른쪽 베스트
유머 베스트
PC/온라인
비디오/콘솔
모바일

BEST 유저정보