(컷은 Colab 오렌지믹스2 SD엔진에서 뽑아본 컷들입니다. waifu2x 업스케일러 2배 업스케일 돌렸습니다.)
음... 확실히 저번에 올린 글 (https://bbs.ruliweb.com/userboard/board/700315/read/3306?) 에서 ARtot 님 댓글이 맞았더군요.
확실히 Vae 배치파일이나, 샘플러 구성에 따라서, 혹은 같은 시드값도 샘플스텝을 얼마를 줬느냐, 혹은 배치풀을 몇번 돌렸냐에 따라 같은 조건을 주어도 뭔가가 휙휙 달라진다는 느낌이 강합니다.
괜히 스테이블 디퓨전 / 노벨AI 초기 사용자들이 "이거 완전 AI상대로 가챠질이다" 라고 했는지 실감이 나네요. 물론 지금은 어느정도 학습이 좀 되어서인지 그래도 어느정도 "패턴화" 되게 치면 그럭저럭 생각한 느낌대로 일러스트는 잘 뽑아줍니다. 문제는 반실사, 실사체인거 같네요
(NMKD의 경우 실사체로 뭔가 뽑아보려 해도 뭔가 어플 자체의 내부파일이나 VAE 배치파일 문제인지 뭔지 몰라도 추상화로만 툭하고 나올 때가 왕왕 나오더군요.)
그래도 팁을 드리자면 확실히 몇개는 있습니다.
1. Colab 공개판 (특히 Camenduru 판) 도 768X768까지는 많이 버벅거리진 않습니다. 확실히 코랩의 베이스 서버인 GCP 데이터센터가 아마존,MS보다는 점유율이 덜해도 왜 클라우드 3대 플랫폼인진 알겠습니다. 물론 이게 MS애저나 AWS에서 돌리면 얼마나 더 빠를진 모르겠지만 너무 고해상도만 아니면 버벅거리진 않습니다.
2. 확실히 1080X1080 넘어가게 뽑으려면 좀 꼼수(?)를 써야 합니다.
웹UI에서 렌더 돌리면서 겪었던 문제인데, 작정하고 1920X1080 해상도로 일러스트 하나를 뽑고 나니까 내부 파이썬 바이너리 문제인지 몰라도 (레딧쪽에서도 이야기가 있더군요) 분명 -medvram 걸어준 상태였는데도, CUDA VRAM 할당을 제대로 못하는 문제가 터지더군요. 그래서 아예 컴도 꺼보고 갖가지 방법을 써봤지만 한번 작정하고 크게 뽑고 난 후에는 이게 해결이 잘 안됩니다. 이건 뭐 개발자들이 조만간 핫픽스는 해주겠지만... 당장은 일단 768, 좀 크게 하면 한 960X960 정도만 뽑고 Waifu2X (https://waifu2x.udp.jp/index.ko.html) / Waifu unlimited 업스케일러로 (https://unlimited.waifu2x.net/) 대충 2x 업스케일 정도로 돌려 주는게 일단은 낫습니다. (나중이 되면 또 모르겠군요.)
아무튼 몇일 삽질하고 나서 얻게 된 팁 나눕니다-