처음 나왔을 때는 vram이 20기가 필요하네 어쩌네 했는데, 벌써 8g에서도 실행이 가능합니다.
아직은 입력한 이미지를 기반으로 짧은 영상을 만들어 주는 정도라서 사실 저는 별로 쓸일이 없을거 같긴 해요.
그리고 같은 파라메터 값으로 생성했을 때, 아니메풍 이미지 보다는 실사 이미지가 훨씬 잘 작동합니다.
아무래도 학습 과정에서 대부분 실사 영상을 사용했나봐요.
저는 사양이 딸리다 보니까 진짜 짧게밖에 못만들었는데,
레딧에 올라온 생성 결과들을 보면 기존 animatediff에 비교해서 진짜 많이 좋아 보입니다.
svd_xt on a 4090. Looks pretty good at thumbnail size : StableDiffusion (reddit.com)Few SVD generations : StableDiffusion (reddit.com)
이하 입력한 이미지 및 생성 영상입니다.