먼저 ai 로제타 데이터셋을 만듭니다
데이터셋을 다듬어야하는데요
브금이 있으면 자르고 도네가 들어가 있으면 자르고 웃음소리나 의성어가 들어가 있으면 자릅니다
대부분 여기서 시간이 제일 많이 걸리고 이것만 끝내놓으면 그 다음부터는 진짜 딸깍 수준
그렇게 대략 1시간가량 음성파일을 트레이닝 시켜야죠
저는 rvc를 씁니다 rvc를 실행하면
이렇게 데이터셋을 넣구요
알고리즘 선택하고
훈련 에포크를 설정합니다 대충 몇번 훈련하는거냐고 보시면 됩니다
저는 500으로 해요 그럼 제 글카로 대략 6시간 걸립니다
그럼 짜잔 로제타 ai가 완성
이제 노래를 부르게 시켜볼까요?
flac 파일을 구해야합니다 음원 사이트를 가서 돈 주고 삽니다 flac는 mp3보 좀 비싸긴해요
보컬이랑 음악을 분리해야하는데
제가 알고있는 곳 중에 제일 분리 잘시켜주는 사이트입니다
알고리즘 선택하고 분리 시킵니다
그럼 음악과 보컬로 나뉘는데
보컬에는 다양한 효과가 들어가 있습니다 리무버 에코 코러스 기타등등
이걸 무시하고 그대로 돌리면 삑사리처럼 아니면 기계음처럼 이상해집니다
이건 효과를 그나마 제거해주는 프로그램입니다
여기다가 보컬을 넣고 또 돌립니다 리무버 에코 코러스 최대한 없애줍니다
그럼 보컬이 나옵니다 이걸 다시 rvc로 가져가서
추론을 해야합니다
여러가지 옵션들이 있는데
알고리즘을 선택하고 검색가능 비율을 조절하면서 ai를 입힙니다
0.05로 쪼개서 하나하나 쭉 해봅니다
그 중에 맘에 드는 수준이 됐다? 그럼 그걸 받고
다시 없앴던 리무버랑 에코 코러스를 넣습니다
오디오 프로그램을 켜서 하나하나 수치넣어봅니다
걍 노가다 입니다 원곡이랑 비슷한 느낌이나게 부드럽게 하기위해
그렇게 완성된 보컬을 분리시켰던 음악과 합쳐주면
이러면 완성입니다
액타 오면 썸네일 그려서 유튜브에 업로드 해야지!
이미 훈련 시켜둔 ai는 계속 쓸 수 있으므로 할때마다 훈련시킬 필요는 없습니다
하지만 더 좋은 샘플이 있다? 그럼 싹 다 갈아엎고 다시 훈련하는거야!