OCR + LLM 학습으로 스스로 필요한 텍스트 부분을 인식하고 읽게 하는거...
장기적으로 봤을때 비쥬얼 노블 장르의 게임같은거 방송 할때 쓸려고 만든걸로 보이죠
이미 슬레이 더 프린세스 라던가 그런 장르의 게임한적이 있는데 그때는 일일히 비달이 다 읽어서 들려줬는데
이게 좀 더 빠르고 정밀해지면 스스로 화면 속 텍스트를 읽고 선택지 고르는 것 정도는 가능하지 않을까 싶기도?
이미 그림 정도는 쉽게 구분하기 시작했으니
당장 아트 리뷰 스트림이나 오늘 dev 스트림에서 그림이나 사진은 꽤나 세부적으로 인식하는걸 보여줬고...
그런건 둘째치고 비달 뿌듯해 하는거 보면 저 맛으로 개발 방송하는거 같긴합니다 ㅋㅋ