首先使用UR5对原样本去除bgm,只保留人声,然后对人声文件进行识别分割TTS,经过数据清理生成台本
处理prompts
写一个python脚本,首先进入目录C:/dev/Chat-Haruhi-Suzumiya/yuki_builder
然后遍历C:\dev\dataset\dorazmon\sound\HP2_rename\,其中都是类似P001.wav,P002.wav这样的文件
轮询这些文件,然后根据文件名顺序调用下列命令,注意其中003的字样要根据当前循环的文件名进行替换
python yuki_builder.py whisper -input_video C:\dev\dataset\dorazmon\sound\HP2_rename\P003.wav -srt_folder srt_folder/003
python yuki_builder.py srt2csv -input_srt srt_folder\003\P003.srt -srt_folder srt_folder\003
python yuki_builder.py recognize -input_video C:\dev\dataset\dorazmon\sound\HP2_rename\P003.wav -input_srt srt_folder\003\P003.srt -role_audios ./role_audio -output_folder ./story_output
帮我改写上述脚本,在本来要执行的地方注释掉,并加上打印出需要执行脚本的print函数
|