启动时加载whisper_model

dfc41839 · Administrator · 91031c74 · dfc41839 · dfc41839 · dfc41839
Commit dfc41839 authored Nov 09, 2023 by Administrator
5 changed files
--- a/app/video_cut/autocut/wmdigit_transcribe.py
+++ b/app/video_cut/autocut/wmdigit_transcribe.py
@@ -12,10 +12,10 @@ from .type import WhisperMode, SPEECH_ARRAY_INDEX


 class Transcribe:
-    def __init__(self, args):
+    def __init__(self, args, whisper_model):
        self.args = args
        self.sampling_rate = 16000
-        self.whisper_model = None
+        self.whisper_model = whisper_model
        self.vad_model = None
        self.detect_speech = None


--- a/app/video_cut/load_args.py
+++ b/app/video_cut/load_args.py
@@ -135,5 +135,10 @@ def main_args(logger):
    args.force = True
    args.vad = "0"
    args.whisper_model = "large-v2"
+    args.device = "cuda"

-    return args
\ No newline at end of file
+    logger.info(f'load whisper_model: {args.whisper_model} device: {args.device}')
+    import whisper
+    whisper_model = whisper.load_model(args.whisper_model, args.device)
+
+    return args, whisper_model
\ No newline at end of file
--- a/app/video_cut/main.py
+++ b/app/video_cut/main.py
@@ -31,7 +31,7 @@ def validate_request():


 # 主线
-def video_cut_pipeline(logger, args):
+def video_cut_pipeline(logger, args, whisper_model):
    # print(args)
    time_record = []
    media_file, lang = validate_request()
@@ -50,7 +50,7 @@ def video_cut_pipeline(logger, args):

    args.inputs = [media_file]
    args.lang = lang
-    wmdigit_transcribe.Transcribe(args).run()
+    wmdigit_transcribe.Transcribe(args, whisper_model).run()
    time_record.append(f"视频生成srt和md。耗时: {time.time() - start_time:.4f} 秒")



--- a/requirements.txt
+++ b/requirements.txt
@@ -7,6 +7,7 @@ flask_sqlalchemy
 redis
 tqdm

+oss2
 moviepy==2.0.0.dev2
 edge-tts
 openai-whisper

--- a/start.py
+++ b/start.py
@@ -26,12 +26,12 @@ input_root = os.path.join(root, 'inputs')
 output_root = os.path.join(root, 'outputs')

 # 预加载模型
-args = main_args(logger)
+args, whisper_model = main_args(logger)

 # 对外接口
 @app.route('/wm_video_cut', methods=['POST'])
 def wm_video_cut():
-    final_video_url, srt_url = video_cut_pipeline(logger, args)
+    final_video_url, srt_url = video_cut_pipeline(logger, args, whisper_model)
    return jsonify({"result": {"final_video_url": final_video_url, "srt_url": srt_url}})