Spaces:

ZennyKenny
/

AudioTranscribe

Running on CPU Upgrade

App Files Files Community

ZennyKenny commited on 1 day ago

Commit

d88ec40

verified ·

1 Parent(s): 9fe4dba

Update app.py

Browse files

Files changed (1) hide show

app.py +20 -15

app.py CHANGED Viewed

@@ -2,38 +2,43 @@ import gradio as gr
 import torch
 from transformers import pipeline
-# Load models
-transcriber = pipeline("automatic-speech-recognition", model="openai/whisper-base", device=0 if torch.cuda.is_available() else -1)
-summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
 # Function to process audio
 def process_audio(audio_file):
-    # Step 1: Transcribe audio
-    transcription = transcriber(audio_file)["text"]
-    # Step 2: Summarize transcription
-    summary = summarizer(transcription, max_length=50, min_length=10, do_sample=False)[0]["summary_text"]
-    return transcription, summary
 # Gradio Interface with Horizontal Layout
 with gr.Blocks() as interface:
     with gr.Row():
-        # Upload button on the left
         with gr.Column():
             audio_input = gr.Audio(type="filepath", label="Upload Audio File")
             process_button = gr.Button("Process Audio")
-        # Output text box on the right
         with gr.Column():
             transcription_output = gr.Textbox(label="Full Transcription", lines=10)
             summary_output = gr.Textbox(label="Summary", lines=5)
-    # Link the button to the function
     process_button.click(
         process_audio,
         inputs=[audio_input],
         outputs=[transcription_output, summary_output]
     )
-# Launch the interface with SSR disabled and optional public sharing
-interface.launch

 import torch
 from transformers import pipeline
+# Check if GPU is available; fallback to CPU if not
+device = 0 if torch.cuda.is_available() else -1
+try:
+    # Load models with error handling
+    transcriber = pipeline("automatic-speech-recognition", model="openai/whisper-base", device=device)
+    summarizer = pipeline("summarization", model="facebook/bart-large-cnn")
+except Exception as e:
+    print(f"Error loading models: {e}")
+    raise
 # Function to process audio
 def process_audio(audio_file):
+    try:
+        # Transcribe the audio
+        transcription = transcriber(audio_file)["text"]
+        # Summarize the transcription
+        summary = summarizer(transcription, max_length=50, min_length=10, do_sample=False)[0]["summary_text"]
+        return transcription, summary
+    except Exception as e:
+        return f"Error processing audio: {e}", ""
 # Gradio Interface with Horizontal Layout
 with gr.Blocks() as interface:
     with gr.Row():
         with gr.Column():
             audio_input = gr.Audio(type="filepath", label="Upload Audio File")
             process_button = gr.Button("Process Audio")
         with gr.Column():
             transcription_output = gr.Textbox(label="Full Transcription", lines=10)
             summary_output = gr.Textbox(label="Summary", lines=5)
     process_button.click(
         process_audio,
         inputs=[audio_input],
         outputs=[transcription_output, summary_output]
     )
+# Launch the interface with public sharing and SSR disabled
+interface.launch(share=True, ssr=False)