Add option to return numpy from load_audio

usefulsensors · Oct 23, 2024 · 2e04ed3 · 2e04ed3
1 parent a0f03a4
commit 2e04ed3
Showing 1 changed file with 5 additions and 1 deletion.
diff --git a/moonshine/transcribe.py b/moonshine/transcribe.py
@@ -6,11 +6,13 @@
 from . import ASSETS_DIR
 
 
-def load_audio(audio):
+def load_audio(audio, return_numpy=False):
     if isinstance(audio, (str, Path)):
         import librosa
 
         audio, _ = librosa.load(audio, sr=16_000)
+        if return_numpy:
+            return audio[None, ...]
         audio = keras.ops.expand_dims(keras.ops.convert_to_tensor(audio), 0)
     return audio
 
@@ -37,11 +39,13 @@ def transcribe(audio, model="moonshine/base"):
     tokens = model.generate(audio)
     return load_tokenizer().decode_batch(tokens)
 
+
 def load_tokenizer():
     tokenizer_file = ASSETS_DIR / "tokenizer.json"
     tokenizer = tokenizers.Tokenizer.from_file(str(tokenizer_file))
     return tokenizer
 
+
 def benchmark(audio, model="moonshine/base"):
     import time