self hosted model added (#327)

* self hosted model added * url changed * self hosted endpoint added
ohcnetwork · Sep 19, 2023 · f87d4e3 · f87d4e3
1 parent 72c50d3
commit f87d4e3
Show file tree

Hide file tree

Showing 4 changed files with 48 additions and 0 deletions.
diff --git a/ayushma/migrations/0044_alter_project_stt_engine.py b/ayushma/migrations/0044_alter_project_stt_engine.py
@@ -0,0 +1,18 @@
+# Generated by Django 4.2.5 on 2023-09-17 12:20
+
+from django.db import migrations, models
+
+
+class Migration(migrations.Migration):
+
+    dependencies = [
+        ('ayushma', '0043_merge_20230905_1530'),
+    ]
+
+    operations = [
+        migrations.AlterField(
+            model_name='project',
+            name='stt_engine',
+            field=models.IntegerField(choices=[(1, 'Whisper'), (2, 'Google'), (3, 'Self Hosted')], default=1),
+        ),
+    ]
diff --git a/ayushma/models/enums.py b/ayushma/models/enums.py
@@ -16,6 +16,7 @@ class DocumentType(IntegerChoices):
 class STTEngine(IntegerChoices):
     WHISPER = 1
     GOOGLE = 2
+    SELF_HOSTED = 3
 
 
 class FeedBackRating(IntegerChoices):

diff --git a/ayushma/utils/speech_to_text.py b/ayushma/utils/speech_to_text.py
@@ -1,6 +1,9 @@
+import json
 import os
 
 import openai
+import requests
+from django.conf import settings
 from google.cloud import speech
 
 from ayushma.models.enums import STTEngine
@@ -48,11 +51,34 @@ def recognize(self, audio):
         if not response.results:
             return ""
         return response.results[0].alternatives[0].transcript
+
+class SelfHostedEngine:
+    def __init__(self, api_key, language_code):
+        self.language_code = language_code
+
+    def recognize(self, audio):
+
+        response = requests.post(
+            settings.SELF_HOSTED_ENDPOINT,
+            files={"audio": audio},
+            data={
+                # change this model to get faster results see: https://github.com/coronasafe/care-whisper
+                "model": "small",
+                "language": self.language_code.replace("-IN", ""),
+            },
+        )
+
+        if not response.ok:
+            print("Failed to recognize speech with self hosted engine")
+            return ""
+        response = response.json()
+        return response["data"]["transcription"].strip()
 
 
 engines = {
     "whisper": WhisperEngine,
     "google": GoogleEngine,
+    "self_hosted": SelfHostedEngine,
     # Add new engines here
 }
 

diff --git a/core/settings/base.py b/core/settings/base.py
@@ -368,3 +368,6 @@
 
 AI_NAME = env("AI_NAME", default="Ayushma")
 GOOGLE_RECAPTCHA_SECRET_KEY = env("GOOGLE_RECAPTCHA_SECRET_KEY", default=None)
+
+# url for self hosted speech to text
+SELF_HOSTED_ENDPOINT = env("SELF_HOSTED_ENDPOINT", default=None)