Spaces:

k2-fsa
/

automatic-speech-recognition

Running

App Files Files Community

csukuangfj commited on Jul 14

Commit

7d508be

1 Parent(s): 7d43f04

add Brazilian Portugues asr models

Browse files

Files changed (1) hide show

model.py +28 -10

model.py CHANGED Viewed

@@ -1370,13 +1370,22 @@ def _get_sherpa_onnx_nemo_ctc_models(
 ) -> sherpa_onnx.OfflineRecognizer:
     assert repo_id in [
         "csukuangfj/sherpa-onnx-nemo-parakeet_tdt_ctc_110m-en-36000",
     ], repo_id
-    model = _get_nn_model_filename(
-        repo_id=repo_id,
-        filename="model.onnx",
-        subfolder=".",
-    )
     tokens = _get_token_filename(repo_id=repo_id, subfolder=".")
@@ -1946,6 +1955,8 @@ chinese_models = {
     #  "csukuangfj/sherpa-onnx-streaming-zipformer-ctc-zh-fp16-2025-06-30": _get_streaming_zipformer_ctc_pre_trained_model,
     "csukuangfj/sherpa-onnx-streaming-zipformer-ctc-zh-xlarge-int8-2025-06-30": _get_streaming_zipformer_ctc_pre_trained_model,
     #  "csukuangfj/sherpa-onnx-streaming-zipformer-ctc-zh-xlarge-fp16-2025-06-30": _get_streaming_zipformer_ctc_pre_trained_model,
     "csukuangfj/sherpa-onnx-paraformer-zh-2024-03-09": _get_paraformer_pre_trained_model,
     "luomingshuang/icefall_asr_wenetspeech_pruned_transducer_stateless2": _get_wenetspeech_pre_trained_model,  # noqa
     "csukuangfj/sherpa-onnx-paraformer-zh-small-2024-03-09": _get_paraformer_pre_trained_model,
@@ -2072,6 +2083,11 @@ vietnamese_models = {
     "csukuangfj/sherpa-onnx-zipformer-vi-2025-04-20": _get_vietnamese_pretrained_model,
 }
 all_models = {
     **multi_lingual_models,
@@ -2090,6 +2106,7 @@ all_models = {
     **korean_models,
     **thai_models,
     **vietnamese_models,
 }
 language_to_models = {
@@ -2102,14 +2119,15 @@ language_to_models = {
     "Chinese+English+Cantonese+Japanese+Korean": list(
         chinese_cantonese_english_japanese_korean_models.keys()
     ),
-    "Cantonese": list(cantonese_models.keys()),
-    "Japanese": list(japanese_models.keys()),
-    "Tibetan": list(tibetan_models.keys()),
     "Arabic": list(arabic_models.keys()),
-    "German": list(german_models.keys()),
     "French": list(french_models.keys()),
-    "Russian": list(russian_models.keys()),
     "Korean": list(korean_models.keys()),
     "Thai": list(thai_models.keys()),
     "Vietnamese": list(vietnamese_models.keys()),
 }

 ) -> sherpa_onnx.OfflineRecognizer:
     assert repo_id in [
         "csukuangfj/sherpa-onnx-nemo-parakeet_tdt_ctc_110m-en-36000",
+        "csukuangfj/sherpa-onnx-nemo-stt_pt_fastconformer_hybrid_large_pc",
+        "csukuangfj/sherpa-onnx-nemo-stt_pt_fastconformer_hybrid_large_pc-int8",
     ], repo_id
+    if "int8" in repo_id:
+        model = _get_nn_model_filename(
+            repo_id=repo_id,
+            filename="model.onnx",
+            subfolder=".",
+        )
+    else:
+        model = _get_nn_model_filename(
+            repo_id=repo_id,
+            filename="model.int8.onnx",
+            subfolder=".",
+        )
     tokens = _get_token_filename(repo_id=repo_id, subfolder=".")
     #  "csukuangfj/sherpa-onnx-streaming-zipformer-ctc-zh-fp16-2025-06-30": _get_streaming_zipformer_ctc_pre_trained_model,
     "csukuangfj/sherpa-onnx-streaming-zipformer-ctc-zh-xlarge-int8-2025-06-30": _get_streaming_zipformer_ctc_pre_trained_model,
     #  "csukuangfj/sherpa-onnx-streaming-zipformer-ctc-zh-xlarge-fp16-2025-06-30": _get_streaming_zipformer_ctc_pre_trained_model,
+    "csukuangfj/sherpa-onnx-zipformer-ctc-zh-int8-2025-07-03": _get_non_streaming_zipformer_ctc_pre_trained_model,
+    "csukuangfj/sherpa-onnx-zipformer-ctc-zh-2025-07-03": _get_non_streaming_zipformer_ctc_pre_trained_model,
     "csukuangfj/sherpa-onnx-paraformer-zh-2024-03-09": _get_paraformer_pre_trained_model,
     "luomingshuang/icefall_asr_wenetspeech_pruned_transducer_stateless2": _get_wenetspeech_pre_trained_model,  # noqa
     "csukuangfj/sherpa-onnx-paraformer-zh-small-2024-03-09": _get_paraformer_pre_trained_model,
     "csukuangfj/sherpa-onnx-zipformer-vi-2025-04-20": _get_vietnamese_pretrained_model,
 }
+portuguese_brazlian_models = {
+    "csukuangfj/sherpa-onnx-nemo-stt_pt_fastconformer_hybrid_large_pc": _get_sherpa_onnx_nemo_ctc_models,
+    "csukuangfj/sherpa-onnx-nemo-stt_pt_fastconformer_hybrid_large_pc-int8": _get_sherpa_onnx_nemo_ctc_models,
+}
 all_models = {
     **multi_lingual_models,
     **korean_models,
     **thai_models,
     **vietnamese_models,
+    **portuguese_brazlian_models,
 }
 language_to_models = {
     "Chinese+English+Cantonese+Japanese+Korean": list(
         chinese_cantonese_english_japanese_korean_models.keys()
     ),
     "Arabic": list(arabic_models.keys()),
+    "Cantonese": list(cantonese_models.keys()),
     "French": list(french_models.keys()),
+    "German": list(german_models.keys()),
+    "Japanese": list(japanese_models.keys()),
     "Korean": list(korean_models.keys()),
+    "Portuguese (Brazilian)": list(portuguese_brazlian_models.keys()),
+    "Russian": list(russian_models.keys()),
     "Thai": list(thai_models.keys()),
+    "Tibetan": list(tibetan_models.keys()),
     "Vietnamese": list(vietnamese_models.keys()),
 }