Spaces:

Slamlab
/

asr_metrics

Sleeping

App Files Files Community

akki2825 commited on Jul 3

Commit

01e4e5c

verified ·

1 Parent(s): 2b32a02

add misaligned sentences

Browse files

Files changed (1) hide show

app.py +61 -28

app.py CHANGED Viewed

@@ -75,6 +75,51 @@ def calculate_sentence_metrics(reference, hypothesis):
     except Exception as e:
         raise e
 @spaces.GPU()
 def process_files(reference_file, hypothesis_file):
     try:
@@ -87,6 +132,7 @@ def process_files(reference_file, hypothesis_file):
         overall_wer = calculate_wer(reference_text, hypothesis_text)
         overall_cer = calculate_cer(reference_text, hypothesis_text)
         sentence_metrics = calculate_sentence_metrics(reference_text, hypothesis_text)
         return {
             "Overall WER": overall_wer,
@@ -96,33 +142,12 @@ def process_files(reference_file, hypothesis_file):
             "Average WER": sentence_metrics["average_wer"],
             "Average CER": sentence_metrics["average_cer"],
             "Standard Deviation WER": sentence_metrics["std_dev_wer"],
-            "Standard Deviation CER": sentence_metrics["std_dev_cer"]
         }
     except Exception as e:
         return {"error": str(e)}
-def format_sentence_metrics(sentence_wers, sentence_cers, average_wer, average_cer, std_dev_wer, std_dev_cer):
-    if not sentence_wers and not sentence_cers:
-        return "All sentences match perfectly!"
-    md = "### Sentence-level Metrics\n\n"
-    md += "#### Word Error Rate (WER)\n"
-    md += f"* Average WER: {average_wer:.2f}\n"
-    md += f"* Standard Deviation: {std_dev_wer:.2f}\n\n"
-    md += "#### Character Error Rate (CER)\n"
-    md += f"* Average CER: {average_cer:.2f}\n"
-    md += f"* Standard Deviation: {std_dev_cer:.2f}\n\n"
-    md += "### WER for Each Sentence\n\n"
-    for i, wer in enumerate(sentence_wers):
-        md += f"* Sentence {i+1}: {wer:.2f}\n"
-    md += "\n### CER for Each Sentence\n\n"
-    for i, cer in enumerate(sentence_cers):
-        md += f"* Sentence {i+1}: {cer:.2f}\n"
-    return md
 def main():
     with gr.Blocks() as demo:
         gr.Markdown("# ASR Metrics")
@@ -139,6 +164,7 @@ def main():
             compute_button = gr.Button("Compute Metrics")
             results_output = gr.JSON(label="Results")
             metrics_output = gr.Markdown(label="Sentence Metrics")
         # Update previews when files are uploaded
         def update_previews(ref_file, hyp_file):
@@ -168,7 +194,7 @@ def main():
         def process_and_display(ref_file, hyp_file):
             result = process_files(ref_file, hyp_file)
             if "error" in result:
-                return {}, {}, "Error: " + result["error"]
             metrics = {
                 "Overall WER": result["Overall WER"],
@@ -181,18 +207,25 @@ def main():
                 result["Average WER"],
                 result["Average CER"],
                 result["Standard Deviation WER"],
-                result["Standard Deviation CER"]
             )
-            return metrics, metrics_md
         compute_button.click(
             fn=process_and_display,
             inputs=[reference_file, hypothesis_file],
-            outputs=[results_output, metrics_output]
         )
     demo.launch()
 if __name__ == "__main__":
-    main()

     except Exception as e:
         raise e
+def identify_misaligned_sentences(reference_text, hypothesis_text):
+    """
+    Identify sentences that don't match between reference and hypothesis.
+    Returns a dictionary with misaligned sentence pairs and their indices.
+    """
+    reference_sentences = split_into_sentences(reference_text)
+    hypothesis_sentences = split_into_sentences(hypothesis_text)
+    misaligned = []
+    for i, (ref, hyp) in enumerate(zip(reference_sentences, hypothesis_sentences)):
+        if ref != hyp:
+            misaligned.append({
+                "index": i+1,
+                "reference": ref,
+                "hypothesis": hyp
+            })
+    return misaligned
+def format_sentence_metrics(sentence_wers, sentence_cers, average_wer, average_cer, std_dev_wer, std_dev_cer, misaligned_sentences):
+    md = "### Sentence-level Metrics\n\n"
+    md += "#### Word Error Rate (WER)\n"
+    md += f"* Average WER: {average_wer:.2f}\n"
+    md += f"* Standard Deviation: {std_dev_wer:.2f}\n\n"
+    md += "#### Character Error Rate (CER)\n"
+    md += f"* Average CER: {average_cer:.2f}\n"
+    md += f"* Standard Deviation: {std_dev_cer:.2f}\n\n"
+    md += "### WER for Each Sentence\n\n"
+    for i, wer in enumerate(sentence_wers):
+        md += f"* Sentence {i+1}: {wer:.2f}\n"
+    md += "\n### CER for Each Sentence\n\n"
+    for i, cer in enumerate(sentence_cers):
+        md += f"* Sentence {i+1}: {cer:.2f}\n"
+    if misaligned_sentences:
+        md += "\n### Misaligned Sentences\n\n"
+        for misaligned in misaligned_sentences:
+            md += f"#### Sentence {misaligned['index']}\n"
+            md += f"* Reference: {misaligned['reference']}\n"
+            md += f"* Hypothesis: {misaligned['hypothesis']}\n\n"
+    return md
 @spaces.GPU()
 def process_files(reference_file, hypothesis_file):
     try:
         overall_wer = calculate_wer(reference_text, hypothesis_text)
         overall_cer = calculate_cer(reference_text, hypothesis_text)
         sentence_metrics = calculate_sentence_metrics(reference_text, hypothesis_text)
+        misaligned = identify_misaligned_sentences(reference_text, hypothesis_text)
         return {
             "Overall WER": overall_wer,
             "Average WER": sentence_metrics["average_wer"],
             "Average CER": sentence_metrics["average_cer"],
             "Standard Deviation WER": sentence_metrics["std_dev_wer"],
+            "Standard Deviation CER": sentence_metrics["std_dev_cer"],
+            "Misaligned Sentences": misaligned
         }
     except Exception as e:
         return {"error": str(e)}
 def main():
     with gr.Blocks() as demo:
         gr.Markdown("# ASR Metrics")
             compute_button = gr.Button("Compute Metrics")
             results_output = gr.JSON(label="Results")
             metrics_output = gr.Markdown(label="Sentence Metrics")
+            misaligned_output = gr.Markdown(label="Misaligned Sentences")
         # Update previews when files are uploaded
         def update_previews(ref_file, hyp_file):
         def process_and_display(ref_file, hyp_file):
             result = process_files(ref_file, hyp_file)
             if "error" in result:
+                return {}, {}, {}, "Error: " + result["error"]
             metrics = {
                 "Overall WER": result["Overall WER"],
                 result["Average WER"],
                 result["Average CER"],
                 result["Standard Deviation WER"],
+                result["Standard Deviation CER"],
+                result["Misaligned Sentences"]
             )
+            misaligned_md = "### Misaligned Sentences\n\n"
+            for misaligned in result["Misaligned Sentences"]:
+                misaligned_md += f"#### Sentence {misaligned['index']}\n"
+                misaligned_md += f"* Reference: {misaligned['reference']}\n"
+                misaligned_md += f"* Hypothesis: {misaligned['hypothesis']}\n\n"
+            return metrics, metrics_md, misaligned_md
         compute_button.click(
             fn=process_and_display,
             inputs=[reference_file, hypothesis_file],
+            outputs=[results_output, metrics_output, misaligned_output]
         )
     demo.launch()
 if __name__ == "__main__":
+    main()