Spaces:

LLMsMaxEntRL
/

maxent-rl-eval-leaderboard

Running

App Files Files Community

luckeciano commited on Mar 18

Commit

cab81c9

verified ·

1 Parent(s): 542b9db

Create app.py

Browse files

Files changed (1) hide show

app.py +50 -0

app.py ADDED Viewed

	@@ -0,0 +1,50 @@

+import gradio as gr
+import json
+import os
+import pandas as pd
+from glob import glob
+eval_results_dir = "eval_results/"  # Directory containing evaluation results
+def load_results():
+    records = []
+    # Recursively find all JSON files in the eval_results directory
+    json_files = glob(os.path.join(eval_results_dir, "**", "*.json"), recursive=True)
+    for file_path in json_files:
+        try:
+            with open(file_path, "r") as f:
+                data = json.load(f)
+                model_name = data["config_general"].get("model_name", "Unknown")
+                results = data.get("results", {})
+                # Extract relevant evaluation metrics
+                for task, task_data in results.items():
+                    if "extractive_match" in task_data:
+                        records.append({
+                            "Model": model_name,
+                            "Task": task,
+                            "Extractive Match": task_data["extractive_match"],
+                            "Std Err": task_data["extractive_match_stderr"]
+                        })
+        except Exception as e:
+            print(f"Error reading {file_path}: {e}")
+    # Convert to DataFrame
+    df = pd.DataFrame(records)
+    return df.sort_values(by=["Task", "Extractive Match"], ascending=[True, False])
+def leaderboard():
+    df = load_results()
+    return df
+with gr.Blocks() as demo:
+    gr.Markdown("# 📊 Evaluation Leaderboard")
+    gr.Markdown("This leaderboard displays evaluation results from JSON files in `eval_results/`.")
+    results_table = gr.Dataframe(leaderboard)
+    refresh_button = gr.Button("🔄 Refresh")
+    refresh_button.click(leaderboard, outputs=[results_table])
+demo.launch()