Spaces:

Metric-AI
/

ArmBench-LLM

Running

Bagratuni commited on 19 days ago

Commit

b566964

1 Parent(s): e6e4a80

api model results on unified exam appending

Files changed (1) hide show

model_results.json CHANGED Viewed

@@ -809,5 +809,53 @@
         }
       ]
     }
   }
 ]

         }
       ]
     }
+  },
+  {
+    "model_name": "gemini-2.5-flash",
+    "results": {
+      "mmlu_results": [],
+      "unified_exam_results": [
+        {
+          "category": "Average",
+          "score": 9.5
+        }
+      ]
+    }
+  },
+  {
+    "model_name": "gemini-2.5-pro",
+    "results": {
+      "mmlu_results": [],
+      "unified_exam_results": [
+        {
+          "category": "Average",
+          "score": 11.25
+        }
+      ]
+    }
+  },
+  {
+    "model_name": "gpt-4.1-2025-04-14",
+    "results": {
+      "mmlu_results": [],
+      "unified_exam_results": [
+        {
+          "category": "Average",
+          "score": 8.0
+        }
+      ]
+    }
+  },
+  {
+    "model_name": "claude-sonnet-4-20250514",
+    "results": {
+      "mmlu_results": [],
+      "unified_exam_results": [
+        {
+          "category": "Average",
+          "score": 7.0
+        }
+      ]
+    }
   }
 ]