Spaces:

Mehrdad-S
/

Persian_embedding_leaderboard

Runtime error

App Files Files Community

Mehrdad-S commited on May 23

Commit

e3adec8

verified ·

1 Parent(s): eca1e92

Update evaluate.py

Browse files

Files changed (1) hide show

evaluate.py +22 -13

evaluate.py CHANGED Viewed

@@ -4,33 +4,42 @@ from datasets import load_dataset
 from sklearn.metrics.pairwise import cosine_similarity
 import numpy as np
-def evaluate_model(model_name,dataset):
     try:
         tokenizer = AutoTokenizer.from_pretrained(model_name)
         model = AutoModel.from_pretrained(model_name)
         model.eval()
-        model.to("cuda" if torch.cuda.is_available() else "cpu")
-    except:
         return None
     embeddings1, embeddings2 = [], []
     try:
         for item in dataset:
-            inputs1 = tokenizer(item["instruction"], return_tensors="pt", truncation=True, padding=True)
-            inputs2 = tokenizer(item["output"], return_tensors="pt", truncation=True, padding=True)
             with torch.no_grad():
-                embed1 = model(**inputs1).last_hidden_state[:, 0, :]
-                embed2 = model(**inputs2).last_hidden_state[:, 0, :]
-            embeddings1.append(embed1.squeeze().numpy())
-            embeddings2.append(embed2.squeeze().numpy())
         sims = [cosine_similarity([e1], [e2])[0][0] for e1, e2 in zip(embeddings1, embeddings2)]
-        labels = [item["similarity_score"] for item in dataset]
-        corr = np.corrcoef(sims, labels)[0, 1]
-        return float(corr)
     except Exception as e:
         print(f"Evaluation failed: {e}")
-        return None

 from sklearn.metrics.pairwise import cosine_similarity
 import numpy as np
+def evaluate_model(model_name, dataset):
+    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
     try:
         tokenizer = AutoTokenizer.from_pretrained(model_name)
         model = AutoModel.from_pretrained(model_name)
         model.eval()
+        model.to(device)
+    except Exception as e:
+        print(f"Model loading failed: {e}")
         return None
     embeddings1, embeddings2 = [], []
     try:
         for item in dataset:
+            inputs1 = tokenizer(item["instruction"], return_tensors="pt", truncation=True, padding=True).to(device)
+            inputs2 = tokenizer(item["output"], return_tensors="pt", truncation=True, padding=True).to(device)
             with torch.no_grad():
+                embed1 = model(**inputs1).last_hidden_state[:, 0, :].cpu().numpy()
+                embed2 = model(**inputs2).last_hidden_state[:, 0, :].cpu().numpy()
+            embeddings1.append(embed1.flatten())
+            embeddings2.append(embed2.flatten())
         sims = [cosine_similarity([e1], [e2])[0][0] for e1, e2 in zip(embeddings1, embeddings2)]
+        if "similarity_score" in dataset[0]:
+            labels = [item["similarity_score"] for item in dataset]
+            corr = np.corrcoef(sims, labels)[0, 1]
+            return float(corr)
+        else:
+            print("No similarity scores in dataset.")
+            return None
     except Exception as e:
         print(f"Evaluation failed: {e}")
+        return None