Spaces:

yifan0sun
/

BERTGradGraph

Runtime error

yifan0sun commited on May 22

Commit

d63cce4

1 Parent(s): 5e5b29d

dcachedir

Files changed (3) hide show

BERTmodel.py CHANGED Viewed

@@ -11,23 +11,26 @@ from transformers import (
 )
 import torch.nn.functional as F
 class BERTVisualizer(TransformerVisualizer):
     def __init__(self,task):
         super().__init__()
         self.task = task
-        self.tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
         print('finding model', self.task)
         if self.task == 'mlm':
             self.model = BertForMaskedLM.from_pretrained(
                 "bert-base-uncased",
-                attn_implementation="eager"  # fallback to standard attention
             ).to(self.device)
         elif self.task == 'sst':
-            self.model = BertForSequenceClassification.from_pretrained("textattack/bert-base-uncased-SST-2",device_map=None)
         elif self.task == 'mnli':
-            self.model = BertForSequenceClassification.from_pretrained("textattack/bert-base-uncased-MNLI", device_map=None)
         else:
             raise ValueError(f"Unsupported task: {self.task}")
         print('model found')

 )
 import torch.nn.functional as F
+CACHE_DIR  = "./hf_cache"
 class BERTVisualizer(TransformerVisualizer):
     def __init__(self,task):
         super().__init__()
         self.task = task
+        self.tokenizer = BertTokenizer.from_pretrained('bert-base-uncased', cache_dir=CACHE_DIR)
         print('finding model', self.task)
         if self.task == 'mlm':
             self.model = BertForMaskedLM.from_pretrained(
                 "bert-base-uncased",
+                attn_implementation="eager",  # fallback to standard attention
+                cache_dir=CACHE_DIR
             ).to(self.device)
         elif self.task == 'sst':
+            self.model = BertForSequenceClassification.from_pretrained("textattack/bert-base-uncased-SST-2",device_map=None, cache_dir=CACHE_DIR)
         elif self.task == 'mnli':
+            self.model = BertForSequenceClassification.from_pretrained("textattack/bert-base-uncased-MNLI", device_map=None, cache_dir=CACHE_DIR)
         else:
             raise ValueError(f"Unsupported task: {self.task}")
         print('model found')

DISTILLBERTmodel.py CHANGED Viewed

@@ -12,17 +12,18 @@ from transformers import (
     DistilBertForMaskedLM, DistilBertForSequenceClassification
 )
 class DistilBERTVisualizer(TransformerVisualizer):
     def __init__(self, task):
         super().__init__()
         self.task = task
-        self.tokenizer = DistilBertTokenizer.from_pretrained('distilbert-base-uncased')
         if self.task == 'mlm':
-            self.model = DistilBertForMaskedLM.from_pretrained('distilbert-base-uncased')
         elif self.task == 'sst':
-            self.model = DistilBertForSequenceClassification.from_pretrained('distilbert-base-uncased-finetuned-sst-2-english')
         elif self.task == 'mnli':
-            self.model = DistilBertForSequenceClassification.from_pretrained("textattack/distilbert-base-uncased-MNLI")
         else:

     DistilBertForMaskedLM, DistilBertForSequenceClassification
 )
+CACHE_DIR  = "./hf_cache"
 class DistilBERTVisualizer(TransformerVisualizer):
     def __init__(self, task):
         super().__init__()
         self.task = task
+        self.tokenizer = DistilBertTokenizer.from_pretrained('distilbert-base-uncased', cache_dir=CACHE_DIR)
         if self.task == 'mlm':
+            self.model = DistilBertForMaskedLM.from_pretrained('distilbert-base-uncased', cache_dir=CACHE_DIR)
         elif self.task == 'sst':
+            self.model = DistilBertForSequenceClassification.from_pretrained('distilbert-base-uncased-finetuned-sst-2-english', cache_dir=CACHE_DIR)
         elif self.task == 'mnli':
+            self.model = DistilBertForSequenceClassification.from_pretrained("textattack/distilbert-base-uncased-MNLI", cache_dir=CACHE_DIR)
         else:

ROBERTAmodel.py CHANGED Viewed

@@ -6,17 +6,18 @@ from transformers import (
     RobertaForMaskedLM, RobertaForSequenceClassification
 )
 class RoBERTaVisualizer(TransformerVisualizer):
     def __init__(self, task):
         super().__init__()
         self.task = task
-        self.tokenizer = RobertaTokenizer.from_pretrained('roberta-base')
         if self.task == 'mlm':
-            self.model = RobertaForMaskedLM.from_pretrained("roberta-base")
         elif self.task == 'sst':
-            self.model = RobertaForSequenceClassification.from_pretrained('textattack/roberta-base-SST-2')
         elif self.task == 'mnli':
-            self.model = RobertaForSequenceClassification.from_pretrained("roberta-large-mnli")
         self.model.to(self.device)

     RobertaForMaskedLM, RobertaForSequenceClassification
 )
+CACHE_DIR  = "./hf_cache"
 class RoBERTaVisualizer(TransformerVisualizer):
     def __init__(self, task):
         super().__init__()
         self.task = task
+        self.tokenizer = RobertaTokenizer.from_pretrained('roberta-base', cache_dir=CACHE_DIR)
         if self.task == 'mlm':
+            self.model = RobertaForMaskedLM.from_pretrained("roberta-base", cache_dir=CACHE_DIR)
         elif self.task == 'sst':
+            self.model = RobertaForSequenceClassification.from_pretrained('textattack/roberta-base-SST-2', cache_dir=CACHE_DIR)
         elif self.task == 'mnli':
+            self.model = RobertaForSequenceClassification.from_pretrained("roberta-large-mnli", cache_dir=CACHE_DIR)
         self.model.to(self.device)