Spaces:

idkash1
/

detect-edits-in-ai-generated-text

Sleeping

idkash1 commited on Mar 20

Commit

056f018

verified ·

1 Parent(s): f2ac04d

Update human_text_detect.py

Files changed (1) hide show

human_text_detect.py CHANGED Viewed

@@ -15,7 +15,6 @@ import os
 logging.basicConfig(level=logging.INFO)
 def read_all_csv_files(pattern):
     df = pd.DataFrame()
     print(pattern)
@@ -23,7 +22,6 @@ def read_all_csv_files(pattern):
         df = pd.concat([df, pd.read_csv(f)])
     return df
 def get_survival_function(df, G=101):
     """
     Returns a survival function for every sentence length in tokens.
@@ -44,7 +42,6 @@ def get_survival_function(df, G=101):
     xx1 = df1[value_name]
     return fit_per_length_survival_function(ll, xx1, log_space=True, G=G)
 def mark_edits_remove_tags(chunks, tag="edit"):
     text_chunks = chunks['text']
     edits = []
@@ -96,7 +93,10 @@ def detect_human_text(model_name, topic, text):
     min_tokens_per_sentence = 10
     max_tokens_per_sentence = 100
-    cache_dir = f"./cache/huggingface/{model_name}"
     # Init model
     print('Init model')

 logging.basicConfig(level=logging.INFO)
 def read_all_csv_files(pattern):
     df = pd.DataFrame()
     print(pattern)
         df = pd.concat([df, pd.read_csv(f)])
     return df
 def get_survival_function(df, G=101):
     """
     Returns a survival function for every sentence length in tokens.
     xx1 = df1[value_name]
     return fit_per_length_survival_function(ll, xx1, log_space=True, G=G)
 def mark_edits_remove_tags(chunks, tag="edit"):
     text_chunks = chunks['text']
     edits = []
     min_tokens_per_sentence = 10
     max_tokens_per_sentence = 100
+    cache_dir = f"/cacheHuggingface/{model_name}"
+    # Use a writable directory inside the Hugging Face Space
+    os.makedirs("/cacheHuggingface/PHI2", exist_ok=True)
+    os.makedirs("/cacheHuggingface/GPT2XL", exist_ok=True)
     # Init model
     print('Init model')