Spaces:

RobPruzan
/

automaticlitassesment

Runtime error

RobPruzan commited on Sep 10, 2022

Commit

9a395b0

1 Parent(s): adbc103

removing stopwords from vocabulary scores

Files changed (1) hide show

app.py CHANGED Viewed

@@ -428,6 +428,7 @@ def get_level(word):
     word = word.strip(" ")
     data = json.loads(f.read())
     level = 0
     for k, v in data.items():
       if word in v:
         level = k
@@ -437,10 +438,17 @@ def get_level(word):
 def vocab_level_inter(text):
   text = word_tokenize(text)
   interp = [('',0)]
   sum = 0
   total = 0
   for idx, i in enumerate(text):
     lvl = int(get_level(i))/4
     interp.append((i, lvl))
     sum+= lvl

     word = word.strip(" ")
     data = json.loads(f.read())
     level = 0
     for k, v in data.items():
       if word in v:
         level = k
 def vocab_level_inter(text):
   text = word_tokenize(text)
+  stop_words = set(stopwords.words('english'))
+    for i in string.punctuation:
+        stop_words.add(i)
   interp = [('',0)]
   sum = 0
   total = 0
   for idx, i in enumerate(text):
+    if i in stop_words:
+        lvl = -1
+        interp.append((i, lvl))
+        continue
     lvl = int(get_level(i))/4
     interp.append((i, lvl))
     sum+= lvl