Spaces:

Nadil-K
/

lm-spell

Sleeping

Nadil Karunarathna commited on Jun 4

Commit

fdd932a

1 Parent(s): a46e61a

revert

Files changed (1) hide show

app.py CHANGED Viewed

@@ -40,21 +40,15 @@ def correct(text):
         )
     prediction = outputs[0]
-    # special_token_id_to_keep = tokenizer.convert_tokens_to_ids('<ZWJ>')
-    # all_special_ids = set(tokenizer.all_special_ids)
-    # pred_tokens = prediction.cpu()
-    # tokens_list = pred_tokens.tolist()
-    # filtered_tokens = [
-    #     token for token in tokens_list
-    #     if token == special_token_id_to_keep or token not in all_special_ids
-    # ]
     special_token_id_to_keep = tokenizer.convert_tokens_to_ids('<ZWJ>')
-    all_special_ids_tensor = torch.tensor(tokenizer.all_special_ids, dtype=torch.long)
-    mask = (prediction == special_token_id_to_keep) | (~torch.isin(prediction, all_special_ids_tensor))
-    filtered_tokens = prediction[mask]
     prediction_decoded = tokenizer.decode(filtered_tokens, skip_special_tokens=False).replace('\n', '').strip()
@@ -63,4 +57,4 @@ def correct(text):
 init()
 demo = gr.Interface(fn=correct, inputs="text", outputs="text")
-demo.launch()

         )
     prediction = outputs[0]
     special_token_id_to_keep = tokenizer.convert_tokens_to_ids('<ZWJ>')
+    all_special_ids = set(tokenizer.all_special_ids)
+    pred_tokens = prediction.cpu()
+    tokens_list = pred_tokens.tolist()
+    filtered_tokens = [
+        token for token in tokens_list
+        if token == special_token_id_to_keep or token not in all_special_ids
+    ]
     prediction_decoded = tokenizer.decode(filtered_tokens, skip_special_tokens=False).replace('\n', '').strip()
 init()
 demo = gr.Interface(fn=correct, inputs="text", outputs="text")
+demo.launch(share=True)