Spaces:

aioverlords-amnil
/

OCR-SMALL

Sleeping

AnkitShrestha commited on May 15

Commit

f2acee5

1 Parent(s): 6d7bbfa

minor fixes

Files changed (1) hide show

utils.py CHANGED Viewed

@@ -1,7 +1,7 @@
 from doctr.models import detection_predictor, recognition_predictor
 from doctr.io import DocumentFile
-from surya.recognition import RecognitionPredictor as SuryaRecognitionPredictor
-from surya.detection import DetectionPredictor as SuryaDetectionPredictor
 from PIL import Image
 # from functools import lru_cache
 from torchvision import models
@@ -253,9 +253,9 @@ def initialize_detector():
     if doctr_detector is None:
         doctr_detector = detection_predictor('db_mobilenet_v3_large', pretrained=True, assume_straight_pages=True, preserve_aspect_ratio=True)
     if surya_recognition_predictor is None:
-        surya_recognition_predictor = SuryaRecognitionPredictor()
     if surya_detection_predictor is None:
-        surya_detection_predictor = SuryaDetectionPredictor()
     return doctr_detector, surya_recognition_predictor, surya_detection_predictor
 def get_cleaned_boxes(out, page):
@@ -347,7 +347,7 @@ def ocr_citizenship_utils(image_path: str) -> List[List[str]]:
         # OCR PART
         langs = ["en",'ne']
-        predictions = surya_recognition_predictor([pil_image], [langs],surya_detection_predictor)
         text_combo = ''
         for text_line in predictions[0].text_lines:
             text_combo = text_combo + " " + text_line.text.strip()

 from doctr.models import detection_predictor, recognition_predictor
 from doctr.io import DocumentFile
+from surya.recognition import RecognitionPredictor
+from surya.detection import DetectionPredictor
 from PIL import Image
 # from functools import lru_cache
 from torchvision import models
     if doctr_detector is None:
         doctr_detector = detection_predictor('db_mobilenet_v3_large', pretrained=True, assume_straight_pages=True, preserve_aspect_ratio=True)
     if surya_recognition_predictor is None:
+        surya_recognition_predictor = RecognitionPredictor()
     if surya_detection_predictor is None:
+        surya_detection_predictor = DetectionPredictor()
     return doctr_detector, surya_recognition_predictor, surya_detection_predictor
 def get_cleaned_boxes(out, page):
         # OCR PART
         langs = ["en",'ne']
+        predictions = surya_recognition_predictor(images=[pil_image], langs=[langs],det_predictor=surya_detection_predictor)
         text_combo = ''
         for text_line in predictions[0].text_lines:
             text_combo = text_combo + " " + text_line.text.strip()