Spaces:

ApsidalSolid4
/

CITProjectAIDetector

Sleeping

ApsidalSolid4 commited on Mar 31

Commit

d611c30

verified ·

1 Parent(s): 37dcbee

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -109,9 +109,12 @@ class OCRProcessor:
             ocr_logger.info("PDF document detected, enforcing page limit")
             payload['filetype'] = 'PDF'
-        # Prepare file for OCR API - using file object directly as in the test script
         files = {
-            'file': (os.path.basename(file_path), open(file_path, 'rb'))
         }
         headers = {
@@ -132,9 +135,18 @@ class OCRProcessor:
             ocr_logger.info(f"OCR API status code: {response.status_code}")
             # Log response text for debugging (first 200 chars)
-            ocr_logger.info(f"OCR API response preview: {response.text[:200]}...")
-            response.raise_for_status()
             try:
                 result = response.json()
@@ -177,8 +189,7 @@ class OCRProcessor:
                 "text": ""
             }
         finally:
-            # Close the file handle
-            files['file'][1].close()
     def _extract_text_from_result(self, result: Dict) -> str:
         """

             ocr_logger.info("PDF document detected, enforcing page limit")
             payload['filetype'] = 'PDF'
+        # Prepare file for OCR API - using file data as bytes to avoid file handle issues
+        with open(file_path, 'rb') as f:
+            file_data = f.read()
         files = {
+            'file': (os.path.basename(file_path), file_data, file_type)
         }
         headers = {
             ocr_logger.info(f"OCR API status code: {response.status_code}")
             # Log response text for debugging (first 200 chars)
+            response_preview = response.text[:200] if hasattr(response, 'text') else "No text content"
+            ocr_logger.info(f"OCR API response preview: {response_preview}...")
+            try:
+                response.raise_for_status()
+            except Exception as e:
+                ocr_logger.error(f"HTTP Error: {str(e)}")
+                return {
+                    "success": False,
+                    "error": f"OCR API HTTP Error: {str(e)}",
+                    "text": ""
+                }
             try:
                 result = response.json()
                 "text": ""
             }
         finally:
+            # No need to close file handle as we're using bytes directly
     def _extract_text_from_result(self, result: Dict) -> str:
         """