Spaces:

JaishnaCodz
/

BlogReviewer

Sleeping

App Files Files Community

JaishnaCodz commited on Jul 15

Commit

5ef657b

verified ·

1 Parent(s): b63764b

Update app.py

Browse files

Files changed (1) hide show

app.py +22 -17

app.py CHANGED Viewed

@@ -7,10 +7,13 @@ import requests
 from io import BytesIO
 import difflib
-# Load model
 reviewer = pipeline("text2text-generation", model="google/flan-t5-base")
-# OCR from image URL
 def extract_text_from_image_url(img_url):
     try:
         response = requests.get(img_url)
@@ -20,7 +23,7 @@ def extract_text_from_image_url(img_url):
     except Exception as e:
         return f"❌ OCR Error: {e}"
-# Extract main blog content from URL
 def extract_text_from_url(url):
     downloaded = trafilatura.fetch_url(url)
     if downloaded:
@@ -28,7 +31,7 @@ def extract_text_from_url(url):
     else:
         return "❌ Blog Error: Could not fetch content from the URL."
-# Highlight diffs using difflib
 def highlight_diffs(orig, suggestion):
     diff = difflib.ndiff(orig.split(), suggestion.split())
     result = []
@@ -41,7 +44,7 @@ def highlight_diffs(orig, suggestion):
             result.append(word[2:])
     return " ".join(result)
-# Review line-by-line
 def review_lines(text):
     lines = text.strip().split('\n')
     reviewed = []
@@ -61,7 +64,7 @@ def finalize_text(originals, suggestions, decisions):
         output.append(sugg if accepted else orig)
     return "\n".join(output)
-# Build Gradio UI
 with gr.Blocks(theme=gr.themes.Soft()) as app:
     gr.Markdown("## ✨ BlogChecker AI\nSmart blog reviewer with OCR + AI suggestions")
@@ -79,35 +82,37 @@ with gr.Blocks(theme=gr.themes.Soft()) as app:
     review_area = gr.Column(visible=False)
     final_output = gr.Textbox(label="📦 Final Clean Blog", lines=10)
-    review_boxes = []
-    # Extract combined content
     def extract_both(url, img_url):
         blog = extract_text_from_url(url)
         ocr = extract_text_from_image_url(img_url) if img_url else ""
         return blog + ("\n" + ocr if ocr else "")
-    # Review and build UI dynamically
     def do_review(text):
         results = review_lines(text)
         review_area.children.clear()
         review_boxes.clear()
         for idx, (orig, highlighted, clean) in enumerate(results):
-            with review_area:
-                orig_box = gr.Textbox(value=orig, label=f"Original Line {idx+1}", interactive=False)
-                markdown_sugg = gr.Markdown(value=highlighted, label=f"Suggested Edit {idx+1}")
-                accept = gr.Checkbox(label="✅ Accept Suggestion", value=False)
-                review_boxes.append((orig_box, clean, accept))
         return gr.update(visible=True)
-    # Compile final clean version
     def collect_results():
         originals = [box[0].value for box in review_boxes]
         suggestions = [box[1] for box in review_boxes]
         accepts = [box[2].value for box in review_boxes]
         return finalize_text(originals, suggestions, accepts)
-    # Wire buttons
     extract_btn.click(fn=extract_both, inputs=[blog_url, image_url], outputs=combined_text)
     review_btn.click(fn=do_review, inputs=combined_text, outputs=review_area)
     finalize_btn.click(fn=collect_results, outputs=final_output)

 from io import BytesIO
 import difflib
+# Load the model
 reviewer = pipeline("text2text-generation", model="google/flan-t5-base")
+# Global storage for review UI
+review_boxes = []
+# OCR from image
 def extract_text_from_image_url(img_url):
     try:
         response = requests.get(img_url)
     except Exception as e:
         return f"❌ OCR Error: {e}"
+# Blog content from URL
 def extract_text_from_url(url):
     downloaded = trafilatura.fetch_url(url)
     if downloaded:
     else:
         return "❌ Blog Error: Could not fetch content from the URL."
+# Highlight word-level differences
 def highlight_diffs(orig, suggestion):
     diff = difflib.ndiff(orig.split(), suggestion.split())
     result = []
             result.append(word[2:])
     return " ".join(result)
+# Process each line
 def review_lines(text):
     lines = text.strip().split('\n')
     reviewed = []
         output.append(sugg if accepted else orig)
     return "\n".join(output)
+# Build UI
 with gr.Blocks(theme=gr.themes.Soft()) as app:
     gr.Markdown("## ✨ BlogChecker AI\nSmart blog reviewer with OCR + AI suggestions")
     review_area = gr.Column(visible=False)
     final_output = gr.Textbox(label="📦 Final Clean Blog", lines=10)
+    # Combine blog + OCR
     def extract_both(url, img_url):
         blog = extract_text_from_url(url)
         ocr = extract_text_from_image_url(img_url) if img_url else ""
         return blog + ("\n" + ocr if ocr else "")
+    # Generate suggestions and show UI
     def do_review(text):
         results = review_lines(text)
         review_area.children.clear()
         review_boxes.clear()
+        elems = []
         for idx, (orig, highlighted, clean) in enumerate(results):
+            orig_box = gr.Textbox(value=orig, label=f"Original Line {idx+1}", interactive=False)
+            markdown_sugg = gr.Markdown(value=highlighted, label=f"Suggested Edit {idx+1}")
+            accept = gr.Checkbox(label="✅ Accept Suggestion", value=False)
+            elems.extend([orig_box, markdown_sugg, accept])
+            review_boxes.append((orig_box, clean, accept))
+        review_area.children = elems
         return gr.update(visible=True)
+    # Collect accepted decisions
     def collect_results():
         originals = [box[0].value for box in review_boxes]
         suggestions = [box[1] for box in review_boxes]
         accepts = [box[2].value for box in review_boxes]
         return finalize_text(originals, suggestions, accepts)
+    # Wire events
     extract_btn.click(fn=extract_both, inputs=[blog_url, image_url], outputs=combined_text)
     review_btn.click(fn=do_review, inputs=combined_text, outputs=review_area)
     finalize_btn.click(fn=collect_results, outputs=final_output)