Spaces:

s1ome123
/

embedding

Sleeping

s1ome123 commited on Jul 9

Commit

2b41fd4

verified ·

1 Parent(s): 232a9f4

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,21 +1,24 @@
 import gradio as gr
-from sentence_transformers import SentenceTransformer
-# ✅ Load a model that outputs 1024-dim vectors
-model = SentenceTransformer('intfloat/e5-large')
 def embed_text(text):
-    # Optionally prepend "passage: " if using e5 models
-    processed_text = "passage: " + text.strip()
-    embedding = model.encode(processed_text).tolist()
     return embedding
-# Gradio interface
 iface = gr.Interface(
     fn=embed_text,
     inputs=gr.Textbox(lines=5, label="Enter patient text"),
     outputs="json",
-    title="Clinical Text Embedding API (1024-dim)"
 )
 iface.launch()

+from transformers import AutoTokenizer, AutoModel
+import torch
 import gradio as gr
+# Load Bio_ClinicalBERT
+tokenizer = AutoTokenizer.from_pretrained("emilyalsentzer/Bio_ClinicalBERT")
+model = AutoModel.from_pretrained("emilyalsentzer/Bio_ClinicalBERT")
 def embed_text(text):
+    inputs = tokenizer(text, return_tensors="pt", padding=True, truncation=True)
+    with torch.no_grad():
+        outputs = model(**inputs)
+    # Mean pooling
+    embedding = outputs.last_hidden_state.mean(dim=1).squeeze().tolist()
     return embedding
 iface = gr.Interface(
     fn=embed_text,
     inputs=gr.Textbox(lines=5, label="Enter patient text"),
     outputs="json",
+    title="Clinical Text Embedding API (Bio_ClinicalBERT)"
 )
 iface.launch()