SearchGPTTest

Sleeping

App Files Files Community

Shreyas094 commited on Aug 11, 2024

Commit

9c1a06a

verified ·

1 Parent(s): 1718c18

Update app.py

Browse files

Files changed (1) hide show

app.py +48 -2

app.py CHANGED Viewed

@@ -18,6 +18,7 @@ from huggingface_hub import InferenceClient
 import inspect
 import logging
 import shutil
 # Set up basic configuration for logging
@@ -430,6 +431,22 @@ def create_web_search_vectors(search_results):
     return FAISS.from_documents(documents, embed)
 def get_response_with_search(query, model, num_calls=3, temperature=0.2):
     search_results = duckduckgo_search(query)
     web_search_database = create_web_search_vectors(search_results)
@@ -438,12 +455,15 @@ def get_response_with_search(query, model, num_calls=3, temperature=0.2):
         yield "No web search results available. Please try again.", ""
         return
-    retriever = web_search_database.as_retriever(search_kwargs={"k": 5})
     relevant_docs = retriever.get_relevant_documents(query)
     accumulated_response = ""
-    for i, doc in enumerate(relevant_docs, 1):
         context = doc.page_content
         source = doc.metadata.get('source', 'Unknown source')
@@ -502,6 +522,32 @@ Highlight any conflicting information or gaps in the available data."""
                 overall_summary += chunk
         accumulated_response += f"Overall Summary:\n\n{overall_summary}\n\n"
         yield accumulated_response, ""
 def get_response_from_pdf(query, model, selected_docs, num_calls=3, temperature=0.2):
     logging.info(f"Entering get_response_from_pdf with query: {query}, model: {model}, selected_docs: {selected_docs}")

 import inspect
 import logging
 import shutil
+from sentence_transformers import CrossEncoder
 # Set up basic configuration for logging
     return FAISS.from_documents(documents, embed)
+def rerank_web_results(query, documents, top_k=5):
+    # Initialize the cross-encoder model
+    cross_encoder = CrossEncoder('cross-encoder/ms-marco-MiniLM-L-6-v2')
+    # Prepare input pairs for the cross-encoder
+    pairs = [[query, doc.page_content] for doc in documents]
+    # Compute relevance scores
+    scores = cross_encoder.predict(pairs)
+    # Sort documents by score
+    reranked_docs = sorted(zip(documents, scores), key=lambda x: x[1], reverse=True)
+    # Return top_k documents
+    return [doc for doc, score in reranked_docs[:top_k]]
 def get_response_with_search(query, model, num_calls=3, temperature=0.2):
     search_results = duckduckgo_search(query)
     web_search_database = create_web_search_vectors(search_results)
         yield "No web search results available. Please try again.", ""
         return
+    retriever = web_search_database.as_retriever(search_kwargs={"k": 20})  # Retrieve more documents for reranking
     relevant_docs = retriever.get_relevant_documents(query)
+    # Rerank the documents
+    reranked_docs = rerank_web_results(query, relevant_docs, top_k=5)
     accumulated_response = ""
+    for i, doc in enumerate(reranked_docs, 1):
         context = doc.page_content
         source = doc.metadata.get('source', 'Unknown source')
                 overall_summary += chunk
         accumulated_response += f"Overall Summary:\n\n{overall_summary}\n\n"
         yield accumulated_response, ""
+    # Generate an overall summary after processing all sources
+    overall_prompt = f"""Based on the summaries you've generated for each source, provide a concise overall summary that addresses the user's query: '{query}'
+Highlight any conflicting information or gaps in the available data."""
+    if model == "@cf/meta/llama-3.1-8b-instruct":
+        # Use Cloudflare API for overall summary
+        overall_response = ""
+        for response in get_response_from_cloudflare(prompt="", context="", query=overall_prompt, num_calls=1, temperature=temperature, search_type="web"):
+            overall_response += response
+        accumulated_response += f"Overall Summary:\n\n{overall_response}\n\n"
+        yield accumulated_response, ""
+    else:
+        # Use Hugging Face API for overall summary
+        overall_summary = ""
+        for message in client.chat_completion(
+            messages=[{"role": "user", "content": overall_prompt}],
+            max_tokens=2000,
+            temperature=temperature,
+            stream=True,
+        ):
+            if message.choices and message.choices[0].delta and message.choices[0].delta.content:
+                chunk = message.choices[0].delta.content
+                overall_summary += chunk
+        accumulated_response += f"Overall Summary:\n\n{overall_summary}\n\n"
+        yield accumulated_response, ""
 def get_response_from_pdf(query, model, selected_docs, num_calls=3, temperature=0.2):
     logging.info(f"Entering get_response_from_pdf with query: {query}, model: {model}, selected_docs: {selected_docs}")