SearchGPTTest

Sleeping

App Files Files Community

Shreyas094 commited on Aug 5, 2024

Commit

e482991

verified ·

1 Parent(s): c0570dd

Update app.py

Browse files

Files changed (1) hide show

app.py +30 -7

app.py CHANGED Viewed

@@ -284,9 +284,12 @@ def cleanup_web_search_database(temp_dir):
     shutil.rmtree(temp_dir)
 def duckduckgo_search(query):
     with DDGS() as ddgs:
         results = list(ddgs.text(query, max_results=5))
     database, temp_dir = get_web_search_database()
     documents = []
     for result in results:
@@ -294,13 +297,21 @@ def duckduckgo_search(query):
         doc = WebSearchDocument(page_content=content, metadata={"source": result['href']})
         documents.append(doc)
     database.add_documents(documents)
     return database, temp_dir, results
 def retrieve_web_search_results(database, query):
     retriever = database.as_retriever(search_kwargs={"k": 5})
     relevant_docs = retriever.get_relevant_documents(query)
     context = "\n".join([f"{doc.page_content}\nSource: {doc.metadata['source']}" for doc in relevant_docs])
     return context
@@ -339,15 +350,17 @@ def respond(message, history, model, temperature, num_calls, use_web_search, sel
     logging.info(f"User Query: {message}")
     logging.info(f"Model Used: {model}")
     logging.info(f"Search Type: {'Web Search' if use_web_search else 'PDF Search'}")
     logging.info(f"Selected Documents: {selected_docs}")
     try:
         if use_web_search:
             for main_content, sources in get_response_with_search(message, model, num_calls=num_calls, temperature=temperature):
                 response = f"{main_content}\n\n{sources}"
-                first_line = response.split('\n')[0] if response else ''
-#                logging.info(f"Generated Response (first line): {first_line}")
                 yield response
         else:
             embed = get_embeddings()
@@ -448,10 +461,15 @@ After writing the document, please provide a list of sources used in your respon
         yield "I apologize, but I couldn't generate a response at this time. Please try again later."
 def get_response_with_search(query, model, num_calls=3, temperature=0.2):
-    database, temp_dir, search_results = duckduckgo_search(query)
-    context = retrieve_web_search_results(database, query)
-    prompt = f"""Using the following context from web search results:
 {context}
 Write a detailed and complete research document that fulfills the following user request: '{query}'
 After writing the document, please provide a list of sources used in your response."""
@@ -477,6 +495,11 @@ After writing the document, please provide a list of sources used in your respon
                         chunk = message.choices[0].delta.content
                         main_content += chunk
                         yield main_content, ""  # Yield partial main content without sources
     finally:
         # Clean up the temporary database
         cleanup_web_search_database(temp_dir)

     shutil.rmtree(temp_dir)
 def duckduckgo_search(query):
+    logging.info(f"Performing DuckDuckGo search for query: {query}")
     with DDGS() as ddgs:
         results = list(ddgs.text(query, max_results=5))
+    logging.info(f"Number of search results: {len(results)}")
     database, temp_dir = get_web_search_database()
     documents = []
     for result in results:
         doc = WebSearchDocument(page_content=content, metadata={"source": result['href']})
         documents.append(doc)
+    logging.info(f"Number of documents created: {len(documents)}")
     database.add_documents(documents)
     return database, temp_dir, results
 def retrieve_web_search_results(database, query):
+    logging.info(f"Retrieving web search results for query: {query}")
     retriever = database.as_retriever(search_kwargs={"k": 5})
     relevant_docs = retriever.get_relevant_documents(query)
+    logging.info(f"Number of relevant documents retrieved: {len(relevant_docs)}")
+    if not relevant_docs:
+        logging.warning("No relevant documents found in the database")
+        return "No relevant information found."
     context = "\n".join([f"{doc.page_content}\nSource: {doc.metadata['source']}" for doc in relevant_docs])
     return context
     logging.info(f"User Query: {message}")
     logging.info(f"Model Used: {model}")
     logging.info(f"Search Type: {'Web Search' if use_web_search else 'PDF Search'}")
     logging.info(f"Selected Documents: {selected_docs}")
     try:
         if use_web_search:
+            database, temp_dir, search_results = duckduckgo_search(message)
+            if not search_results:
+                yield "I'm sorry, but I couldn't find any search results for your query. Could you please rephrase or ask a different question?"
+                return
             for main_content, sources in get_response_with_search(message, model, num_calls=num_calls, temperature=temperature):
                 response = f"{main_content}\n\n{sources}"
                 yield response
         else:
             embed = get_embeddings()
         yield "I apologize, but I couldn't generate a response at this time. Please try again later."
 def get_response_with_search(query, model, num_calls=3, temperature=0.2):
+    try:
+        database, temp_dir, search_results = duckduckgo_search(query)
+        context = retrieve_web_search_results(database, query)
+        if context == "No relevant information found.":
+            yield "I'm sorry, but I couldn't find any relevant information for your query. Could you please rephrase or ask a different question?", ""
+            return
+        prompt = f"""Using the following context from web search results:
 {context}
 Write a detailed and complete research document that fulfills the following user request: '{query}'
 After writing the document, please provide a list of sources used in your response."""
                         chunk = message.choices[0].delta.content
                         main_content += chunk
                         yield main_content, ""  # Yield partial main content without sources
+    except Exception as e:
+        logging.error(f"Error in get_response_with_search: {str(e)}")
+        logging.error(traceback.format_exc())
+        yield "I'm sorry, but I encountered an error while processing your request. Please try again later.", ""
     finally:
         # Clean up the temporary database
         cleanup_web_search_database(temp_dir)