Spaces:

dasomaru
/

gemma

Runtime error

dasomaru commited on Apr 29

Commit

ccfdfe2

verified ·

1 Parent(s): b8c3699

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -17,6 +17,7 @@ model = AutoModelForCausalLM.from_pretrained(
     trust_remote_code=True,
 )
 @spaces.GPU(duration=300)
 def generate_response(query):
     # 🚀 generate_response 함수 안에서 매번 로드
@@ -58,9 +59,23 @@ def generate_response(query):
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
 @spaces.GPU(duration=300)
 def generate_response_with_pipeline(query):
-    return rag_pipeline(query)
-demo = gr.Interface(fn=generate_response_with_pipeline, inputs="text", outputs="text")
 demo.launch()

     trust_remote_code=True,
 )
+# v0
 @spaces.GPU(duration=300)
 def generate_response(query):
     # 🚀 generate_response 함수 안에서 매번 로드
     return tokenizer.decode(outputs[0], skip_special_tokens=True)
+# v1
 @spaces.GPU(duration=300)
 def generate_response_with_pipeline(query):
+    return rag_pipeline(query)
+# v2
+search_cache = {}
+@spaces.GPU(duration=300)
+def search_documents_with_cache(query: str):
+    if query in search_cache:
+        print(f"⚡ 캐시 사용: '{query}'")
+        return search_cache[query]
+    results = rag_pipeline(query)
+    search_cache[query] = results
+    return results
+demo = gr.Interface(fn=search_documents_with_cache, inputs="text", outputs="text")
 demo.launch()