Spaces:

shenjingwen
/

live_speech_test

Runtime error

shenjingwen commited on Jun 3

Commit

d3c7abc

verified ·

1 Parent(s): 295cea1

Update vector_search.py

Files changed (1) hide show

vector_search.py CHANGED Viewed

@@ -9,6 +9,8 @@ from transformers import T5Tokenizer, T5ForConditionalGeneration
 class HybridVectorSearch:
     cuda_device = torch.device("cpu")
     sparse_model = "naver/splade-v3"
     tokenizer = AutoTokenizer.from_pretrained(sparse_model)
@@ -19,7 +21,7 @@ class HybridVectorSearch:
     model_name_t5 = "Falconsai/text_summarization"  # "t5-small"
     tokenizer_t5 = T5Tokenizer.from_pretrained(model_name_t5)
-    model_t5 = T5ForConditionalGeneration.from_pretrained(model_name_t5).to("cuda")
     client = QdrantClient(url="http://localhost:6333")
     earnings_collection = "earnings_calls"
@@ -54,7 +56,7 @@ class HybridVectorSearch:
     def summary(text: str):
         inputs = HybridVectorSearch.tokenizer_t5.encode(
             f"summarize: {text}", return_tensors="pt", max_length=1024, truncation=True
-        ).to("cuda")
         summary_ids = HybridVectorSearch.model_t5.generate(
             inputs,
             max_length=512,

 class HybridVectorSearch:
+    # dd="cuda"
+    dd="cpu"
     cuda_device = torch.device("cpu")
     sparse_model = "naver/splade-v3"
     tokenizer = AutoTokenizer.from_pretrained(sparse_model)
     model_name_t5 = "Falconsai/text_summarization"  # "t5-small"
     tokenizer_t5 = T5Tokenizer.from_pretrained(model_name_t5)
+    model_t5 = T5ForConditionalGeneration.from_pretrained(model_name_t5).to(dd)
     client = QdrantClient(url="http://localhost:6333")
     earnings_collection = "earnings_calls"
     def summary(text: str):
         inputs = HybridVectorSearch.tokenizer_t5.encode(
             f"summarize: {text}", return_tensors="pt", max_length=1024, truncation=True
+        ).to(dd)
         summary_ids = HybridVectorSearch.model_t5.generate(
             inputs,
             max_length=512,