Spaces:

dasomaru
/

gemma

Runtime error

dasomaru commited on Apr 28

Commit

f83d093

verified ·

1 Parent(s): f0633ef

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -19,15 +19,15 @@ model = AutoModelForCausalLM.from_pretrained(
 @spaces.GPU(duration=300)
 def generate_response(query):
     # 🚀 generate_response 함수 안에서 매번 로드
-    # tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
-    # model = AutoModelForCausalLM.from_pretrained(
-    #     model_name,
-    #     torch_dtype=torch.float16,
-    #     device_map="auto",  # ✅ 중요: 자동으로 GPU 할당
-    #     trust_remote_code=True,
-    # )
-    tokenizer = AutoTokenizer.from_pretrained("dasomaru/gemma-3-4bit-it-demo")
-    model = AutoModelForCausalLM.from_pretrained("dasomaru/gemma-3-4bit-it-demo")
     model.to("cuda")
     # 1. 검색

 @spaces.GPU(duration=300)
 def generate_response(query):
     # 🚀 generate_response 함수 안에서 매번 로드
+    tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
+    model = AutoModelForCausalLM.from_pretrained(
+        model_name,
+        torch_dtype=torch.float16,
+        device_map="auto",  # ✅ 중요: 자동으로 GPU 할당
+        trust_remote_code=True,
+    )
+    # tokenizer = AutoTokenizer.from_pretrained("dasomaru/gemma-3-4bit-it-demo")
+    # model = AutoModelForCausalLM.from_pretrained("dasomaru/gemma-3-4bit-it-demo")
     model.to("cuda")
     # 1. 검색