Spaces:

Fas1
/

capybara_fas_ai

Runtime error

App Files Files Community

Fas1 commited on 21 days ago

Commit

63c5e51

verified ·

1 Parent(s): 244294e

гз

Browse files

Files changed (1) hide show

app.py +11 -8

app.py CHANGED Viewed

@@ -76,38 +76,41 @@ pipe = pipeline(
     tokenizer=tokenizer,
 )
-# Функция классификации (устойчивая к пустому вводу и разным форматам ответа)
-# Функция классификации (ручной вызов generate, без pipeline)
 def classify(text):
     if not text or not str(text).strip():
         return "⚠️ Пустой ввод. Введите сообщение."
     prompt = f"### Вопрос:\n{text}\n\n### Класс:"
     try:
-        # Токенизируем вручную и генерируем напрямую через модель
         enc = tokenizer(
             prompt,
             return_tensors="pt",
             padding=True,
             truncation=True,
         )
-        # Явно указываем pad/eos из токенизатора
         gen_kwargs = dict(
             max_new_tokens=16,
             do_sample=False,
             pad_token_id=tokenizer.pad_token_id,
             eos_token_id=tokenizer.eos_token_id,
         )
         with torch.no_grad():
-            out = model.generate(**enc, **gen_kwargs)
-        # Отрезаем подсказку и берём только продолжение
-        gen_only = out[:, enc["input_ids"].shape[1]:]
         generated = tokenizer.decode(gen_only[0], skip_special_tokens=True)
         label = (generated.strip().split()[0].lower() if generated.strip() else "unknown")
         return f"🔍 Класс: **{label}**"
     except Exception as e:
         import traceback
-        tb = traceback.format_exc(limit=3)
         return f"❌ Ошибка: {str(e)}\n\n<details><summary>trace</summary>\n\n{tb}\n\n</details>"
 # Интерфейс Gradio

     tokenizer=tokenizer,
 )
+# Функция классификации (ручной вызов generate, явная передача тензоров)
 def classify(text):
     if not text or not str(text).strip():
         return "⚠️ Пустой ввод. Введите сообщение."
     prompt = f"### Вопрос:\n{text}\n\n### Класс:"
     try:
         enc = tokenizer(
             prompt,
             return_tensors="pt",
             padding=True,
             truncation=True,
+            max_length=min(2048, getattr(tokenizer, "model_max_length", 2048) or 2048),
         )
+        input_ids = enc["input_ids"]
+        attention_mask = enc.get("attention_mask")
+        if attention_mask is None:
+            attention_mask = torch.ones_like(input_ids)
         gen_kwargs = dict(
             max_new_tokens=16,
             do_sample=False,
             pad_token_id=tokenizer.pad_token_id,
             eos_token_id=tokenizer.eos_token_id,
+            use_cache=True,
         )
         with torch.no_grad():
+            out = model.generate(input_ids=input_ids, attention_mask=attention_mask, **gen_kwargs)
+        gen_only = out[:, input_ids.shape[1]:]
         generated = tokenizer.decode(gen_only[0], skip_special_tokens=True)
         label = (generated.strip().split()[0].lower() if generated.strip() else "unknown")
         return f"🔍 Класс: **{label}**"
     except Exception as e:
         import traceback
+        tb = traceback.format_exc(limit=5)
         return f"❌ Ошибка: {str(e)}\n\n<details><summary>trace</summary>\n\n{tb}\n\n</details>"
 # Интерфейс Gradio