Spaces:

SimrusDenuvo
/

chat

Sleeping

App Files Files Community

SimrusDenuvo commited on May 15

Commit

7882653

verified ·

1 Parent(s): af5aa20

Update app.py

Browse files

Files changed (1) hide show

app.py +53 -17

app.py CHANGED Viewed

@@ -1,30 +1,65 @@
 import gradio as gr
-from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 import torch
 from datasets import load_dataset
-# Загружаем модель, токенизатор и датасет
 model_name = "ai-forever/rugpt3small_based_on_gpt2"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
-# Загружаем банковский датасет для контекста
-bank_dataset = load_dataset("ZhenDOS/alpha_bank_data")
-# Создаем контекст из датасета (первые несколько примеров)
-context_examples = "\n".join([
-    f"Вопрос: {example['question']}\nОтвет: {example['answer']}"
-    for example in bank_dataset['train'].select(range(5))
-])
-# Функция генерации ответа с учетом банковского контекста
 def generate_response(prompt):
-    # Добавляем контекст из датасета к промпту
-    full_prompt = f"""Контекст по банковским вопросам:
 {context_examples}
 Вопрос клиента: {prompt}
 Ответ:"""
     inputs = tokenizer(full_prompt, return_tensors="pt", truncation=True, max_length=512)
@@ -48,12 +83,13 @@ def generate_response(prompt):
         response = response[len(full_prompt):].strip()
     # Постобработка ответа
-    response = response.split("\n")[0]  # Берем только первую строку ответа
-    response = response.replace("Ответ:", "").strip()
     return response
-# Интерфейс Gradio с примерами вопросов
 examples = [
     "Как восстановить утерянную карту?",
     "Какие документы нужны для открытия счета?",
@@ -62,15 +98,15 @@ examples = [
     "Какие комиссии за перевод между счетами?"
 ]
 demo = gr.Interface(
     fn=generate_response,
     inputs=gr.Textbox(lines=4, label="Введите вопрос по клиентским обращениям в банк"),
     outputs=gr.Textbox(label="Ответ модели"),
     title="Анализ клиентских обращений — RuGPT-3 с Alpha Bank Data",
-    description="Используется модель ai-forever/rugpt3small_based_on_gpt2, дообученная на данных ZhenDOS/alpha_bank_data.",
     examples=examples
 )
-# Запуск
 if __name__ == "__main__":
     demo.launch()

 import gradio as gr
+from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
 from datasets import load_dataset
+# Загружаем модель и токенизатор
 model_name = "ai-forever/rugpt3small_based_on_gpt2"
 tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(model_name)
+# Загружаем и анализируем банковский датасет
+try:
+    bank_dataset = load_dataset("ZhenDOS/alpha_bank_data")
+    # Выводим структуру первого элемента для анализа
+    first_example = bank_dataset['train'][0]
+    print("Структура датасета (первый элемент):", first_example)
+    # Определяем используемые поля на основе анализа датасета
+    question_field = 'question' if 'question' in first_example else 'input'
+    answer_field = 'answer' if 'answer' in first_example else 'output'
+except Exception as e:
+    print(f"Ошибка при загрузке датасета: {e}")
+    bank_dataset = None
+    question_field = 'input'
+    answer_field = 'output'
+# Функция для создания контекста из датасета
+def create_context(dataset, num_examples=3):
+    if dataset is None:
+        return ""
+    try:
+        examples = []
+        for example in dataset['train'].select(range(num_examples)):
+            # Используем определенные поля или альтернативные варианты
+            question = example.get(question_field) or example.get('text') or example.get('message')
+            answer = example.get(answer_field) or example.get('response') or example.get('content')
+            if question and answer:
+                examples.append(f"Вопрос: {question}\nОтвет: {answer}")
+        return "\n\n".join(examples) if examples else ""
+    except Exception as e:
+        print(f"Ошибка при создании контекста: {e}")
+        return ""
+# Создаем контекст
+context_examples = create_context(bank_dataset)
+print("Созданный контекст:\n", context_examples)
+# Функция генерации ответа
 def generate_response(prompt):
+    # Добавляем контекст, если он есть
+    if context_examples:
+        full_prompt = f"""Контекст банковских вопросов:
 {context_examples}
 Вопрос клиента: {prompt}
 Ответ:"""
+    else:
+        full_prompt = f"Вопрос клиента: {prompt}\nОтвет:"
     inputs = tokenizer(full_prompt, return_tensors="pt", truncation=True, max_length=512)
         response = response[len(full_prompt):].strip()
     # Постобработка ответа
+    response = response.split("\n")[0].strip()
+    if not response.endswith((".", "!", "?")):
+        response += "."
     return response
+# Примеры вопросов
 examples = [
     "Как восстановить утерянную карту?",
     "Какие документы нужны для открытия счета?",
     "Какие комиссии за перевод между счетами?"
 ]
+# Интерфейс Gradio
 demo = gr.Interface(
     fn=generate_response,
     inputs=gr.Textbox(lines=4, label="Введите вопрос по клиентским обращениям в банк"),
     outputs=gr.Textbox(label="Ответ модели"),
     title="Анализ клиентских обращений — RuGPT-3 с Alpha Bank Data",
+    description="Используется модель ai-forever/rugpt3small_based_on_gpt2 с учетом данных из датасета Alpha Bank.",
     examples=examples
 )
 if __name__ == "__main__":
     demo.launch()