Spaces:

1NEYRON1
/

Topic_classification_for_scientific_articles

Sleeping

App Files Files Community

1NEYRON1 commited on Apr 3

Commit

b4c0a34

1 Parent(s): 5f01a56

Update app.py

Browse files

Files changed (1) hide show

app.py +93 -103

app.py CHANGED Viewed

@@ -1,104 +1,94 @@
 import streamlit as st
-st.title("This is a title")
-st.header("This is a header")
-st.subheader("This is a subheader")
-st.text("This is a text")
-st.markdown("# This is a markdown header 1")
-st.markdown("## This is a markdown header 2")
-st.markdown("### This is a markdown header 3")
-st.markdown("This is a markdown: *bold* **italic** `inline code` ~strikethrough~")
-st.markdown("""This is a code block with syntax highlighting
-```python
-print("Hello world!")
-```
-""")
-st.html(
-    "image from url example with html: "
-    "<img src='https://www.wallpaperflare.com/static/450/825/286/kitten-cute-animals-grass-5k-wallpaper.jpg' width=400px>",
-)
-st.write("Text with write")
-st.write(range(10))
-st.success("Success")
-st.info("Information")
-st.warning("Warning")
-st.error("Error")
-exp = ZeroDivisionError("Trying to divide by Zero")
-st.exception(exp)
-from urllib import request
-request.urlretrieve(
-    "http://craphound.com/images/1006884_2adf8fc7.jpg",
-    "image_example.jpg",
-)
-from PIL import Image
-img = Image.open("image_example.jpg")
-img
-# картинка (без html - из переменной)
-st.image(img, width=200)
-# чекбокс
-if st.checkbox("Show/Hide"):
-    st.text("Showing the widget")
-else:
-    st.warning("Not showing what is inside")
-# выбор опции кружочками
-status = st.radio("Select Gender: ", ('Male', 'Female'))
-if (status == 'Male'):
-    st.success("Male")
-else:
-    st.success("Female")
-# выбор опции выпадающим меню
-hobby = st.selectbox(
-    "Hobbies: ",
-    ['Dancing', 'Reading', 'Sports'],
-)
-st.write("Your hobby is: ", hobby)
-# выбор нескольких опций
-hobbies = st.multiselect(
-    "Hobbies: ",
-    ['Dancing', 'Reading', 'Sports'],
-)
-st.write("You selected", len(hobbies), 'hobbies')
-# кнопка без функционала
-st.button("Click me for no reason")
-# кнопка, показывающая текст, когда нажата
-if(st.button("Click me")):
-    st.text("You did it, you clicked me!!!")
-# текстовый input: label - название, value - что написано по дефолту
-name = st.text_input(label="Enter Your name", value="Type Here ...")
-if(st.button('Submit')):
-    result = name.title()
-    st.success(result)
-# слайдер
-level = st.slider("Select the level", 1, 5)
-st.text('Selected: {}'.format(level))
-# инициализируем переменные
-st.session_state.key1 = 'value1'     # Attribute API
-st.session_state['key2'] = 'value2'  # Dictionary like API
-# посмотреть что в st.session_state
-st.write(st.session_state)
-# magic
-st.session_state
-# ошибка если неправильный ключ
-st.write(st.session_state['missing_key'])
-# key - позволяет указать в какое поле session_state записать объект
-st.text_input("Please input something", key="my input")
-st.session_state

 import streamlit as st
+from transformers import pipeline
+# Загружаем модель (замените на вашу модель, если нужно)
+# Для примера используем zero-shot-classification
+try:
+    classifier = pipeline("zero-shot-classification")
+except OSError as e:
+    st.error(f"Ошибка загрузки модели: {e}. Убедитесь, что модель доступна или укажите другую.")
+    st.stop()  # Остановка выполнения приложения при ошибке
+# model =
+# tokenizer =
+# topic_classifier = pipeline("text-classification", model=model, tokenizer=tokenizer)
+topic_classifier = pipeline("text-classification")
+text = "This is an example sentence for topic classification."
+result = topic_classifier(text)
+print(result)
+def classify_text(title, description, candidate_labels, show_all=False, threshold=0.95):
+    """
+    Классифицирует текст и возвращает результаты в отсортированном виде.
+    Args:
+        title (str): Заголовок текста.
+        description (str): Краткое описание текста.
+        candidate_labels (list): Список меток-кандидатов.
+        show_all (bool): Показывать ли все результаты, независимо от порога.
+        threshold (float): Порог суммарной вероятности.
+    Returns:
+        list: Отсортированный список результатов классификации.
+    """
+    text = f"{title} {description}"  # Объединяем заголовок и описание
+    try:
+        results = topic_classifier(text)
+        # results = topic_classifier(text, candidate_labels, multi_label=True)  # multi_label=True для нескольких меток
+    except Exception as e:
+        st.error(f"Ошибка классификации: {e}")
+        return []
+    # Сортируем результаты по убыванию вероятности
+    sorted_results = sorted(zip(results['labels'], results['scores']), key=lambda x: x[1], reverse=True)
+    if show_all:
+        return sorted_results
+    else:
+        cumulative_prob = 0
+        filtered_results = []
+        for label, score in sorted_results:
+            filtered_results.append((label, score))
+            cumulative_prob += score
+            if cumulative_prob >= threshold:
+                break
+        return filtered_results
+# --- Интерфейс Streamlit ---
+st.title("Классификация статей")
+# Ввод данных
+title = st.text_input("Заголовок статьи")
+description = st.text_area("Краткое описание статьи", height=150)
+# Ввод меток-кандидатов (разделенных запятыми)
+default_labels = "политика, экономика, спорт, культура, технологии, наука, происшествия"
+candidate_labels_str = st.text_input("Метки-кандидаты (через запятую)", default_labels)
+candidate_labels = [label.strip() for label in candidate_labels_str.split(",") if label.strip()]
+# Кнопка "Классифицировать"
+if st.button("Классифицировать"):
+    if not title or not description or not candidate_labels:
+        st.warning("Пожалуйста, заполните все поля.")
+    else:
+        with st.spinner("Идет классификация..."):  # Индикатор загрузки
+            results = classify_text(title, description, candidate_labels)
+            if results:
+              st.subheader("Результаты классификации (с ограничением по вероятности):")
+              for label, score in results:
+                  st.write(f"- **{label}**: {score:.4f}")
+              # Кнопка "Показать все"
+              if st.button("Показать все категории"):
+                  all_results = classify_text(title, description, candidate_labels, show_all=True)
+                  st.subheader("Полные результаты классификации:")
+                  for label, score in all_results:
+                      st.write(f"- **{label}**: {score:.4f}")
+            else:
+                st.info("Не удалось получить результаты классификации.")
+elif title or description or candidate_labels_str != default_labels: #небольшой костыль, чтобы при старте не было предупреждения
+    st.warning("Пожалуйста, заполните все поля.")