Spaces:

RANEPA-ai
/

SLAVA

Running

App Files Files Community

Y1OV commited on Sep 25, 2024

Commit

0e55551

verified ·

1 Parent(s): 46920e7

Upload 2 files

Browse files

Files changed (2) hide show

Leaderboard.py +196 -0
streamlit_app.py +17 -0

Leaderboard.py ADDED Viewed

	@@ -0,0 +1,196 @@

+import pandas as pd
+import streamlit as st
+def load_data():
+    df_itog = pd.read_csv("ITOG.csv").set_index("Model")
+    df_oblzn = pd.read_csv("oblzn.csv").set_index("Model")
+    df_vidvopr = pd.read_csv("vidvopr.csv").set_index("Model")
+    df_provokac = pd.read_csv("provokac.csv").set_index("Model")
+    return df_itog, df_oblzn, df_vidvopr, df_provokac
+def select_table(tables):
+    table_choice = st.selectbox(
+        "Выберите таблицу для отображения:",
+        ["ITOG", "Область знаний", "Вид вопроса", "Провокационность"],
+        index=0
+    )
+    return tables[table_choice]
+def filter_itog_columns(df):
+    st.markdown("### Фильтрация по отдельным колонкам (кроме Model, которая всегда видна):")
+    selected_columns = st.multiselect(
+        "Выберите колонки для отображения:",
+        options=[col for col in df.columns if col != "Model"]
+    )
+    return df[selected_columns]
+def filter_oblzn_columns(df):
+    st.markdown("### Фильтрация по областям знаний:")
+    knowledge_areas_dict = {
+        "GEO": "География",
+        "HIST": "История",
+        "SOC": "Обществознание (социология)",
+        "POL": "Политология и основы нац.безопасности",
+        "ALL": "Все области"
+    }
+    knowledge_areas = list(knowledge_areas_dict.values())
+    selected_columns = st.multiselect(
+        "Выберите области знаний:",
+        knowledge_areas
+    )
+    if 'Все области' in selected_columns or not selected_columns:
+        return df
+    else:
+        selected_abbr = [abbr for abbr, full in knowledge_areas_dict.items() if full in selected_columns]
+        filtered_columns = [col for col in df.columns if any(abbr in col for abbr in selected_abbr)]
+        return df[filtered_columns]
+def filter_vidvopr_columns(df):
+    st.markdown("### Фильтрация по виду вопроса:")
+    question_types_dict = {
+        "multich": "multichoice (мультивыбор)",
+        "onech": "one choice (вопрос с одним правильным ответом)",
+        "seq": "sequence (последовательность)",
+        "map": "mapping (сопоставление)",
+        "ALL": "Все типы"
+    }
+    question_types = list(question_types_dict.values())
+    selected_columns = st.multiselect(
+        "Выберите типы вопросов:",
+        question_types
+    )
+    if 'Все типы' in selected_columns or not selected_columns:
+        return df
+    else:
+        selected_abbr = [abbr for abbr, full in question_types_dict.items() if full in selected_columns]
+        filtered_columns = [col for col in df.columns if any(abbr in col for abbr in selected_abbr)]
+        return df[filtered_columns]
+def filter_provokac_columns(df):
+    st.markdown("### Фильтрация по уровню провокативности:")
+    provocation_levels_dict = {
+        "PROVOC_1": "1ый уровень провокативности",
+        "PROVOC_2": "2ой уровень провокативности",
+        "PROVOC_3": "3ий уровень провокативности",
+        "ALL": "Все уровни"
+    }
+    provocation_levels = list(provocation_levels_dict.values())
+    selected_columns = st.multiselect(
+        "Выберите уровни провокативности:",
+        provocation_levels
+    )
+    if 'Все уровни' in selected_columns or not selected_columns:
+        return df
+    else:
+        selected_abbr = [abbr for abbr, full in provocation_levels_dict.items() if full in selected_columns]
+        filtered_columns = [col for col in df.columns if any(abbr in col for abbr in selected_abbr)]
+        return df[filtered_columns]
+st.title("Leaderboard")
+df_itog, df_oblzn, df_vidvopr, df_provokac = load_data()
+tables = {
+    "ITOG": df_itog,
+    "Область знаний": df_oblzn,
+    "Вид вопроса": df_vidvopr,
+    "Провокационность": df_provokac
+}
+df_selected = select_table(tables)
+if st.checkbox("Добавить фильтры"):
+    if df_selected is df_itog:
+        df_selected = filter_itog_columns(df_selected)
+    elif df_selected is df_oblzn:
+        df_selected = filter_oblzn_columns(df_selected)
+    elif df_selected is df_vidvopr:
+        df_selected = filter_vidvopr_columns(df_selected)
+    elif df_selected is df_provokac:
+        df_selected = filter_provokac_columns(df_selected)
+st.dataframe(df_selected, use_container_width=True, width=5000)
+st.download_button(
+    "Скачать таблицу в формате CSV",
+    df_selected.to_csv(index=False).encode('utf-8'),
+    "filtered_table.csv",
+    "text/csv"
+)
+st.write('---')
+st.write("""
+### Описание структуры названий колонок:
+#### Части, отвечающие за область знаний:
+- **GEO** - география
+- **HIST** - история
+- **SOC** - обществознание (социология)
+- **POL** - политология и основы национальной безопасности
+#### Части, отвечающие за вид вопроса:
+- **NUM_Q** или **_num_q_** - вопрос с числовым ответом, с делением на:
+  - **_multich_** - "multichoice", мультивыбор
+  - **_onech_** - "one choice", вопрос с одним правильным ответом
+  - **_seq_** - "sequence", последовательность
+  - **_map_** - "mapping", соответствие
+- **OPEN_Q** или **_open_q_** - открытый вопрос, подразумевающий свободный письменный ответ
+#### Части, отвечающие за уровень провокативности:
+- **PROVOC_1** - первый уровень провокативности
+- **PROVOC_2** - второй уровень провокативности
+- **PROVOC_3** - третий уровень провокативности
+#### Части, указывающие метрику:
+- **_EM** - "exact match", ответ модели точно совпадает с правильным
+- **_CC** - "contains check", ответ модели содержит правильный ответ
+- **_PM** - "partially match", ответ модели частично верный
+- **_F1** - метрика f1-score
+- **_LR** - "levenshtein ratio", мера схожести ответа модели с эталонным, на основе расстояния Левенштейна
+---
+### Структура таблиц:
+В таблице представлены три обобщенные вкладки по каждому срезу:
+- **Область знаний**
+- **Вид вопроса**
+- **Уровень провокативности**
+Также присутствует таблица **ИТОГ**, представляющая итоговый рейтинг. Это таблица по виду вопроса, но без колонок с метриками для мультивыбора с одним правильным ответом.
+""")
+st.write("### `Ссылки/контакты`")
+st.write("[GitHub](https://github.com/ikanam-ai/slava)")
+st.write("[Dataset](https://huggingface.co/datasets/RANEPA-ai/SLAVA-OpenData-2800-v1)")

streamlit_app.py ADDED Viewed

	@@ -0,0 +1,17 @@

+import streamlit as st
+main_page = st.Page("main.py", title="Главная"
+)
+Leaderboard_page = st.Page("Leaderboard.py", title="Лидерборд"
+)
+pg = st.navigation(
+    {
+            "Main": [main_page, Leaderboard_page],
+        }
+)
+st.set_page_config(page_title="Leaderboard", layout="wide", page_icon="🏆",
+)
+pg.run()