Add SetFit model
Browse files- README.md +33 -32
- model.safetensors +1 -1
- model_head.pkl +2 -2
README.md
CHANGED
@@ -5,11 +5,11 @@ tags:
|
|
5 |
- text-classification
|
6 |
- generated_from_setfit_trainer
|
7 |
widget:
|
8 |
-
- text:
|
9 |
-
- text:
|
10 |
-
- text:
|
11 |
-
- text:
|
12 |
-
- text:
|
13 |
metrics:
|
14 |
- accuracy
|
15 |
pipeline_tag: text-classification
|
@@ -28,7 +28,7 @@ model-index:
|
|
28 |
split: test
|
29 |
metrics:
|
30 |
- type: accuracy
|
31 |
-
value: 0
|
32 |
name: Accuracy
|
33 |
---
|
34 |
|
@@ -48,7 +48,7 @@ The model has been trained using an efficient few-shot learning technique that i
|
|
48 |
- **Sentence Transformer body:** [cointegrated/rubert-tiny2](https://huggingface.co/cointegrated/rubert-tiny2)
|
49 |
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
|
50 |
- **Maximum Sequence Length:** 2048 tokens
|
51 |
-
- **Number of Classes:**
|
52 |
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
|
53 |
<!-- - **Language:** Unknown -->
|
54 |
<!-- - **License:** Unknown -->
|
@@ -60,23 +60,22 @@ The model has been trained using an efficient few-shot learning technique that i
|
|
60 |
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
|
61 |
|
62 |
### Model Labels
|
63 |
-
| Label | Examples
|
64 |
-
|
65 |
-
|
|
66 |
-
|
|
67 |
-
| 1 | <ul><li>'
|
68 |
-
| 0 | <ul><li>'
|
69 |
-
| 4 | <ul><li>'
|
70 |
-
|
|
71 |
-
| 5 | <ul><li>'
|
72 |
-
| 3 | <ul><li>'На сколько направлений подготовки можно подать документы?'</li><li>'На сколько специальностей можно подать документы?'</li></ul> |
|
73 |
|
74 |
## Evaluation
|
75 |
|
76 |
### Metrics
|
77 |
| Label | Accuracy |
|
78 |
|:--------|:---------|
|
79 |
-
| **all** | 0
|
80 |
|
81 |
## Uses
|
82 |
|
@@ -96,7 +95,7 @@ from setfit import SetFitModel
|
|
96 |
# Download from the 🤗 Hub
|
97 |
model = SetFitModel.from_pretrained("Maxim01/Intent_Classification_Test")
|
98 |
# Run inference
|
99 |
-
preds = model("
|
100 |
```
|
101 |
|
102 |
<!--
|
@@ -128,18 +127,17 @@ preds = model("Приемная кампания")
|
|
128 |
### Training Set Metrics
|
129 |
| Training set | Min | Median | Max |
|
130 |
|:-------------|:----|:-------|:----|
|
131 |
-
| Word count |
|
132 |
|
133 |
| Label | Training Sample Count |
|
134 |
|:------|:----------------------|
|
135 |
-
| 0 |
|
136 |
-
| 1 |
|
137 |
-
| 2 |
|
138 |
-
| 3 |
|
139 |
-
| 4 |
|
140 |
-
| 5 |
|
141 |
-
| 6 |
|
142 |
-
| 7 | 5 |
|
143 |
|
144 |
### Training Hyperparameters
|
145 |
- batch_size: (8, 8)
|
@@ -163,10 +161,13 @@ preds = model("Приемная кампания")
|
|
163 |
### Training Results
|
164 |
| Epoch | Step | Training Loss | Validation Loss |
|
165 |
|:------:|:----:|:-------------:|:---------------:|
|
166 |
-
| 0.
|
167 |
-
| 0.
|
168 |
-
| 0.
|
169 |
-
| 0.
|
|
|
|
|
|
|
170 |
|
171 |
### Framework Versions
|
172 |
- Python: 3.11.12
|
|
|
5 |
- text-classification
|
6 |
- generated_from_setfit_trainer
|
7 |
widget:
|
8 |
+
- text: Военная кафедра
|
9 |
+
- text: Какие льготы есть у выпускников колледжа?
|
10 |
+
- text: Какие этапы включает приемная кампания?
|
11 |
+
- text: Сколько продлится приемная кампания
|
12 |
+
- text: Какие требования для поступления в ВУЦ?
|
13 |
metrics:
|
14 |
- accuracy
|
15 |
pipeline_tag: text-classification
|
|
|
28 |
split: test
|
29 |
metrics:
|
30 |
- type: accuracy
|
31 |
+
value: 1.0
|
32 |
name: Accuracy
|
33 |
---
|
34 |
|
|
|
48 |
- **Sentence Transformer body:** [cointegrated/rubert-tiny2](https://huggingface.co/cointegrated/rubert-tiny2)
|
49 |
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
|
50 |
- **Maximum Sequence Length:** 2048 tokens
|
51 |
+
- **Number of Classes:** 7 classes
|
52 |
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
|
53 |
<!-- - **Language:** Unknown -->
|
54 |
<!-- - **License:** Unknown -->
|
|
|
60 |
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
|
61 |
|
62 |
### Model Labels
|
63 |
+
| Label | Examples |
|
64 |
+
|:------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
65 |
+
| 3 | <ul><li>'Есть ли военная кафедра'</li><li>'Какие документы нужны для поступления в ВУЦ?'</li><li>'Как проходит отбор на военную кафедру'</li></ul> |
|
66 |
+
| 2 | <ul><li>'Как подтвердить свои достижения?'</li><li>'Расскажи о дополнительных баллах при поступлении'</li><li>'Можно ли получить баллы за волонтерскую деятельность?'</li></ul> |
|
67 |
+
| 1 | <ul><li>'Нужно ли заверять копии документов?'</li><li>'Как узнать, что мои документы приняты?'</li><li>'Можно ли подать документы по почте?'</li></ul> |
|
68 |
+
| 0 | <ul><li>'Как долго длится приемная кампания'</li><li>'Продолжительность приемной кампании'</li><li>'Когда заканчивается приемная кампания?'</li></ul> |
|
69 |
+
| 4 | <ul><li>'Какие документы нужны для поступления после колледжа?'</li><li>'Как поступить в Вуз после колледжа'</li><li>'Какие сроки подачи документов после колледжа?'</li></ul> |
|
70 |
+
| 6 | <ul><li>'Как подать заявление на общежитие?'</li><li>'Кто претендует на предоставление общежития'</li><li>'Как оплачивать проживание в общежитии?'</li></ul> |
|
71 |
+
| 5 | <ul><li>'Какие ошибки чаще всего допускают на экзаменах?'</li><li>'Какие вступительные испытания нужно сдавать?'</li><li>'Как подготовиться к вступительным экзаменам?'</li></ul> |
|
|
|
72 |
|
73 |
## Evaluation
|
74 |
|
75 |
### Metrics
|
76 |
| Label | Accuracy |
|
77 |
|:--------|:---------|
|
78 |
+
| **all** | 1.0 |
|
79 |
|
80 |
## Uses
|
81 |
|
|
|
95 |
# Download from the 🤗 Hub
|
96 |
model = SetFitModel.from_pretrained("Maxim01/Intent_Classification_Test")
|
97 |
# Run inference
|
98 |
+
preds = model("Военная кафедра")
|
99 |
```
|
100 |
|
101 |
<!--
|
|
|
127 |
### Training Set Metrics
|
128 |
| Training set | Min | Median | Max |
|
129 |
|:-------------|:----|:-------|:----|
|
130 |
+
| Word count | 2 | 5.3333 | 8 |
|
131 |
|
132 |
| Label | Training Sample Count |
|
133 |
|:------|:----------------------|
|
134 |
+
| 0 | 9 |
|
135 |
+
| 1 | 11 |
|
136 |
+
| 2 | 6 |
|
137 |
+
| 3 | 9 |
|
138 |
+
| 4 | 10 |
|
139 |
+
| 5 | 11 |
|
140 |
+
| 6 | 10 |
|
|
|
141 |
|
142 |
### Training Hyperparameters
|
143 |
- batch_size: (8, 8)
|
|
|
161 |
### Training Results
|
162 |
| Epoch | Step | Training Loss | Validation Loss |
|
163 |
|:------:|:----:|:-------------:|:---------------:|
|
164 |
+
| 0.0030 | 1 | 0.1199 | - |
|
165 |
+
| 0.1515 | 50 | 0.1727 | - |
|
166 |
+
| 0.3030 | 100 | 0.0936 | - |
|
167 |
+
| 0.4545 | 150 | 0.0599 | - |
|
168 |
+
| 0.6061 | 200 | 0.0529 | - |
|
169 |
+
| 0.7576 | 250 | 0.0436 | - |
|
170 |
+
| 0.9091 | 300 | 0.0359 | - |
|
171 |
|
172 |
### Framework Versions
|
173 |
- Python: 3.11.12
|
model.safetensors
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
size 116781184
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:d271a20b8e11544b7421a9d88d8fec1b708e883606980c872708a9f418d5bd18
|
3 |
size 116781184
|
model_head.pkl
CHANGED
@@ -1,3 +1,3 @@
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
-
oid sha256:
|
3 |
-
size
|
|
|
1 |
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:7b75e9934daa33dc331b30ae219a0a29096ddb1861635a87caa4e0092c9be5ae
|
3 |
+
size 18431
|