Maxim01 commited on
Commit
55e4990
·
verified ·
1 Parent(s): 26a4334

Add SetFit model

Browse files
Files changed (3) hide show
  1. README.md +33 -32
  2. model.safetensors +1 -1
  3. model_head.pkl +2 -2
README.md CHANGED
@@ -5,11 +5,11 @@ tags:
5
  - text-classification
6
  - generated_from_setfit_trainer
7
  widget:
8
- - text: Кто претендует на предоставление общежития
9
- - text: На сколько специальностей можно подать документы?
10
- - text: Направления подготовки в вуцНа каком курсе начинается Военная кафедра
11
- - text: Приемная кампания
12
- - text: Я после колледжа. Как мне поступить?
13
  metrics:
14
  - accuracy
15
  pipeline_tag: text-classification
@@ -28,7 +28,7 @@ model-index:
28
  split: test
29
  metrics:
30
  - type: accuracy
31
- value: 0.8
32
  name: Accuracy
33
  ---
34
 
@@ -48,7 +48,7 @@ The model has been trained using an efficient few-shot learning technique that i
48
  - **Sentence Transformer body:** [cointegrated/rubert-tiny2](https://huggingface.co/cointegrated/rubert-tiny2)
49
  - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
50
  - **Maximum Sequence Length:** 2048 tokens
51
- - **Number of Classes:** 8 classes
52
  <!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
53
  <!-- - **Language:** Unknown -->
54
  <!-- - **License:** Unknown -->
@@ -60,23 +60,22 @@ The model has been trained using an efficient few-shot learning technique that i
60
  - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
61
 
62
  ### Model Labels
63
- | Label | Examples |
64
- |:------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
65
- | 2 | <ul><li>'Как получить дополнительные баллы для поступленияКак получить дополнительные баллы'</li><li>'Как получить доп баллы'</li><li>'Расскажи о допполнительных баллах при поступлении'</li></ul> |
66
- | 6 | <ul><li>'Какие есть вступительные испытания?'</li><li>'Внутренние экзамены для поступления'</li><li>'Экзамены для поступления'</li></ul> |
67
- | 1 | <ul><li>'Какие документы нужны для поступления'</li><li>'Необходимые документы для поступления'</li><li>'Документы на поступление каким способом подать можно?'</li></ul> |
68
- | 0 | <ul><li>'Приемная кампания в вузе'</li><li>'Как долго длится приемная кампания'</li><li>'Длительность приемной кампании'</li></ul> |
69
- | 4 | <ul><li>'Военный учебный центр'</li><li>'Программы подготовки в ВУЦ'</li><li>'Как поступить на военную кафедру'</li></ul> |
70
- | 7 | <ul><li>'Кто может жить в общежитии?'</li><li>'Как попасть в общагу?Как попасть в общежитии?'</li><li>'Кто может жить в общаге?'</li></ul> |
71
- | 5 | <ul><li>'Как поступить в вуз после колледжа?'</li><li>'Как поступить в Вуз после колледжа'</li><li>''</li></ul> |
72
- | 3 | <ul><li>'На сколько направлений подготовки можно подать документы?'</li><li>'На сколько специальностей можно подать документы?'</li></ul> |
73
 
74
  ## Evaluation
75
 
76
  ### Metrics
77
  | Label | Accuracy |
78
  |:--------|:---------|
79
- | **all** | 0.8 |
80
 
81
  ## Uses
82
 
@@ -96,7 +95,7 @@ from setfit import SetFitModel
96
  # Download from the 🤗 Hub
97
  model = SetFitModel.from_pretrained("Maxim01/Intent_Classification_Test")
98
  # Run inference
99
- preds = model("Приемная кампания")
100
  ```
101
 
102
  <!--
@@ -128,18 +127,17 @@ preds = model("Приемная кампания")
128
  ### Training Set Metrics
129
  | Training set | Min | Median | Max |
130
  |:-------------|:----|:-------|:----|
131
- | Word count | 1 | 4.4103 | 9 |
132
 
133
  | Label | Training Sample Count |
134
  |:------|:----------------------|
135
- | 0 | 6 |
136
- | 1 | 8 |
137
- | 2 | 5 |
138
- | 3 | 2 |
139
- | 4 | 5 |
140
- | 5 | 4 |
141
- | 6 | 4 |
142
- | 7 | 5 |
143
 
144
  ### Training Hyperparameters
145
  - batch_size: (8, 8)
@@ -163,10 +161,13 @@ preds = model("Приемная кампания")
163
  ### Training Results
164
  | Epoch | Step | Training Loss | Validation Loss |
165
  |:------:|:----:|:-------------:|:---------------:|
166
- | 0.0051 | 1 | 0.1228 | - |
167
- | 0.2564 | 50 | 0.1409 | - |
168
- | 0.5128 | 100 | 0.0783 | - |
169
- | 0.7692 | 150 | 0.0682 | - |
 
 
 
170
 
171
  ### Framework Versions
172
  - Python: 3.11.12
 
5
  - text-classification
6
  - generated_from_setfit_trainer
7
  widget:
8
+ - text: Военная кафедра
9
+ - text: Какие льготы есть у выпускников колледжа?
10
+ - text: Какие этапы включает приемная кампания?
11
+ - text: Сколько продлится приемная кампания
12
+ - text: Какие требования для поступления в ВУЦ?
13
  metrics:
14
  - accuracy
15
  pipeline_tag: text-classification
 
28
  split: test
29
  metrics:
30
  - type: accuracy
31
+ value: 1.0
32
  name: Accuracy
33
  ---
34
 
 
48
  - **Sentence Transformer body:** [cointegrated/rubert-tiny2](https://huggingface.co/cointegrated/rubert-tiny2)
49
  - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
50
  - **Maximum Sequence Length:** 2048 tokens
51
+ - **Number of Classes:** 7 classes
52
  <!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
53
  <!-- - **Language:** Unknown -->
54
  <!-- - **License:** Unknown -->
 
60
  - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
61
 
62
  ### Model Labels
63
+ | Label | Examples |
64
+ |:------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
65
+ | 3 | <ul><li>'Есть ли военная кафедра'</li><li>'Какие документы нужны для поступления в ВУЦ?'</li><li>'Как проходит отбор на военную кафедру'</li></ul> |
66
+ | 2 | <ul><li>'Как подтвердить свои достижения?'</li><li>'Расскажи о дополнительных баллах при поступлении'</li><li>'Можно ли получить баллы за волонтерскую деятельность?'</li></ul> |
67
+ | 1 | <ul><li>'Нужно ли заверять копии документов?'</li><li>'Как узнать, что мои документы приняты?'</li><li>'Можно ли подать документы по почте?'</li></ul> |
68
+ | 0 | <ul><li>'Как долго длится приемная кампания'</li><li>'Продолжительность приемной кампании'</li><li>'Когда заканчивается приемная кампания?'</li></ul> |
69
+ | 4 | <ul><li>'Какие документы нужны для поступления после колледжа?'</li><li>'Как поступить в Вуз после колледжа'</li><li>'Какие сроки подачи документов после колледжа?'</li></ul> |
70
+ | 6 | <ul><li>'Как подать заявление на общежитие?'</li><li>'Кто претендует на предоставление общежития'</li><li>'Как оплачивать проживание в общежитии?'</li></ul> |
71
+ | 5 | <ul><li>'Какие ошибки чаще всего допускают на экзаменах?'</li><li>'Какие вступительные испытания нужно сдавать?'</li><li>'Как подготовиться к вступительным экзаменам?'</li></ul> |
 
72
 
73
  ## Evaluation
74
 
75
  ### Metrics
76
  | Label | Accuracy |
77
  |:--------|:---------|
78
+ | **all** | 1.0 |
79
 
80
  ## Uses
81
 
 
95
  # Download from the 🤗 Hub
96
  model = SetFitModel.from_pretrained("Maxim01/Intent_Classification_Test")
97
  # Run inference
98
+ preds = model("Военная кафедра")
99
  ```
100
 
101
  <!--
 
127
  ### Training Set Metrics
128
  | Training set | Min | Median | Max |
129
  |:-------------|:----|:-------|:----|
130
+ | Word count | 2 | 5.3333 | 8 |
131
 
132
  | Label | Training Sample Count |
133
  |:------|:----------------------|
134
+ | 0 | 9 |
135
+ | 1 | 11 |
136
+ | 2 | 6 |
137
+ | 3 | 9 |
138
+ | 4 | 10 |
139
+ | 5 | 11 |
140
+ | 6 | 10 |
 
141
 
142
  ### Training Hyperparameters
143
  - batch_size: (8, 8)
 
161
  ### Training Results
162
  | Epoch | Step | Training Loss | Validation Loss |
163
  |:------:|:----:|:-------------:|:---------------:|
164
+ | 0.0030 | 1 | 0.1199 | - |
165
+ | 0.1515 | 50 | 0.1727 | - |
166
+ | 0.3030 | 100 | 0.0936 | - |
167
+ | 0.4545 | 150 | 0.0599 | - |
168
+ | 0.6061 | 200 | 0.0529 | - |
169
+ | 0.7576 | 250 | 0.0436 | - |
170
+ | 0.9091 | 300 | 0.0359 | - |
171
 
172
  ### Framework Versions
173
  - Python: 3.11.12
model.safetensors CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:78aa50db3e67e2f1daf54fa23af99a5a19ca75e60a5c93ec302490990b21a8a9
3
  size 116781184
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:d271a20b8e11544b7421a9d88d8fec1b708e883606980c872708a9f418d5bd18
3
  size 116781184
model_head.pkl CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:f4ab384aadb3f04c0bf18b03f949518d561c65e775b100ba9eb160ebff529a9d
3
- size 20935
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:7b75e9934daa33dc331b30ae219a0a29096ddb1861635a87caa4e0092c9be5ae
3
+ size 18431