Spaces:
Running
Running
Update README.md
Browse files
README.md
CHANGED
@@ -1,21 +1,29 @@
|
|
1 |
---
|
2 |
-
title:
|
3 |
-
emoji:
|
4 |
colorFrom: purple
|
5 |
colorTo: green
|
6 |
sdk: gradio
|
7 |
sdk_version: 5.31.0
|
8 |
app_file: app.py
|
9 |
pinned: false
|
10 |
-
license:
|
11 |
-
short_description: Convert audio recording to text file by AI
|
12 |
---
|
13 |
|
14 |
# Türkçe Pediatrik Konuşma Tanıma Sistemi
|
15 |
|
16 |
-
Bu sistem, çocuk doktorlarının vizite sırasındaki konuşmaları otomatik olarak transkribe eder ve konuşmacıları ayırır.
|
17 |
|
18 |
-
##
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
19 |
|
20 |
1. Ses dosyasını yükleyin (.wav formatında)
|
21 |
2. İsterseniz özellikleri kapatabilirsiniz:
|
@@ -23,26 +31,41 @@ Bu sistem, çocuk doktorlarının vizite sırasındaki konuşmaları otomatik ol
|
|
23 |
- Ses İyileştirme
|
24 |
- Kişisel Verileri Anonimleştirme
|
25 |
3. "Transkribe Et" düğmesine tıklayın
|
26 |
-
4. Sonuçları JSON formatında görüntüleyin
|
27 |
|
28 |
-
## Gereksinimler
|
29 |
|
30 |
- HuggingFace hesabı (pyannote.audio modeli için)
|
31 |
- HF_TOKEN ayarlanmalı
|
|
|
32 |
|
33 |
-
## Sınırlamalar
|
34 |
|
35 |
- 25MB'a kadar ses dosyaları işlenebilir
|
36 |
- WAV formatı tercih edilir
|
37 |
- İşlem süresi dosya büyüklüğüne göre değişir
|
|
|
38 |
|
39 |
-
##
|
40 |
|
41 |
Bu uygulama, yalnızca araştırma ve eğitim amaçlıdır. Gerçek hasta verileriyle kullanım için tasarlanmamıştır.
|
42 |
|
43 |
-
- Kullanıcılar, kişisel sağlık bilgilerini içeren ses dosyalarını yüklememelidir
|
44 |
-
- Platformda paylaşılan veriler Hugging Face sunucularında geçici olarak depolanabilir
|
45 |
-
- Ses dosyalarının tamamen güvenli ve gizli kaldığı garanti edilemez
|
46 |
-
- Pediatrik konuşma kayıtları hassas bilgiler içerebileceğinden, yalnızca test amaçlı yapay/kurgu konuşmalar kullanılmalıdır
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
47 |
|
48 |
-
|
|
|
1 |
---
|
2 |
+
title: Türkçe Pediatrik Transkripsiyon API
|
3 |
+
emoji: 🏥
|
4 |
colorFrom: purple
|
5 |
colorTo: green
|
6 |
sdk: gradio
|
7 |
sdk_version: 5.31.0
|
8 |
app_file: app.py
|
9 |
pinned: false
|
10 |
+
license: mit
|
|
|
11 |
---
|
12 |
|
13 |
# Türkçe Pediatrik Konuşma Tanıma Sistemi
|
14 |
|
15 |
+
Bu sistem, çocuk doktorlarının vizite sırasındaki konuşmaları otomatik olarak transkribe eder ve konuşmacıları ayırır. Özellikle pediatri alanındaki tıbbi terminolojiyi doğru şekilde tanıyacak şekilde optimize edilmiştir.
|
16 |
|
17 |
+
## 🚀 Özellikler
|
18 |
+
|
19 |
+
- 🎯 Türkçe ses tanıma
|
20 |
+
- 👥 Konuşmacı ayrımı (diyarizasyon)
|
21 |
+
- 🎧 Otomatik ses iyileştirme
|
22 |
+
- 🔒 Kişisel veri anonimleştirme
|
23 |
+
- 📝 Tıbbi terim düzeltme
|
24 |
+
- 🏥 Pediatri alanına özel optimizasyon
|
25 |
+
|
26 |
+
## 💻 Kullanım
|
27 |
|
28 |
1. Ses dosyasını yükleyin (.wav formatında)
|
29 |
2. İsterseniz özellikleri kapatabilirsiniz:
|
|
|
31 |
- Ses İyileştirme
|
32 |
- Kişisel Verileri Anonimleştirme
|
33 |
3. "Transkribe Et" düğmesine tıklayın
|
34 |
+
4. Sonuçları hem metin hem de JSON formatında görüntüleyin
|
35 |
|
36 |
+
## 📋 Gereksinimler
|
37 |
|
38 |
- HuggingFace hesabı (pyannote.audio modeli için)
|
39 |
- HF_TOKEN ayarlanmalı
|
40 |
+
- GPU önerilir (daha hızlı işlem için)
|
41 |
|
42 |
+
## ⚠️ Sınırlamalar
|
43 |
|
44 |
- 25MB'a kadar ses dosyaları işlenebilir
|
45 |
- WAV formatı tercih edilir
|
46 |
- İşlem süresi dosya büyüklüğüne göre değişir
|
47 |
+
- GPU olmadan işlem süresi uzayabilir
|
48 |
|
49 |
+
## 🔒 Yasal Uyarı ve Gizlilik Bildirimi
|
50 |
|
51 |
Bu uygulama, yalnızca araştırma ve eğitim amaçlıdır. Gerçek hasta verileriyle kullanım için tasarlanmamıştır.
|
52 |
|
53 |
+
- Kullanıcılar, kişisel sağlık bilgilerini içeren ses dosyalarını yüklememelidir
|
54 |
+
- Platformda paylaşılan veriler Hugging Face sunucularında geçici olarak depolanabilir
|
55 |
+
- Ses dosyalarının tamamen güvenli ve gizli kaldığı garanti edilemez
|
56 |
+
- Pediatrik konuşma kayıtları hassas bilgiler içerebileceğinden, yalnızca test amaçlı yapay/kurgu konuşmalar kullanılmalıdır
|
57 |
+
|
58 |
+
## 📚 Teknik Detaylar
|
59 |
+
|
60 |
+
- OpenAI Whisper large-v3 modeli kullanılmaktadır
|
61 |
+
- Pyannote.audio ile konuşmacı ayrımı yapılmaktadır
|
62 |
+
- SpaCy ile Türkçe dil işleme yapılmaktadır
|
63 |
+
- Gradio 4.19.2 ile kullanıcı arayüzü sağlanmaktadır
|
64 |
+
|
65 |
+
## ⚖️ Yasal Uyarı
|
66 |
+
|
67 |
+
Bu aracı klinik ortamlarda kullanmadan önce, yerel veri koruma yasalarınıza (HIPAA, GDPR, KVKK vb.) uygun şekilde kendi sunucunuzda barındırmanız önerilir.
|
68 |
+
|
69 |
+
## 📞 İletişim ve Destek
|
70 |
|
71 |
+
Sorun bildirimleri ve öneriler için GitHub üzerinden issue açabilirsiniz.
|