Hamed744 commited on
Commit
1ddb4e8
·
verified ·
1 Parent(s): 89eadce

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +334 -308
app.py CHANGED
@@ -1,25 +1,26 @@
1
  import gradio as gr
2
- # import base64
3
  import mimetypes
4
  import os
5
  import re
6
  import struct
7
  import time
8
- # import zipfile
9
  from google import genai
10
- from google.genai import types as genai_types
11
-
12
- import logging
13
- logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
14
 
15
  try:
16
  from pydub import AudioSegment
17
  PYDUB_AVAILABLE = True
18
  except ImportError:
19
  PYDUB_AVAILABLE = False
20
- logging.warning("Pydub (for audio merging) not found. Merging will be disabled if multiple audio chunks are generated.")
21
 
22
- # --- START: YOUR EXACT CORE TTS LOGIC (AlphaTTS_Original) ---
 
 
 
 
23
  SPEAKER_VOICES = [
24
  "Achird", "Zubenelgenubi", "Vindemiatrix", "Sadachbia", "Sadaltager",
25
  "Sulafat", "Laomedeia", "Achernar", "Alnilam", "Schedar", "Gacrux",
@@ -27,14 +28,24 @@ SPEAKER_VOICES = [
27
  "Rasalthgeti", "Orus", "Aoede", "Callirrhoe", "Autonoe", "Enceladus",
28
  "Iapetus", "Zephyr", "Puck", "Charon", "Kore", "Fenrir", "Leda"
29
  ]
30
- FIXED_MODEL_NAME = "gemini-2.5-flash-preview-tts"
31
  DEFAULT_MAX_CHUNK_SIZE = 3800
32
  DEFAULT_SLEEP_BETWEEN_REQUESTS = 8
33
  DEFAULT_OUTPUT_FILENAME_BASE = "alpha_tts_audio"
34
 
35
- def _log(message, log_list):
 
 
 
 
 
 
 
 
 
 
 
36
  log_list.append(message)
37
- logging.info(f"[AlphaTTS_LOG_INTERNAL] {message}")
38
 
39
  def save_binary_file(file_name, data, log_list):
40
  try:
@@ -60,16 +71,16 @@ def parse_audio_mime_type(mime_type: str) -> dict[str, int]:
60
  param = param.strip()
61
  if param.lower().startswith("rate="):
62
  try: rate = int(param.split("=", 1)[1])
63
- except ValueError: pass
64
  elif param.startswith("audio/L"):
65
  try: bits = int(param.split("L", 1)[1])
66
- except ValueError: pass
67
  return {"bits_per_sample": bits, "rate": rate}
68
 
69
  def smart_text_split(text, max_size=3800, log_list=None):
70
  if len(text) <= max_size: return [text]
71
  chunks, current_chunk = [], ""
72
- sentences = re.split(r'(?<=[.!?؟۔])\s+', text)
73
  for sentence in sentences:
74
  if len(current_chunk) + len(sentence) + 1 > max_size:
75
  if current_chunk: chunks.append(current_chunk.strip())
@@ -85,24 +96,13 @@ def smart_text_split(text, max_size=3800, log_list=None):
85
  return final_chunks
86
 
87
  def merge_audio_files_func(file_paths, output_path, log_list):
88
- if not PYDUB_AVAILABLE: _log("❌ pydub در دسترس نیست.", log_list); return False
89
  try:
90
  _log(f"🔗 ادغام {len(file_paths)} فایل صوتی...", log_list)
91
  combined = AudioSegment.empty()
92
  for i, fp in enumerate(file_paths):
93
- if os.path.exists(fp):
94
- try:
95
- segment = AudioSegment.from_file(fp)
96
- combined += segment
97
- if i < len(file_paths) - 1:
98
- combined += AudioSegment.silent(duration=150)
99
- except Exception as e_pydub:
100
- _log(f"⚠️ خطای Pydub در پردازش فایل '{fp}': {e_pydub}. این فایل نادیده گرفته می شود.", log_list)
101
- continue
102
  else: _log(f"⚠️ فایل پیدا نشد: {fp}", log_list)
103
- if len(combined) == 0:
104
- _log("❌ هیچ قطعه صوتی معتبری برای ادغام یافت نشد.", log_list)
105
- return False
106
  combined.export(output_path, format="wav")
107
  _log(f"✅ فایل ادغام شده: {output_path}", log_list); return True
108
  except Exception as e: _log(f"❌ خطا در ادغام: {e}", log_list); return False
@@ -110,46 +110,48 @@ def merge_audio_files_func(file_paths, output_path, log_list):
110
  def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val, log_list):
111
  output_base_name = DEFAULT_OUTPUT_FILENAME_BASE
112
  max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
113
- _log(f"🚀 شروع فرآیند با مدل: {FIXED_MODEL_NAME}...", log_list)
114
- api_key = os.environ.get("GEMINI_API_KEY")
115
- if not api_key: _log("❌ کلید API تنظیم نشده.", log_list); return None
116
- try: client = genai.Client(api_key=api_key)
117
- except Exception as e: _log(f"❌ خطا در کلاینت: {e}", log_list); return None
118
- if not text_input or not text_input.strip(): _log("❌ متن ورودی خالی.", log_list); return None
 
 
 
 
 
 
 
 
119
  text_chunks = smart_text_split(text_input, max_chunk, log_list)
120
- if not text_chunks: _log("❌ متن قابل پردازش نیست.", log_list); return None
121
 
122
  generated_files = []
123
  for i, chunk in enumerate(text_chunks):
124
- _log(f"🔊 پردازش قطعه {i+1}/{len(text_chunks)} (صدا: {selected_voice}, دما: {temperature_val})...", log_list)
125
  final_text = f'"{prompt_input}"\n{chunk}' if prompt_input and prompt_input.strip() else chunk
126
- contents = [genai_types.Content(role="user", parts=[genai_types.Part.from_text(text=final_text)])]
127
- config = genai_types.GenerateContentConfig(temperature=temperature_val, response_modalities=["audio"],
128
- speech_config=genai_types.SpeechConfig(voice_config=genai_types.VoiceConfig(
129
- prebuilt_voice_config=genai_types.PrebuiltVoiceConfig(voice_name=selected_voice))))
130
  fname_base = f"{output_base_name}_part{i+1:03d}"
131
  try:
132
  response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
133
  if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
134
  inline_data = response.candidates[0].content.parts[0].inline_data
135
  data_buffer = inline_data.data
136
- mime_type = inline_data.mime_type
137
- _log(f"داده صوتی در candidate.part[0].inline_data برای قطعه {i+1} یافت شد. MIME: {mime_type}", log_list)
138
- ext = mimetypes.guess_extension(mime_type) or ".wav"
139
- if "audio/L" in mime_type and ext == ".wav":
140
- _log(f"تبدیل صدای خام PCM (MIME: {mime_type}) به WAV برای قطعه {i+1}.", log_list)
141
- data_buffer = convert_to_wav(data_buffer, mime_type)
142
  if not ext.startswith("."): ext = "." + ext
143
  fpath = save_binary_file(f"{fname_base}{ext}", data_buffer, log_list)
144
  if fpath: generated_files.append(fpath)
145
- else: _log(f"⚠️ پاسخ API برای قطعه {i+1} بدون داده صوتی.", log_list)
146
- except Exception as e: _log(f"❌ خطا در تولید قطعه {i+1}: {e}", log_list); continue
147
- if i < len(text_chunks) - 1 and len(text_chunks) > 1:
148
- _log(f"💤 توقف کوتاه ({sleep_time} ثانیه) قبل از قطعه بعدی...", log_list)
149
- time.sleep(sleep_time)
150
-
151
- if not generated_files: _log("❌ هیچ فایلی تولید نشد.", log_list); return None
152
- _log(f"🎉 {len(generated_files)} فایل(های) صوتی تولید شد.", log_list)
153
 
154
  final_audio_file = None
155
  final_output_path_base = f"{output_base_name}_final"
@@ -157,371 +159,395 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
157
  if len(generated_files) > 1:
158
  if PYDUB_AVAILABLE:
159
  merged_fn = f"{final_output_path_base}.wav"
160
- if os.path.exists(merged_fn):
161
- try: os.remove(merged_fn)
162
- except Exception as e_rm: _log(f"⚠️ خطا در حذف فایل ادغام شده قبلی '{merged_fn}': {e_rm}", log_list)
163
  if merge_audio_files_func(generated_files, merged_fn, log_list):
164
  final_audio_file = merged_fn
165
- for fp in generated_files:
166
- if os.path.abspath(fp) != os.path.abspath(merged_fn):
167
- try: os.remove(fp)
168
- except: pass
169
- else:
170
- if generated_files:
171
  try:
172
- source_path = generated_files[0]
173
- target_path = f"{final_output_path_base}{os.path.splitext(source_path)[1]}"
174
- if os.path.abspath(source_path) != os.path.abspath(target_path):
175
- if os.path.exists(target_path): os.remove(target_path)
176
- os.rename(source_path, target_path)
177
- final_audio_file = target_path
178
- if final_audio_file == target_path:
179
- for i_gf in range(1, len(generated_files)):
180
- try: os.remove(generated_files[i_gf])
181
- except: pass
182
- except Exception as e_rename:
183
- _log(f"خطا در تغییر نام فایل اولین قطعه: {e_rename}", log_list)
184
  final_audio_file = generated_files[0]
 
 
 
 
 
185
  else:
186
- _log("⚠️ pydub نیست. اولین قطعه ارائه می‌شود.", log_list)
187
  if generated_files:
188
  try:
189
- source_path = generated_files[0]
190
- target_path = f"{final_output_path_base}{os.path.splitext(source_path)[1]}"
191
- if os.path.abspath(source_path) != os.path.abspath(target_path):
192
- if os.path.exists(target_path): os.remove(target_path)
193
- os.rename(source_path, target_path)
194
- final_audio_file = target_path
195
- if final_audio_file == target_path:
196
- for i_gf in range(1, len(generated_files)):
197
- try: os.remove(generated_files[i_gf])
198
- except: pass
199
- except Exception as e_rename_single:
200
- _log(f"خطا در تغییر نام فایل اولین قطعه (بدون pydub): {e_rename_single}", log_list)
201
  final_audio_file = generated_files[0]
 
202
  elif len(generated_files) == 1:
203
  try:
204
- source_path = generated_files[0]
205
- target_path = f"{final_output_path_base}{os.path.splitext(source_path)[1]}"
206
- if os.path.abspath(source_path) != os.path.abspath(target_path):
207
- if os.path.exists(target_path): os.remove(target_path)
208
- os.rename(source_path, target_path)
209
- final_audio_file = target_path
210
  except Exception as e_rename_single_final:
211
  _log(f"خطا در تغییر نام فایل تکی نهایی: {e_rename_single_final}", log_list)
212
  final_audio_file = generated_files[0]
213
 
214
  if final_audio_file and not os.path.exists(final_audio_file):
215
- _log(f"⚠️ فایل نهایی '{final_audio_file}' وجود ندارد!", log_list)
216
- return None
217
- return final_audio_file
 
218
 
219
  def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_prompt, speaker_voice, temperature, progress=gr.Progress(track_tqdm=True)):
220
- logs = []
 
 
 
 
 
 
 
 
 
 
 
 
 
 
221
  actual_text = ""
222
  if use_file_input:
223
  if uploaded_file:
224
  try:
225
  with open(uploaded_file.name, 'r', encoding='utf-8') as f: actual_text = f.read().strip()
226
- if not actual_text: return None
227
- except Exception as e: _log(f"❌ خطا خواندن فایل: {e}", logs); return None
228
- else: return None
 
 
 
 
 
 
 
229
  else:
230
  actual_text = text_to_speak
231
- if not actual_text or not actual_text.strip(): return None
 
 
 
 
 
232
 
233
- final_path = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature, logs)
234
- # for log_entry in logs: print(log_entry)
235
- return final_path
236
- # --- END: YOUR EXACT CORE TTS LOGIC (AlphaTTS_Original) ---
 
 
 
 
 
 
 
 
237
 
238
 
239
- # --- START: Styling and UI (Applying AlphaTranslator_Styled look to YOUR UI structure) ---
240
  FLY_PRIMARY_COLOR_HEX = "#4F46E5"
241
  FLY_SECONDARY_COLOR_HEX = "#10B981"
242
- FLY_ACCENT_COLOR_HEX = "#D97706"
243
  FLY_TEXT_COLOR_HEX = "#1F2937"
244
  FLY_SUBTLE_TEXT_HEX = "#6B7280"
245
  FLY_LIGHT_BACKGROUND_HEX = "#F9FAFB"
246
  FLY_WHITE_HEX = "#FFFFFF"
247
  FLY_BORDER_COLOR_HEX = "#D1D5DB"
248
  FLY_INPUT_BG_HEX_SIMPLE = "#F3F4F6"
 
249
 
250
- app_theme_applied_styled = gr.themes.Base(
251
  font=[gr.themes.GoogleFont("Inter"), "system-ui", "sans-serif"],
252
  ).set(
253
  body_background_fill=FLY_LIGHT_BACKGROUND_HEX,
254
  )
255
 
256
- # Corrected CSS: Using string literals for elem_ids
257
- final_combined_css_v3 = f"""
258
  @import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;600;700;800&display=swap');
259
  @import url('https://fonts.googleapis.com/css2?family=Poppins:wght@400;500;600;700;800&display=swap');
260
  @import url('https://fonts.googleapis.com/css2?family=Inter:wght@400;500;600;700;800&display=swap');
261
-
262
  :root {{
263
- --fly-primary: {FLY_PRIMARY_COLOR_HEX};
264
- --fly-secondary: {FLY_SECONDARY_COLOR_HEX};
265
- --fly-accent: {FLY_ACCENT_COLOR_HEX};
266
- --fly-text-primary: {FLY_TEXT_COLOR_HEX};
267
- --fly-text-secondary: {FLY_SUBTLE_TEXT_HEX};
268
- --fly-bg-light: {FLY_LIGHT_BACKGROUND_HEX};
269
- --fly-bg-white: {FLY_WHITE_HEX};
270
- --fly-border-color: {FLY_BORDER_COLOR_HEX};
271
- --fly-input-bg-simple: {FLY_INPUT_BG_HEX_SIMPLE};
272
- --fly-primary-rgb: 79,70,229;
273
- --fly-accent-rgb: 217,119,6;
274
-
275
- --radius-sm: 0.375rem; --radius-md: 0.5rem; --radius-lg: 0.75rem; --radius-xl: 1rem;
276
  --shadow-lg: 0 10px 15px -3px rgba(0,0,0,0.1),0 4px 6px -4px rgba(0,0,0,0.1);
277
  --shadow-xl: 0 20px 25px -5px rgba(0,0,0,0.1),0 8px 10px -6px rgba(0,0,0,0.1);
278
-
279
- --font-global: 'Vazirmatn', 'Inter', 'Poppins', system-ui, sans-serif;
280
- --font-english: 'Poppins', 'Inter', system-ui, sans-serif;
281
-
282
- --app-button-bg-original: #2979FF;
283
- --radius-input-original: 8px;
284
- }}
285
-
286
- body {{
287
- font-family: var(--font-global);
288
- direction: rtl;
289
- background-color: var(--fly-bg-light) !important;
290
- color: var(--fly-text-primary);
291
- line-height: 1.7;
292
- font-size: 16px;
293
  }}
294
-
295
- .gradio-container {{
296
- max-width:100% !important; width:100% !important; min-height:100vh;
297
- margin:0 auto !important; padding:0 !important; border-radius:0 !important;
298
- box-shadow:none !important; background:linear-gradient(170deg, #E0F2FE 0%, #F3E8FF 100%) !important;
299
- display:flex; flex-direction:column;
300
- }}
301
-
302
- .app-header-alphatts-v2 {{
303
- text-align:center; padding:2.5rem 1rem; margin:0;
304
- background:linear-gradient(135deg, var(--fly-primary) 0%, var(--fly-secondary) 100%);
305
- color:var(--fly-bg-white); border-bottom-left-radius:var(--radius-xl);
306
- border-bottom-right-radius:var(--radius-xl); box-shadow:var(--shadow-lg);
307
- position:relative; overflow:hidden;
308
- }}
309
- .app-header-alphatts-v2::before {{
310
- content:''; position:absolute; top:-50px; right:-50px; width:150px; height:150px;
311
- background:rgba(255,255,255,0.1); border-radius:9999px;
312
- opacity:0.5; transform:rotate(45deg);
313
- }}
314
- .app-header-alphatts-v2 h1 {{
315
- font-size:2.25em !important; font-weight:800 !important; margin:0 0 0.5rem 0;
316
- font-family:var(--font-english); letter-spacing:-0.5px; text-shadow:0 2px 4px rgba(0,0,0,0.1);
317
- }}
318
- .app-header-alphatts-v2 p {{
319
- font-size:1em !important; margin-top:0.25rem; font-weight:400;
320
- color:rgba(255,255,255,0.85) !important;
321
- }}
322
-
323
- .main-content-area-alphatts-v2 {{
324
- flex-grow:1; padding:0.75rem; width:100%; margin:0 auto; box-sizing:border-box;
325
  }}
326
- .content-panel-alphatts-v2 {{
327
- background-color:var(--fly-bg-white); padding:1rem; border-radius:var(--radius-xl);
328
- box-shadow:var(--shadow-xl); margin-top:-2rem; position:relative; z-index:10;
329
- margin-bottom:2rem; width:100%; box-sizing:border-box;
330
  }}
331
 
332
- /* Styling YOUR UI elements using their elem_ids */
333
- .content-panel-alphatts-v2 #text_input_main_alpha_v3 textarea, /* Textbox for text_to_speak_tb */
334
- .content-panel-alphatts-v2 #speech_prompt_alpha_v3 textarea, /* Textbox for speech_prompt_tb */
335
- .content-panel-alphatts-v2 #speaker_voice_alpha_v3 input, /* Dropdown input */
336
- .content-panel-alphatts-v2 #speaker_voice_alpha_v3 select, /* Dropdown select */
337
- .content-panel-alphatts-v2 #file_uploader_alpha_main_v3 .upload-button, /* File input button part */
338
- .content-panel-alphatts-v2 #temperature_slider_alpha_v3 input[type="range"]
339
  {{
340
- border-radius:var(--radius-input-original) !important;
341
- border:1.5px solid var(--fly-border-color) !important;
342
- font-size:0.95em !important;
343
- background-color:var(--fly-input-bg-simple) !important;
344
- padding:10px 12px !important;
345
- color:var(--fly-text-primary) !important;
346
- box-shadow: none !important;
347
  }}
 
348
 
349
- /* Focus styles for inputs by elem_id */
350
- .content-panel-alphatts-v2 #text_input_main_alpha_v3 textarea:focus,
351
- .content-panel-alphatts-v2 #speech_prompt_alpha_v3 textarea:focus,
352
- .content-panel-alphatts-v2 #speaker_voice_alpha_v3 input:focus,
353
- .content-panel-alphatts-v2 #speaker_voice_alpha_v3 select:focus,
354
- .content-panel-alphatts-v2 #file_uploader_alpha_main_v3 .upload-button:focus-within
355
  {{
356
  border-color:var(--fly-primary) !important;
357
  box-shadow:0 0 0 3px rgba(var(--fly-primary-rgb),0.12) !important;
358
  background-color:var(--fly-bg-white) !important;
359
  }}
360
- .content-panel-alphatts-v2 #file_uploader_alpha_main_v3 .upload-button {{ text-align:center; border-style: dashed !important; }} /* If file input has a button class */
361
- .content-panel-alphatts-v2 #file_uploader_alpha_main_v3 > div {{ text-align:center; border-style: dashed !important; border-radius:var(--radius-input-original) !important; border-width: 1.5px !important; border-color: var(--fly-border-color) !important; background-color:var(--fly-input-bg-simple) !important; padding: 10px 12px !important; }} /* General file div */
362
-
363
-
364
- /* Button: Targeting YOUR button by its elem_id */
365
- .content-panel-alphatts-v2 .gr-button#generate_button_alpha_v3
366
- {{
367
- background:var(--fly-accent) !important;
368
- margin-top:1.5rem !important; padding:12px 20px !important;
369
- transition:all 0.25s ease-in-out !important; color:white !important; font-weight:600 !important;
370
- border-radius:var(--radius-input-original) !important; border:none !important;
371
- box-shadow:0 3px 8px -1px rgba(var(--fly-accent-rgb),0.3) !important;
372
- width:100% !important; font-size:1.05em !important;
373
- display:flex; align-items:center; justify-content:center;
374
- }}
375
- .content-panel-alphatts-v2 .gr-button#generate_button_alpha_v3:hover
376
- {{
377
- background:#B45309 !important; transform:translateY(-1px) !important;
378
- box-shadow:0 5px 10px -1px rgba(var(--fly-accent-rgb),0.4) !important;
379
  }}
380
 
381
- /* Labels */
382
- .content-panel-alphatts-v2 .gr-form label > .label-text span,
383
- .content-panel-alphatts-v2 .gr-form .gr-input-label > label > .label-text span /* More specific for Gradio 3.x+ labels */
384
  {{
385
- font-weight:500 !important; color: var(--fly-text-secondary) !important;
386
- font-size:0.88em !important; margin-bottom:6px !important; display:inline-block;
 
387
  }}
388
- .content-panel-alphatts-v2 .temp_description_class_alpha_v3 {{
389
- font-size: 0.85em; color: var(--fly-text-secondary); margin-top: -0.4rem; margin-bottom: 1rem;
 
 
 
 
 
 
 
 
 
390
  }}
391
-
392
- .content-panel-alphatts-v2 #output_audio_player_alpha_v3 audio
393
- {{
394
- width: 100%; border-radius: var(--radius-input-original); margin-top:0.8rem;
 
 
 
 
395
  }}
396
 
397
- .content-panel-alphatts-v2 .gr-examples .gr-button.gr-button-tool,
398
- .content-panel-alphatts-v2 .gr-examples .gr-sample-button
399
- {{
400
- background-color:#E0E7FF !important; color:var(--fly-primary) !important;
401
- border-radius:var(--radius-sm) !important; font-size:0.78em !important; padding:4px 8px !important;
402
- }}
403
- .content-panel-alphatts-v2 .custom-hr {{height:1px;background-color:var(--fly-border-color);margin:1.5rem 0;border:none;}}
404
 
405
- .app-footer-alphatts-v2 {{
406
- text-align:center;font-size:0.85em;color:var(--fly-text-secondary);margin-top:2.5rem;
407
- padding:1rem 0;background-color:rgba(255,255,255,0.3);backdrop-filter:blur(5px);
408
- border-top:1px solid var(--fly-border-color);
409
- }}
410
- footer, .gradio-footer, .flagging-container, .footer-utils {{
411
- display:none !important; visibility:hidden !important;
412
- }}
413
 
414
  @media (min-width:640px) {{
415
- .main-content-area-alphatts-v2 {{padding:1.5rem;max-width:700px;}}
416
- .content-panel-alphatts-v2 {{padding:1.5rem;}}
417
- .app-header-alphatts-v2 h1 {{font-size:2.5em !important;}}
418
- .app-header-alphatts-v2 p {{font-size:1.05em !important;}}
419
  }}
420
  @media (min-width:768px) {{
421
- .main-content-area-alphatts-v2 {{max-width:780px;}}
422
- .content-panel-alphatts-v2 {{padding:2rem;}}
423
- .content-panel-alphatts-v2 .gr-button#generate_button_alpha_v3
424
- {{
425
- width:auto !important; align-self:flex-start;
426
- }}
427
- .app-header-alphatts-v2 h1 {{font-size:2.75em !important;}}
428
- .app-header-alphatts-v2 p {{font-size:1.1em !important;}}
429
  }}
430
  """
 
431
 
432
- # --- Gradio UI Definition (YOUR UI structure, with new CSS applied) ---
433
- with gr.Blocks(theme=app_theme_applied_styled, css=final_combined_css_v3, title=f"آلفا TTS ({FIXED_MODEL_NAME.split('-')[1]})") as demo:
 
434
  gr.HTML(f"""
435
- <div class='app-header-alphatts-v2'>
436
  <h1>🚀 Alpha TTS</h1>
437
- <p>جادوی تبدیل متن به صدا در دستان شما (Gemini {FIXED_MODEL_NAME.split('-')[1]})</p>
438
  </div>
439
  """)
440
 
441
- with gr.Column(elem_classes=["main-content-area-alphatts-v2"]):
442
- with gr.Column(elem_classes=["content-panel-alphatts-v2"]): # This wraps YOUR UI elements
443
-
444
- if not os.environ.get("GEMINI_API_KEY"):
445
- gr.Markdown("<p style='color:red; text-align:center; margin-bottom:1rem;'>⚠️ <b>هشدار:</b> متغیر محیطی GEMINI_API_KEY تنظیم نشده است. برنامه کار نخواهد کرد.</p>")
446
-
447
- # YOUR ORIGINAL UI LAYOUT
448
- use_file_input_cb = gr.Checkbox(label="📄 استفاده از فایل متنی (.txt)", value=False, elem_id="use_file_cb_alpha_v3")
 
 
 
449
 
 
 
 
 
 
 
 
 
450
  uploaded_file_input = gr.File(
451
- label=" ",
452
  file_types=['.txt'],
453
  visible=False,
454
- elem_id="file_uploader_alpha_main_v3" # YOUR ID
455
  )
456
-
457
  text_to_speak_tb = gr.Textbox(
458
- label="متن فارسی برای تبدیل",
459
- placeholder="مثال: سلام، فردا هوا چطور است؟",
460
  lines=5,
461
- value="",
462
  visible=True,
463
- elem_id="text_input_main_alpha_v3" # YOUR ID
464
  )
465
 
 
 
 
 
466
  use_file_input_cb.change(
467
- fn=lambda x: (gr.update(visible=x, label=" " if x else "متن فارسی برای تبدیل"), gr.update(visible=not x)),
468
  inputs=use_file_input_cb,
469
  outputs=[uploaded_file_input, text_to_speak_tb]
470
  )
471
 
472
  speech_prompt_tb = gr.Textbox(
473
- label="سبک گفتار (اختیاری)",
474
- placeholder="مثال: با لحنی شاد و پرانرژی",
475
  value="با لحنی دوستانه و رسا صحبت کن.",
476
- lines=2, elem_id="speech_prompt_alpha_v3" # YOUR ID
477
  )
478
-
479
  speaker_voice_dd = gr.Dropdown(
480
- SPEAKER_VOICES, label="انتخاب گوینده و لهجه", value="Charon", elem_id="speaker_voice_alpha_v3" # YOUR ID
 
 
 
481
  )
482
-
483
  temperature_slider = gr.Slider(
484
- minimum=0.1, maximum=1.5, step=0.05, value=0.9, label="میزان خلاقیت صدا",
485
- elem_id="temperature_slider_alpha_v3" # YOUR ID
 
 
 
 
 
 
 
 
 
 
486
  )
487
- gr.Markdown("<p class='temp_description_class_alpha_v3'>مقادیر بالاتر = تنوع بیشتر، مقادیر پایین‌تر = یکنواختی بیشتر.</p>")
488
-
489
- generate_button = gr.Button("🚀 تولید و پخش صدا", elem_id="generate_button_alpha_v3") # YOUR ID
490
 
491
- output_audio = gr.Audio(label=" ", type="filepath", elem_id="output_audio_player_alpha_v3") # YOUR ID
 
 
 
 
 
 
 
 
 
 
 
 
 
 
492
 
493
- gr.HTML("<hr class='custom-hr'>")
494
- gr.Markdown(
495
- "<h3 style='text-align:center; font-weight:500; color:var(--fly-text-secondary); margin-top:1.5rem; margin-bottom:1rem;'>نمونه‌های کاربردی</h3>"
 
496
  )
497
- gr.Examples(
498
- examples=[
 
 
499
  [False, None, "سلام بر شما، امیدوارم روز خوبی داشته باشید.", "با لحنی گرم و صمیمی.", "Zephyr", 0.85],
500
  [False, None, "این یک آزمایش برای بررسی کیفیت صدای تولید شده توسط هوش مصنوعی آلفا است.", "با صدایی طبیعی و روان.", "Charon", 0.9],
501
- ],
502
- inputs=[use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider],
503
- outputs=[output_audio],
504
- fn=gradio_tts_interface,
505
- cache_examples=os.getenv("GRADIO_CACHE_EXAMPLES", "False").lower() == "true"
506
- )
 
 
 
 
 
 
 
 
507
 
508
- gr.Markdown(f"<p class='app-footer-alphatts-v2'>Alpha TTS © 2024 - Model: {FIXED_MODEL_NAME.split('-')[0].upper()} {FIXED_MODEL_NAME.split('-')[1]}</p>")
 
509
 
510
- if generate_button is not None:
511
- generate_button.click(
512
- fn=gradio_tts_interface,
513
- inputs=[use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider, gr.Progress(track_tqdm=True)],
514
- outputs=[output_audio]
515
- )
516
- else:
517
- logging.error("دکمه تولید صدا (generate_button_alpha_v3) در UI یافت نشد.")
518
 
519
  if __name__ == "__main__":
520
- if not PYDUB_AVAILABLE:
521
- logging.warning("Pydub (for audio merging) not found. Merging will be disabled if multiple audio chunks are generated.")
522
- if not os.environ.get("GEMINI_API_KEY"):
523
- logging.warning("GEMINI_API_KEY environment variable not set. TTS functionality WILL FAIL.")
524
-
525
  demo.launch(
526
  server_name="0.0.0.0",
527
  server_port=int(os.getenv("PORT", 7860)),
 
1
  import gradio as gr
2
+ import base64
3
  import mimetypes
4
  import os
5
  import re
6
  import struct
7
  import time
8
+ import zipfile
9
  from google import genai
10
+ from google.genai import types
11
+ import logging # اضافه شده برای هماهنگی با پیام‌های لاگ
 
 
12
 
13
  try:
14
  from pydub import AudioSegment
15
  PYDUB_AVAILABLE = True
16
  except ImportError:
17
  PYDUB_AVAILABLE = False
 
18
 
19
+ # --- START: پیکربندی لاگینگ مشابه کد اول (فقط برای پیام‌های هشدار و خطا) ---
20
+ # این بخش برای نمایش بهتر خطاها در کنسول مفید است، نه برای نمایش در UI
21
+ logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
22
+ # --- END: پیکربندی لاگینگ ---
23
+
24
  SPEAKER_VOICES = [
25
  "Achird", "Zubenelgenubi", "Vindemiatrix", "Sadachbia", "Sadaltager",
26
  "Sulafat", "Laomedeia", "Achernar", "Alnilam", "Schedar", "Gacrux",
 
28
  "Rasalthgeti", "Orus", "Aoede", "Callirrhoe", "Autonoe", "Enceladus",
29
  "Iapetus", "Zephyr", "Puck", "Charon", "Kore", "Fenrir", "Leda"
30
  ]
31
+ FIXED_MODEL_NAME = "gemini-2.5-flash-preview-tts" # این مدل برای TTS استفاده می‌شود و نباید تغییر کند
32
  DEFAULT_MAX_CHUNK_SIZE = 3800
33
  DEFAULT_SLEEP_BETWEEN_REQUESTS = 8
34
  DEFAULT_OUTPUT_FILENAME_BASE = "alpha_tts_audio"
35
 
36
+ # متغیر بررسی وجود کلید API Gemini مشابه کد اول، اما برای یک کلید
37
+ GEMINI_API_KEY_TTS = os.environ.get("GEMINI_API_KEY")
38
+ if not GEMINI_API_KEY_TTS:
39
+ logging.error(
40
+ 'خطای حیاتی: Secret با نام GEMINI_API_KEY یافت نشد! ' +
41
+ 'قابلیت تبدیل متن به گفتار غیرفعال خواهد بود. لطفاً Secret را در تنظیمات Space خود اضافه کنید.'
42
+ )
43
+ else:
44
+ logging.info("کلید API جیمینای (GEMINI_API_KEY) برای TTS بارگذاری شد.")
45
+
46
+
47
+ def _log(message, log_list): # این تابع برای دیباگ داخلی خود کد دوم است و حفظ می‌شود
48
  log_list.append(message)
 
49
 
50
  def save_binary_file(file_name, data, log_list):
51
  try:
 
71
  param = param.strip()
72
  if param.lower().startswith("rate="):
73
  try: rate = int(param.split("=", 1)[1])
74
+ except: pass
75
  elif param.startswith("audio/L"):
76
  try: bits = int(param.split("L", 1)[1])
77
+ except: pass
78
  return {"bits_per_sample": bits, "rate": rate}
79
 
80
  def smart_text_split(text, max_size=3800, log_list=None):
81
  if len(text) <= max_size: return [text]
82
  chunks, current_chunk = [], ""
83
+ sentences = re.split(r'(?<=[.!?؟])\s+', text)
84
  for sentence in sentences:
85
  if len(current_chunk) + len(sentence) + 1 > max_size:
86
  if current_chunk: chunks.append(current_chunk.strip())
 
96
  return final_chunks
97
 
98
  def merge_audio_files_func(file_paths, output_path, log_list):
99
+ if not PYDUB_AVAILABLE: _log("❌ pydub در دسترس نیست. نمی‌توان فایل‌ها را ادغام کرد.", log_list); return False
100
  try:
101
  _log(f"🔗 ادغام {len(file_paths)} فایل صوتی...", log_list)
102
  combined = AudioSegment.empty()
103
  for i, fp in enumerate(file_paths):
104
+ if os.path.exists(fp): combined += AudioSegment.from_file(fp) + (AudioSegment.silent(duration=150) if i < len(file_paths) - 1 else AudioSegment.empty())
 
 
 
 
 
 
 
 
105
  else: _log(f"⚠️ فایل پیدا نشد: {fp}", log_list)
 
 
 
106
  combined.export(output_path, format="wav")
107
  _log(f"✅ فایل ادغام شده: {output_path}", log_list); return True
108
  except Exception as e: _log(f"❌ خطا در ادغام: {e}", log_list); return False
 
110
  def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val, log_list):
111
  output_base_name = DEFAULT_OUTPUT_FILENAME_BASE
112
  max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
113
+ _log("🚀 شروع فرآیند تولید صدا...", log_list)
114
+
115
+ if not GEMINI_API_KEY_TTS: # استفاده از متغیر بررسی شده در ابتدای اسکریپت
116
+ _log("❌ کلید API جیمینای (GEMINI_API_KEY) تنظیم نشده است. تولید صدا ممکن نیست.", log_list)
117
+ # برگرداندن پیام خطا برای نمایش در UI
118
+ # این پیام در output_text_translated (که اینجا معادلش وجود ندارد) یا یک کامپوننت پیام خطا نمایش داده می‌شود.
119
+ # فعلا فقط لاگ می‌کنیم، تابع gradio_tts_interface باید این را مدیریت کند.
120
+ return None, "خطا: کلید API جیمینای برای سرویس TTS تنظیم نشده است."
121
+
122
+
123
+ try: client = genai.Client(api_key=GEMINI_API_KEY_TTS)
124
+ except Exception as e: _log(f"❌ خطا در ایجاد کلاینت Gemini: {e}", log_list); return None, f"خطا در اتصال به Gemini: {e}"
125
+ if not text_input or not text_input.strip(): _log("❌ متن ورودی خالی است.", log_list); return None, "خطا: متن ورودی برای تبدیل به گفتار خالی است."
126
+
127
  text_chunks = smart_text_split(text_input, max_chunk, log_list)
128
+ if not text_chunks: _log("❌ متن قابل پردازش نیست یا به قطعات خالی تقسیم شده.", log_list); return None, "خطا: متن ورودی پس از پردازش، خالی است."
129
 
130
  generated_files = []
131
  for i, chunk in enumerate(text_chunks):
132
+ _log(f"🔊 پردازش قطعه {i+1}/{len(text_chunks)}...", log_list)
133
  final_text = f'"{prompt_input}"\n{chunk}' if prompt_input and prompt_input.strip() else chunk
134
+ contents = [types.Content(role="user", parts=[types.Part.from_text(text=final_text)])]
135
+ config = types.GenerateContentConfig(temperature=temperature_val, response_modalities=["audio"],
136
+ speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
137
+ prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_voice))))
138
  fname_base = f"{output_base_name}_part{i+1:03d}"
139
  try:
140
  response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
141
  if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
142
  inline_data = response.candidates[0].content.parts[0].inline_data
143
  data_buffer = inline_data.data
144
+ ext = mimetypes.guess_extension(inline_data.mime_type) or ".wav"
145
+ if "audio/L" in inline_data.mime_type and ext == ".wav": data_buffer = convert_to_wav(data_buffer, inline_data.mime_type)
 
 
 
 
146
  if not ext.startswith("."): ext = "." + ext
147
  fpath = save_binary_file(f"{fname_base}{ext}", data_buffer, log_list)
148
  if fpath: generated_files.append(fpath)
149
+ else: _log(f"⚠️ پاسخ API برای قطعه {i+1} بدون داده صوتی معتبر.", log_list)
150
+ except Exception as e: _log(f"❌ خطا در تولید قطعه {i+1}: {e}", log_list); continue # ادامه با قطعه بعدی اگر خطایی رخ دهد
151
+ if i < len(text_chunks) - 1 and len(text_chunks) > 1: time.sleep(sleep_time)
152
+
153
+ if not generated_files: _log("❌ هیچ فایل صوتی تولید نشد.", log_list); return None, "خطا: هیچ فایل صوتی تولید نشد. (ممکن است مشکل از API یا متن ورودی باشد)."
154
+ _log(f"🎉 {len(generated_files)} فایل(های) صوتی با موفقیت تولید شد.", log_list)
 
 
155
 
156
  final_audio_file = None
157
  final_output_path_base = f"{output_base_name}_final"
 
159
  if len(generated_files) > 1:
160
  if PYDUB_AVAILABLE:
161
  merged_fn = f"{final_output_path_base}.wav"
162
+ if os.path.exists(merged_fn): os.remove(merged_fn)
 
 
163
  if merge_audio_files_func(generated_files, merged_fn, log_list):
164
  final_audio_file = merged_fn
165
+ else:
166
+ _log("⚠️ ادغام فایل‌ها ناموفق بود. اولین قطعه ارائه می‌شود.", log_list)
167
+ if generated_files: # اگر ادغام ناموفق بود، اولین قطعه با نام استاندارد ارائه می‌شود
 
 
 
168
  try:
169
+ target_ext_fallback = os.path.splitext(generated_files[0])[1]
170
+ fallback_fn = f"{final_output_path_base}{target_ext_fallback}"
171
+ if os.path.exists(fallback_fn): os.remove(fallback_fn)
172
+ os.rename(generated_files[0], fallback_fn)
173
+ final_audio_file = fallback_fn
174
+ except Exception as e_rename_fallback:
175
+ _log(f"خطا در تغییر نام فایل اولین قطعه (پس از شکست ادغام): {e_rename_fallback}", log_list)
 
 
 
 
 
176
  final_audio_file = generated_files[0]
177
+ # پاک کردن فایل‌های جزئی
178
+ files_to_delete = [fp for fp in generated_files if os.path.abspath(fp) != os.path.abspath(final_audio_file)]
179
+ for fp_del in files_to_delete:
180
+ try: os.remove(fp_del)
181
+ except: pass
182
  else:
183
+ _log("⚠️ pydub برای ادغام در دسترس نیست. اولین قطعه ارائه می‌شود.", log_list)
184
  if generated_files:
185
  try:
186
+ target_ext_no_pydub = os.path.splitext(generated_files[0])[1]
187
+ no_pydub_fn = f"{final_output_path_base}{target_ext_no_pydub}"
188
+ if os.path.exists(no_pydub_fn): os.remove(no_pydub_fn)
189
+ os.rename(generated_files[0], no_pydub_fn)
190
+ final_audio_file = no_pydub_fn
191
+ # پاک کردن سایر فایل‌های جزئی
192
+ for i_gf in range(1, len(generated_files)):
193
+ try: os.remove(generated_files[i_gf])
194
+ except: pass
195
+ except Exception as e_rename_single_no_pydub:
196
+ _log(f"خطا در تغییر نام فایل اولین قطعه (بدون pydub): {e_rename_single_no_pydub}", log_list)
 
197
  final_audio_file = generated_files[0]
198
+
199
  elif len(generated_files) == 1:
200
  try:
201
+ target_ext_single = os.path.splitext(generated_files[0])[1]
202
+ final_single_fn = f"{final_output_path_base}{target_ext_single}"
203
+ if os.path.exists(final_single_fn): os.remove(final_single_fn)
204
+ os.rename(generated_files[0], final_single_fn)
205
+ final_audio_file = final_single_fn
 
206
  except Exception as e_rename_single_final:
207
  _log(f"خطا در تغییر نام فایل تکی نهایی: {e_rename_single_final}", log_list)
208
  final_audio_file = generated_files[0]
209
 
210
  if final_audio_file and not os.path.exists(final_audio_file):
211
+ _log(f"⚠️ فایل نهایی '{final_audio_file}' پس از پردازش وجود ندارد!", log_list)
212
+ return None, f"خطای داخلی: فایل صوتی نهایی '{final_audio_file}' یافت نشد."
213
+
214
+ return final_audio_file, "TTS موفق" # پیام موفقیت اضافه شد
215
 
216
  def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_prompt, speaker_voice, temperature, progress=gr.Progress(track_tqdm=True)):
217
+ logs = [] # لاگ‌های داخلی تابع core_generate_audio
218
+ status_message_text = "" # متنی برای نمایش پیام‌های وضعیت یا خطا
219
+
220
+ if not GEMINI_API_KEY_TTS:
221
+ # این پیام خطا باید در یک Textbox یا Markdown در UI نمایش داده شود
222
+ # تابع اصلی یک فایل صوتی و یک متن برمی‌گرداند.
223
+ # ما متن را برای پیام خطا استفاده می‌کنیم.
224
+ status_message_text = (
225
+ "خطا: سرویس تبدیل متن به گفتار پیکربندی نشده است. "
226
+ "کلید API جیمینای (GEMINI_API_KEY) در Secrets این Space یافت نشد. "
227
+ "لطفاً آن را تنظیم کنید."
228
+ )
229
+ # برگرداندن None برای صوت و پیام خطا برای تکست باکس
230
+ return None, status_message_text
231
+
232
  actual_text = ""
233
  if use_file_input:
234
  if uploaded_file:
235
  try:
236
  with open(uploaded_file.name, 'r', encoding='utf-8') as f: actual_text = f.read().strip()
237
+ if not actual_text:
238
+ status_message_text = "خطا: فایل متنی انتخاب شده خالی است یا محتوایی ندارد."
239
+ return None, status_message_text
240
+ except Exception as e:
241
+ _log(f"❌ خطا در خواندن فایل: {e}", logs)
242
+ status_message_text = f"خطا در خواندن فایل ورودی: {e}"
243
+ return None, status_message_text
244
+ else:
245
+ status_message_text = "خطا: گزینه استفاده از فایل انتخاب شده، اما فایلی آپلود نشده است."
246
+ return None, status_message_text
247
  else:
248
  actual_text = text_to_speak
249
+ if not actual_text or not actual_text.strip():
250
+ status_message_text = "لطفاً متنی را برای تبدیل به گفتار وارد کنید."
251
+ return None, status_message_text
252
+
253
+ # فراخوانی core_generate_audio که حالا دو مقدار برمی‌گرداند
254
+ final_path, status_msg_core = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature, logs)
255
 
256
+ # برای دیباگ در کنسول Hugging Face Spaces
257
+ # for log_entry in logs:
258
+ # print(log_entry)
259
+
260
+ if final_path and os.path.exists(final_path):
261
+ # اگر موفق بود، پیام خاصی در تکست باکس لازم نیست، یا یک پیام موفقیت کلی
262
+ status_message_text = "صدای درخواستی با موفقیت تولید شد."
263
+ return final_path, status_message_text
264
+ else:
265
+ # اگر final_path نبود یا وجود نداشت، از status_msg_core استفاده کن
266
+ status_message_text = status_msg_core if status_msg_core else "خطای نامشخص در تولید صدا."
267
+ return None, status_message_text
268
 
269
 
270
+ # --- START: CSS و متغیرهای رنگی از کد اول (Alpha Translator) ---
271
  FLY_PRIMARY_COLOR_HEX = "#4F46E5"
272
  FLY_SECONDARY_COLOR_HEX = "#10B981"
273
+ FLY_ACCENT_COLOR_HEX = "#D97706" # این رنگ برای دکمه اصلی در کد اول استفاده شده بود
274
  FLY_TEXT_COLOR_HEX = "#1F2937"
275
  FLY_SUBTLE_TEXT_HEX = "#6B7280"
276
  FLY_LIGHT_BACKGROUND_HEX = "#F9FAFB"
277
  FLY_WHITE_HEX = "#FFFFFF"
278
  FLY_BORDER_COLOR_HEX = "#D1D5DB"
279
  FLY_INPUT_BG_HEX_SIMPLE = "#F3F4F6"
280
+ FLY_PANEL_BG_SIMPLE = "#E0F2FE" # برای پس زمینه بخش ترجمه شده در کد اول
281
 
282
+ app_theme_outer = gr.themes.Base(
283
  font=[gr.themes.GoogleFont("Inter"), "system-ui", "sans-serif"],
284
  ).set(
285
  body_background_fill=FLY_LIGHT_BACKGROUND_HEX,
286
  )
287
 
288
+ custom_css = f"""
 
289
  @import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;600;700;800&display=swap');
290
  @import url('https://fonts.googleapis.com/css2?family=Poppins:wght@400;500;600;700;800&display=swap');
291
  @import url('https://fonts.googleapis.com/css2?family=Inter:wght@400;500;600;700;800&display=swap');
 
292
  :root {{
293
+ --fly-primary: {FLY_PRIMARY_COLOR_HEX}; --fly-secondary: {FLY_SECONDARY_COLOR_HEX};
294
+ --fly-accent: {FLY_ACCENT_COLOR_HEX}; --fly-text-primary: {FLY_TEXT_COLOR_HEX};
295
+ --fly-text-secondary: {FLY_SUBTLE_TEXT_HEX}; --fly-bg-light: {FLY_LIGHT_BACKGROUND_HEX};
296
+ --fly-bg-white: {FLY_WHITE_HEX}; --fly-border-color: {FLY_BORDER_COLOR_HEX};
297
+ --fly-input-bg-simple: {FLY_INPUT_BG_HEX_SIMPLE}; --fly-panel-bg-simple: {FLY_PANEL_BG_SIMPLE};
298
+ --font-global: 'Vazirmatn', 'Inter', 'Poppins', system-ui, sans-serif;
299
+ --font-english: 'Poppins', 'Inter', system-ui, sans-serif; /* برای متن انگلیسی در صورت نیاز */
300
+ --radius-sm: 0.375rem; --radius-md: 0.5rem; --radius-lg: 0.75rem; --radius-xl: 1rem; --radius-full: 9999px;
301
+ --shadow-sm: 0 1px 2px 0 rgba(0,0,0,0.05); --shadow-md: 0 4px 6px -1px rgba(0,0,0,0.1),0 2px 4px -2px rgba(0,0,0,0.1);
 
 
 
 
302
  --shadow-lg: 0 10px 15px -3px rgba(0,0,0,0.1),0 4px 6px -4px rgba(0,0,0,0.1);
303
  --shadow-xl: 0 20px 25px -5px rgba(0,0,0,0.1),0 8px 10px -6px rgba(0,0,0,0.1);
304
+ --fly-primary-rgb: 79,70,229; --fly-accent-rgb: 217,119,6;
 
 
 
 
 
 
 
 
 
 
 
 
 
 
305
  }}
306
+ body {{font-family:var(--font-global);direction:rtl;background-color:var(--fly-bg-light);color:var(--fly-text-primary);line-height:1.7;-webkit-font-smoothing:antialiased;-moz-osx-font-smoothing:grayscale;font-size:16px;}}
307
+ .gradio-container {{max-width:100% !important;width:100% !important;min-height:100vh;margin:0 auto !important;padding:0 !important;border-radius:0 !important;box-shadow:none !important;background:linear-gradient(170deg, #E0F2FE 0%, #F3E8FF 100%);display:flex;flex-direction:column;}}
308
+ .app-title-card {{text-align:center;padding:2.5rem 1rem;margin:0;background:linear-gradient(135deg,var(--fly-primary) 0%,var(--fly-secondary) 100%);color:var(--fly-bg-white);border-bottom-left-radius:var(--radius-xl);border-bottom-right-radius:var(--radius-xl);box-shadow:var(--shadow-lg);position:relative;overflow:hidden;}}
309
+ .app-title-card::before {{content:'';position:absolute;top:-50px;right:-50px;width:150px;height:150px;background:rgba(255,255,255,0.1);border-radius:var(--radius-full);opacity:0.5;transform:rotate(45deg);}}
310
+ .app-title-card h1 {{font-size:2.25em !important;font-weight:800 !important;margin:0 0 0.5rem 0;font-family:var(--font-english);letter-spacing:-0.5px;text-shadow:0 2px 4px rgba(0,0,0,0.1);}} /* فونت انگلیسی برای عنوان اصلی */
311
+ .app-title-card p {{font-size:1em !important;margin-top:0.25rem;font-weight:400;color:rgba(255,255,255,0.85) !important;}}
312
+ .app-footer-fly {{text-align:center;font-size:0.85em;color:var(--fly-text-secondary);margin-top:2.5rem;padding:1rem 0;background-color:rgba(255,255,255,0.3);backdrop-filter:blur(5px);border-top:1px solid var(--fly-border-color);}}
313
+ footer,.gradio-footer,.flagging-container,.flex.row.gap-2.absolute.bottom-2.right-2.gr-compact.gr-box.gr-text-gray-500,div[data-testid="flag"],button[title="Flag"],button[aria-label="Flag"],.footer-utils {{display:none !important;visibility:hidden !important;}}
314
+ .main-content-area {{flex-grow:1;padding:0.75rem;width:100%;margin:0 auto;box-sizing:border-box;}}
315
+ .content-panel-simple {{background-color:var(--fly-bg-white);padding:1rem;border-radius:var(--radius-xl);box-shadow:var(--shadow-xl);margin-top:-2rem;position:relative;z-index:10;margin-bottom:2rem;width:100%;box-sizing:border-box;}}
316
+
317
+ /* استایل دکمه اصلی با استفاده از رنگ accent کد اول */
318
+ .content-panel-simple .gr-button.lg.primary, .content-panel-simple button[variant="primary"].lg {{
319
+ background:var(--fly-accent) !important;
320
+ margin-top:1rem !important;padding:12px 20px !important;
321
+ transition:all 0.25s ease-in-out !important;color:white !important;
322
+ font-weight:600 !important;border-radius:10px !important;
323
+ border:none !important;box-shadow:0 3px 8px -1px rgba(var(--fly-accent-rgb),0.3) !important;
324
+ width:100% !important;font-size:1em !important;
325
+ display:flex;align-items:center;justify-content:center;
 
 
 
 
 
 
 
 
 
 
 
326
  }}
327
+ .content-panel-simple .gr-button.lg.primary:hover, .content-panel-simple button[variant="primary"].lg:hover {{
328
+ background:#B45309 !important; /* رنگ تیره‌تر fly-accent برای هاور */
329
+ transform:translateY(-1px) !important;
330
+ box-shadow:0 5px 10px -1px rgba(var(--fly-accent-rgb),0.4) !important;
331
  }}
332
 
333
+ .content-panel-simple .gr-input > label + div > textarea,
334
+ .content-panel-simple .gr-dropdown > label + div > div > input,
335
+ .content-panel-simple .gr-dropdown > label + div > div > select,
336
+ .content-panel-simple .gr-textbox > label + div > textarea,
337
+ .content-panel-simple .gr-file > label + div /* اضافه شده برای فایل */
 
 
338
  {{
339
+ border-radius:8px !important;border:1.5px solid var(--fly-border-color) !important;
340
+ font-size:0.95em !important;background-color:var(--fly-input-bg-simple) !important;
341
+ padding:10px 12px !important;color:var(--fly-text-primary) !important;
 
 
 
 
342
  }}
343
+ .content-panel-simple .gr-file > label + div {{ text-align:center; border-style: dashed !important; }} /* استایل برای درگ و دراپ فایل */
344
 
345
+ .content-panel-simple .gr-input > label + div > textarea:focus,
346
+ .content-panel-simple .gr-dropdown > label + div > div > input:focus,
347
+ .content-panel-simple .gr-dropdown > label + div > div > select:focus,
348
+ .content-panel-simple .gr-textbox > label + div > textarea:focus,
349
+ .content-panel-simple .gr-file > label + div:focus-within /* اضافه شده برای فایل */
 
350
  {{
351
  border-color:var(--fly-primary) !important;
352
  box-shadow:0 0 0 3px rgba(var(--fly-primary-rgb),0.12) !important;
353
  background-color:var(--fly-bg-white) !important;
354
  }}
355
+ .content-panel-simple .gr-dropdown select {{font-family:var(--font-global) !important;width:100%;cursor:pointer;}}
356
+
357
+ /* استایل برای تکست‌باکس خروجی (پیام وضعیت) */
358
+ .content-panel-simple .gr-textbox[label*="وضعیت"] > label + div > textarea,
359
+ .content-panel-simple .gr-textbox[elem_id="status_text_output_tts"] > label + div > textarea {{
360
+ background-color:var(--fly-panel-bg-simple) !important;
361
+ border-color:#A5D5FE !important;min-height:60px; /* ارتفاع کمتر برای پیام وضعیت */
362
+ font-family:var(--font-global); /* فونت فارسی برای پیام‌ها */
363
+ font-size:0.9em !important;line-height:1.5;padding:8px 10px !important;
 
 
 
 
 
 
 
 
 
 
364
  }}
365
 
366
+ .content-panel-simple .gr-panel,
367
+ .content-panel-simple div[label*="تنظیمات پیشرفته"] > .gr-accordion > .gr-panel /* اگر آکاردئون اضافه شود */
 
368
  {{
369
+ border-radius:8px !important;border:1px solid var(--fly-border-color) !important;
370
+ background-color:var(--fly-input-bg-simple) !important;
371
+ padding:0.8rem 1rem !important;margin-top:0.6rem;box-shadow:none;
372
  }}
373
+ .content-panel-simple label > span.label-text {{font-weight:500 !important;color:#4B5563 !important;font-size:0.88em !important;margin-bottom:6px !important;display:inline-block;}}
374
+ .content-panel-simple .gr-slider label span {{font-size:0.82em !important;color:var(--fly-text-secondary);}}
375
+
376
+ .content-panel-simple div[label*="نمونه"], .content-panel-simple .gr-examples[label*="نمونه"] {{margin-top:1.5rem;}}
377
+ .content-panel-simple div[label*="نمونه"] .gr-button.gr-button-tool,
378
+ .content-panel-simple div[label*="نمونه"] .gr-sample-button,
379
+ .content-panel-simple .gr-examples[label*="نمونه"] .gr-button.gr-button-tool,
380
+ .content-panel-simple .gr-examples[label*="نمونه"] .gr-sample-button
381
+ {{
382
+ background-color:#E0E7FF !important;color:var(--fly-primary) !important;
383
+ border-radius:6px !important;font-size:0.78em !important;padding:4px 8px !important;
384
  }}
385
+ .content-panel-simple .custom-hr {{height:1px;background-color:var(--fly-border-color);margin:1.5rem 0;border:none;}}
386
+
387
+ /* استایل برای پیام هشدار API Key مشابه کد اول */
388
+ .api-warning-message {{
389
+ background-color:#FFFBEB !important;color:#92400E !important;
390
+ padding:10px 12px !important;border-radius:8px !important;
391
+ border:1px solid #FDE68A !important;text-align:center !important;
392
+ margin:0 0.2rem 1rem 0.2rem !important;font-size:0.85em !important;
393
  }}
394
 
395
+ /* استایل برای پلیر صوتی */
396
+ .content-panel-simple #output_audio_player_tts audio {{ width: 100%; border-radius: var(--radius-input, 8px); margin-top:0.8rem; }}
397
+ .temp_description_class_tts {{ font-size: 0.85em; color: var(--fly-subtle-text, #777); margin-top: -0.4rem; margin-bottom: 1rem; }}
 
 
 
 
398
 
 
 
 
 
 
 
 
 
399
 
400
  @media (min-width:640px) {{
401
+ .main-content-area {{padding:1.5rem;max-width:700px;}}
402
+ .content-panel-simple {{padding:1.5rem;}}
403
+ .app-title-card h1 {{font-size:2.5em !important;}}
404
+ .app-title-card p {{font-size:1.05em !important;}}
405
  }}
406
  @media (min-width:768px) {{
407
+ .main-content-area {{max-width:780px;}}
408
+ .content-panel-simple {{padding:2rem;}}
409
+ /* .content-panel-simple .main-content-row {{display:flex !important;flex-direction:row !important;gap:1.5rem !important;}} */ /* این بخش برای چیدمان دو ستونه بود که در این کد دوم نداریم */
410
+ /* .content-panel-simple .main-content-row > .gr-column:nth-child(1) {{flex-basis:60%;}} */
411
+ /* .content-panel-simple .main-content-row > .gr-column:nth-child(2) {{flex-basis:40%;}} */
412
+ .content-panel-simple .gr-button.lg.primary, .content-panel-simple button[variant="primary"].lg {{width:auto !important;align-self:flex-start;}}
413
+ .app-title-card h1 {{font-size:2.75em !important;}}
414
+ .app-title-card p {{font-size:1.1em !important;}}
415
  }}
416
  """
417
+ # --- END: CSS و متغیرهای رنگی ---
418
 
419
+
420
+ with gr.Blocks(theme=app_theme_outer, css=custom_css, title="آلفا TTS") as demo:
421
+ # هدر مشابه کد اول، با تغییر عنوان و متن
422
  gr.HTML(f"""
423
+ <div class="app-title-card">
424
  <h1>🚀 Alpha TTS</h1>
425
+ <p>جادوی تبدیل متن به صدا در دستان شما</p>
426
  </div>
427
  """)
428
 
429
+ with gr.Column(elem_classes=["main-content-area"]):
430
+ with gr.Group(elem_classes=["content-panel-simple"]):
431
+ # نمایش هشدار اگر کلید API تنظیم نشده باشد (مشابه کد اول)
432
+ if not GEMINI_API_KEY_TTS:
433
+ missing_key_msg_tts = (
434
+ "⚠️ هشدار: قابلیت تبدیل متن به گفتار غیرفعال است. "
435
+ "کلید API جیمینای (GEMINI_API_KEY) "
436
+ "در بخش Secrets این Space یافت نشد. "
437
+ "لطفاً آن را تنظیم کنید."
438
+ )
439
+ gr.Markdown(f"<div class='api-warning-message'>{missing_key_msg_tts}</div>")
440
 
441
+ # اجزای UI کد دوم در اینجا قرار می‌گیرند، با حفظ ساختار داخلی آنها
442
+ # اما کلاس‌های CSS کد اول به آنها اعمال خواهد شد.
443
+
444
+ use_file_input_cb = gr.Checkbox(
445
+ label="📄 استفاده از فایل متنی (.txt) برای ورود متن", # لیبل واضح‌تر
446
+ value=False,
447
+ elem_id="use_file_cb_tts" # elem_id حفظ شده
448
+ )
449
  uploaded_file_input = gr.File(
450
+ label="انتخاب فایل .txt", # لیبل برای حالت نمایش فایل
451
  file_types=['.txt'],
452
  visible=False,
453
+ elem_id="file_uploader_tts" # elem_id حفظ شده
454
  )
 
455
  text_to_speak_tb = gr.Textbox(
456
+ label="📝 متن فارسی برای تبدیل به گفتار", # آیکون مشابه کد اول
457
+ placeholder="مثال: سلام، امروز هوا بسیار دلپذیر است.",
458
  lines=5,
459
+ value="",
460
  visible=True,
461
+ elem_id="text_input_tts" # elem_id حفظ شده
462
  )
463
 
464
+ # منطق نمایش/عدم نمایش فیلدها حفظ می‌شود
465
+ def toggle_input_method(use_file):
466
+ return gr.update(visible=use_file), gr.update(visible=not use_file)
467
+
468
  use_file_input_cb.change(
469
+ fn=toggle_input_method,
470
  inputs=use_file_input_cb,
471
  outputs=[uploaded_file_input, text_to_speak_tb]
472
  )
473
 
474
  speech_prompt_tb = gr.Textbox(
475
+ label="🗣️ سبک گفتار (اختیاری)", # آیکون مشابه کد اول
476
+ placeholder="مثال: با لحنی شاد و پرانرژی صحبت کن.",
477
  value="با لحنی دوستانه و رسا صحبت کن.",
478
+ lines=2, elem_id="speech_prompt_tts" # elem_id حفظ شده
479
  )
 
480
  speaker_voice_dd = gr.Dropdown(
481
+ SPEAKER_VOICES,
482
+ label="🎤 انتخاب گوینده", # آیکون مشابه کد اول (با تغییر متن لیبل)
483
+ value="Charon", # مقدار پیشفرض حفظ شده
484
+ elem_id="speaker_voice_tts" # elem_id حفظ شده
485
  )
 
486
  temperature_slider = gr.Slider(
487
+ minimum=0.1, maximum=1.5, step=0.05, value=0.9,
488
+ label="🌡️ میزان خلاقیت صدا (Temperature)", # آیکون مشابه کد اول
489
+ elem_id="temperature_slider_tts" # elem_id حفظ شده
490
+ )
491
+ # توضیح اسلایدر با کلاس CSS مشابه کد اول برای هماهنگی
492
+ gr.Markdown("<p class='temp_description_class_tts'>مقادیر بالاتر = تنوع بیشتر در صدا، مقادیر پایین‌تر = صدای یکنواخت‌تر.</p>")
493
+
494
+ # دکمه اصلی با استایل کد اول (variant="primary" و elem_classes=["lg"])
495
+ generate_button = gr.Button(
496
+ "🚀 تولید و پخش صدا",
497
+ variant="primary", # برای اعمال استایل دکمه اصلی از کد اول
498
+ elem_classes=["lg"] # برای اعمال استایل دکمه اصلی از کد اول
499
  )
 
 
 
500
 
501
+ # خروجی‌ها: صوت و یک تکست‌باکس برای پیام وضعیت/خطا
502
+ status_text_output = gr.Textbox(
503
+ label="📜 وضعیت پردازش و پیام‌ها", # لیبل واضح‌تر
504
+ interactive=False,
505
+ lines=2, # ارتفاع کمتر برای پیام‌ها
506
+ placeholder="پیام‌های وضعیت یا خطا در اینجا نمایش داده می‌شوند...",
507
+ elem_id="status_text_output_tts" # elem_id جدید برای این کامپوننت
508
+ )
509
+ output_audio = gr.Audio(
510
+ label="🎧 فایل صوتی تولید شده", # لیبل واضح‌تر
511
+ type="filepath",
512
+ interactive=False, # مانند کد اول، غیرفعال
513
+ autoplay=True, # مانند کد اول، پخش خودکار
514
+ elem_id="output_audio_player_tts" # elem_id با پسوند tts برای تمایز
515
+ )
516
 
517
+ generate_button.click(
518
+ fn=gradio_tts_interface,
519
+ inputs=[use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider],
520
+ outputs=[output_audio, status_text_output] # خروجی دوم برای پیام وضعیت
521
  )
522
+
523
+ # بخش نمونه‌ها با استایل مشابه کد اول
524
+ # gr.HTML("<hr class='custom-hr'>") # خط جداکننده از کد اول
525
+ example_list_tts = [
526
  [False, None, "سلام بر شما، امیدوارم روز خوبی داشته باشید.", "با لحنی گرم و صمیمی.", "Zephyr", 0.85],
527
  [False, None, "این یک آزمایش برای بررسی کیفیت صدای تولید شده توسط هوش مصنوعی آلفا است.", "با صدایی طبیعی و روان.", "Charon", 0.9],
528
+ [False, None, "به دنیای شگفت‌انگیز تبدیل متن به گفتار خوش آمدید!", "با هیجان و انرژی بالا.", "Achird", 1.0],
529
+ ]
530
+
531
+ if example_list_tts: # فقط اگر نمونه‌ای وجود دارد نمایش بده
532
+ gr.Examples(
533
+ examples=example_list_tts,
534
+ inputs=[use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider],
535
+ outputs=[output_audio, status_text_output], # خروجی دوم برای پیام وضعیت
536
+ fn=gradio_tts_interface,
537
+ cache_examples=os.getenv("GRADIO_CACHE_EXAMPLES", "False").lower() == "true", # مشابه کد اول
538
+ label="💡 نمونه‌های کاربردی" # لیبل مشابه کد اول برای اعمال استایل صحیح
539
+ )
540
+ else:
541
+ gr.Markdown("<p style='text-align:center; color:var(--fly-text-secondary); margin-top:1rem;'>نمونه‌ای برای نمایش موجود نیست.</p>")
542
 
543
+ # فوتر مشابه کد اول
544
+ gr.Markdown("<p class='app-footer-fly'>Alpha Language Learning © 2024</p>") # سال می‌تواند 2024 یا 2025 باشد
545
 
 
 
 
 
 
 
 
 
546
 
547
  if __name__ == "__main__":
548
+ if not GEMINI_API_KEY_TTS: # بررسی مجدد برای اطمینان در زمان اجرا
549
+ logging.warning("هشدار: کلید API جیمینای (GEMINI_API_KEY) برای TTS یافت نشد. برنامه اجرا می‌شود اما تولید صدا کار نخواهد کرد.")
550
+
 
 
551
  demo.launch(
552
  server_name="0.0.0.0",
553
  server_port=int(os.getenv("PORT", 7860)),