Spaces:

Hamed744
/

Ttspro

Running

App Files Files Community

Hamed744 commited on Jun 5

Commit

e2d623f

verified ·

1 Parent(s): afeabe2

Update app.py

Browse files

Files changed (1) hide show

app.py +155 -143

app.py CHANGED Viewed

@@ -6,14 +6,28 @@ import re
 import struct
 import time
 import zipfile
-from google import genai
-from google.genai import types
-from google.api_core import exceptions as google_exceptions # برای تشخیص دقیق‌تر خطای سهمیه
 try:
     from pydub import AudioSegment
     PYDUB_AVAILABLE = True
 except ImportError:
     PYDUB_AVAILABLE = False
 # --- START: منطق چرخش API Key ---
@@ -24,40 +38,29 @@ while os.environ.get(f"GEMINI_API_KEY_{i}"):
   i += 1
 NUM_API_KEYS = len(GEMINI_API_KEYS)
-# CURRENT_KEY_INDEX_GLOBAL: نشان دهنده *اولین* کلیدی است که برای یک درخواست کامل از Gradio باید امتحان شود.
-# این متغیر پس از هر درخواست کامل (موفق یا ناموفق) پیش می‌رود.
 CURRENT_KEY_INDEX_GLOBAL = 0
 def _log(message):
     print(f"[لاگ آلفا TTS] {message}")
 if NUM_API_KEYS == 0:
-  _log("⛔️ خطای حیاتی: هیچ Secret با نام GEMINI_API_KEY_n یافت نشد!")
 else:
   _log(f"✅ تعداد {NUM_API_KEYS} کلید API جیمینای بارگذاری شد.")
 def get_api_key_for_attempt(attempt_within_request):
-  """
-  کلید API را برای یک تلاش خاص *درون یک درخواست Gradio* برمی‌گرداند.
-  attempt_within_request از 0 شروع می‌شود.
-  """
   if NUM_API_KEYS == 0:
-    return None, -1, -1 # key, display_num, actual_index_in_list
-  # اندیس کلیدی که باید در لیست GEMINI_API_KEYS استفاده شود:
-  # (اندیس کلید شروع سراسری + تعداد تلاش‌های این درخواست) % تعداد کل کلیدها
   actual_key_index_in_list = (CURRENT_KEY_INDEX_GLOBAL + attempt_within_request) % NUM_API_KEYS
   key_to_use = GEMINI_API_KEYS[actual_key_index_in_list]
-  key_display_number = actual_key_index_in_list + 1 # برای نمایش به کاربر (1-based)
   return key_to_use, key_display_number, actual_key_index_in_list
 def advance_global_key_index_for_next_request():
-    """
-    پس از اتمام یک درخواست کامل Gradio (تمام قطعات آن)،
-    اندیس سراسری را برای *درخواست Gradio بعدی* پیش می‌برد.
-    """
     global CURRENT_KEY_INDEX_GLOBAL
     if NUM_API_KEYS > 0:
         CURRENT_KEY_INDEX_GLOBAL = (CURRENT_KEY_INDEX_GLOBAL + 1) % NUM_API_KEYS
@@ -72,8 +75,8 @@ SPEAKER_VOICES = [
 ]
 FIXED_MODEL_NAME = "gemini-2.5-flash-preview-tts"
 DEFAULT_MAX_CHUNK_SIZE = 3800
-DEFAULT_SLEEP_BETWEEN_REQUESTS = 8 # کاهش زمان انتظار بین قطعات اگر از یک کلید موفق استفاده می‌کنیم
-RETRY_SLEEP_AFTER_QUOTA_ERROR = 2 # زمان کوتاه انتظار قبل از تلاش با کلید بعدی
 DEFAULT_OUTPUT_FILENAME_BASE = "alpha_tts_audio"
 def save_binary_file(file_name, data):
@@ -149,14 +152,21 @@ def merge_audio_files_func(file_paths, output_path):
     except Exception as e: _log(f"❌ خطا در ادغام فایل‌های صوتی: {e}"); return False
 def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val):
     _log("🚀 شروع فرآیند تولید صدا...")
     output_base_name = DEFAULT_OUTPUT_FILENAME_BASE
     max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
     if not text_input or not text_input.strip():
         _log("❌ متن ورودی خالی است.")
-        advance_global_key_index_for_next_request() # اطمینان از اینکه درخواست بعدی با کلید بعدی شروع شود
         return None
     text_chunks = smart_text_split(text_input, max_chunk)
@@ -166,28 +176,22 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
         return None
     generated_files = []
-    all_chunks_processed = True # پرچمی برای بررسی اینکه آیا تمام قطعات موفقیت آمیز بوده اند
-    # --- START: منطق تلاش مجدد با کلیدهای مختلف برای هر قطعه ---
     for chunk_idx, chunk_text in enumerate(text_chunks):
         chunk_processed_successfully = False
         _log(f"  🔊 پردازش قطعه {chunk_idx + 1}/{len(text_chunks)}...")
-        # تعداد تلاش‌ها برای این قطعه خاص، حداکثر به تعداد کلیدهای موجود یا 1 اگر کلیدی نیست
-        max_attempts_for_chunk = NUM_API_KEYS if NUM_API_KEYS > 0 else 1
         for attempt_num_for_chunk in range(max_attempts_for_chunk):
             selected_api_key, key_display_num, actual_key_idx = get_api_key_for_attempt(attempt_num_for_chunk)
-            if not selected_api_key: # اگر هیچ کلیدی موجود نباشد (نباید اینجا اتفاق بیفتد اگر NUM_API_KEYS > 0)
-                _log("❌ هیچ کلید API معتبری برای تلاش وجود ندارد.")
-                all_chunks_processed = False
-                break # خروج از حلقه تلاش برای این قطعه
             _log(f"     प्रयास {attempt_num_for_chunk + 1}/{max_attempts_for_chunk} برای قطعه {chunk_idx+1} با کلید شماره {key_display_num} (...{selected_api_key[-4:]})")
             try:
-                client = genai.Client(api_key=selected_api_key)
                 if prompt_input and prompt_input.strip():
                     processed_prompt = prompt_input.strip()
@@ -197,15 +201,13 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
                 else:
                     final_text_for_api = chunk_text.strip()
-                # _log(f"      متن ارسالی به API: '{final_text_for_api[:70]}...'")
                 contents = [types.Content(role="user", parts=[types.Part.from_text(text=final_text_for_api)])]
                 config = types.GenerateContentConfig(temperature=temperature_val, response_modalities=["audio"],
                     speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
                         prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_voice))))
-                fname_base = f"{output_base_name}_part{chunk_idx+1:03d}" # نام فایل موقت برای این قطعه
                 response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
                 if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
@@ -215,61 +217,55 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
                     if "audio/L" in inline_data.mime_type and ext == ".wav": data_buffer = convert_to_wav(data_buffer, inline_data.mime_type)
                     if not ext.startswith("."): ext = "." + ext
-                    # اطمینان از اینکه فایل قبلی (اگر از تلاش قبلی برای همین قطعه مانده) حذف شود
                     temp_fpath_for_chunk = f"{fname_base}{ext}"
                     if os.path.exists(temp_fpath_for_chunk):
                         try: os.remove(temp_fpath_for_chunk)
-                        except OSError as e_rem: _log(f"      ⚠️ نتوانست فایل موقت قبلی را حذف کند: {e_rem}")
                     fpath = save_binary_file(temp_fpath_for_chunk, data_buffer)
                     if fpath:
                         generated_files.append(fpath)
                         chunk_processed_successfully = True
                         _log(f"      ✅ قطعه {chunk_idx+1} با کلید شماره {key_display_num} موفقیت آمیز بود.")
-                        if chunk_idx < len(text_chunks) - 1: # اگر قطعات دیگری هم هستند
-                             time.sleep(DEFAULT_SLEEP_BETWEEN_REQUESTS) # صبر قبل از پردازش قطعه بعدی (با همین کلید)
-                        break # خروج از حلقه تلاش (attempt_num_for_chunk) چون این قطعه موفق بود
                 else:
                     _log(f"      ⚠️ پاسخ API برای قطعه {chunk_idx+1} با کلید {key_display_num} بدون داده صوتی بود.")
-            except google_exceptions.ResourceExhausted as e_quota:
-                _log(f"      ❌ خطای سهمیه (RESOURCE_EXHAUSTED) برای قطعه {chunk_idx+1} با کلید شماره {key_display_num}: {e_quota.message[:100]}...")
-                if attempt_num_for_chunk < max_attempts_for_chunk - 1: # اگر کلیدهای دیگری برای امتحان باقی مانده
                     _log(f"         ... تلاش با کلید بعدی پس از {RETRY_SLEEP_AFTER_QUOTA_ERROR} ثانیه.")
                     time.sleep(RETRY_SLEEP_AFTER_QUOTA_ERROR)
                 else:
                     _log(f"      ⛔️ تمام کلیدهای API برای قطعه {chunk_idx+1} امتحان شدند و ناموفق بودند (خطای سهمیه).")
-                    all_chunks_processed = False # یک قطعه ناموفق بود
             except Exception as e_general:
-                _log(f"      ❌ خطای عمومی در تولید قطعه {chunk_idx+1} با کلید {key_display_num}: {e_general}")
-                # برای خطاهای عمومی، معمولاً تلاش مجدد با کلید دیگر کمکی نمی‌کند، مگر اینکه خطای شبکه موقتی باشد
-                # اما برای سادگی، اجازه می‌دهیم حلقه تلاش ادامه یابد
                 if attempt_num_for_chunk < max_attempts_for_chunk - 1:
-                     time.sleep(RETRY_SLEEP_AFTER_QUOTA_ERROR) # کمی صبر قبل از تلاش با کلید بعدی
                 else:
-                    all_chunks_processed = False # یک قطعه ناموفق بود
             if chunk_processed_successfully:
-                break # از حلقه تلاش برای این قطعه خارج شو
         if not chunk_processed_successfully:
             _log(f"  ⛔️ پردازش قطعه {chunk_idx+1} پس از {max_attempts_for_chunk} تلاش ناموفق بود.")
             all_chunks_processed = False
-            break # خروج از حلقه اصلی پردازش قطعات (chunk_idx) چون یک قطعه حیاتی ناموفق بود
-    # --- END: منطق تلاش مجدد ---
-    advance_global_key_index_for_next_request() # برای درخواست Gradio بعدی، از کلید بعدی شروع کن
     if not all_chunks_processed or not generated_files:
-        _log("❌ هیچ فایل صوتی معتبری تولید نشد (ممکن است برخی قطعات ناموفق بوده باشند یا سهمیه تمام کلیدها تمام شده باشد).")
-        # پاک کردن فایل‌های جزئی ایجاد شده اگر فرآیند کامل نشده
-        for fp in generated_files:
             try: os.remove(fp)
             except: pass
         return None
-    # _log(f"🎉 {len(generated_files)} فایل(های) صوتی خام تولید شد.") # لاگ کمتر
     final_audio_file = None
     final_output_path_base = f"{DEFAULT_OUTPUT_FILENAME_BASE}_final"
@@ -291,7 +287,7 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
                          _log(f"خطا در تغییر نام اولین قطعه (پس از ادغام ناموفق): {e_rename}")
                          final_audio_file = generated_files[0]
-            for fp_cleanup in generated_files:
                 if final_audio_file and os.path.abspath(fp_cleanup) == os.path.abspath(final_audio_file):
                     continue
                 try: os.remove(fp_cleanup)
@@ -309,7 +305,7 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
                         try: os.remove(generated_files[i_gf])
                         except: pass
                 except Exception as e_rename_single:
-                    _log(f"خطا در تغییر نام فایل اولین قطعه (بدون pydub): {e_rename_single}")
                     final_audio_file = generated_files[0]
     elif len(generated_files) == 1:
         try:
@@ -328,7 +324,6 @@ def core_generate_audio(text_input, prompt_input, selected_voice, temperature_va
         _log(f"⚠️ فایل نهایی '{final_audio_file}' پس از پردازش وجود ندارد!")
         return None
     else:
-        # این حالت نباید رخ دهد اگر generated_files خالی نباشد و خطایی در تغییر نام رخ ندهد
         _log(f"❓ وضعیت نامشخص برای فایل نهایی.")
         return None
@@ -347,20 +342,27 @@ def gradio_tts_interface(use_file_input, uploaded_file, text_to_speak, speech_pr
         actual_text = text_to_speak
         if not actual_text or not actual_text.strip(): _log("❌ متن ورودی برای تبدیل خالی است."); return None
-    if NUM_API_KEYS == 0: # بررسی اولیه قبل از فراخوانی core_generate_audio
-        _log("❌ هیچ کلید API برای پردازش موجود نیست. لطفاً Secrets را بررسی کنید.")
         return None
     final_path = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature)
     return final_path
-# --- CSS (بدون تغییر نسبت به کد شما) ---
 custom_css_inspired_by_image = f"""
 @import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;700;800&display=swap');
 :root {{
     --app-font: 'Vazirmatn', sans-serif;
-    --app-header-grad-start: #2980b9; /* آبی */
-    --app-header-grad-end: #2ecc71;   /* سبز */
     --app-panel-bg: #FFFFFF;
     --app-input-bg: #F7F7F7;
     --app-button-bg: #2979FF;
@@ -381,7 +383,6 @@ body, .gradio-container {{ font-family: var(--app-font); direction: rtl; backgro
 .main-content-panel-alpha {{ padding: 1.8rem 1.5rem; max-width: 680px; margin: -2.5rem auto 2rem auto; width: 90%; background-color: var(--app-panel-bg); border-radius: var(--radius-card); box-shadow: var(--shadow-card); position:relative; z-index:10; }}
 @media (max-width: 768px) {{ .main-content-panel-alpha {{ width: 95%; padding: 1.5rem 1rem; margin-top: -2rem; }} .app-header-alpha h1 {{font-size:2em;}} .app-header-alpha p {{font-size:1em;}} }}
 footer {{display:none !important;}}
 .gr-button.generate-button-final {{ background: var(--app-button-bg) !important; color: white !important; border:none !important; border-radius: var(--radius-input) !important; padding: 0.8rem 1.5rem !important; font-weight: 700 !important; font-size:1.05em !important; transition: all 0.3s ease; box-shadow: var(--shadow-button); width:100%; margin-top:1.5rem !important; }}
 .gr-button.generate-button-final:hover {{ filter: brightness(1.1); transform: translateY(-2px); box-shadow: 0 6px 12px -3px rgba(41,121,255,0.6);}}
 .gr-input > label + div > textarea, .gr-dropdown > label + div > div > input, .gr-dropdown > label + div > div > select, .gr-textbox > label + div > textarea, .gr-file > label + div {{ border-radius: var(--radius-input) !important; border: 1px solid var(--app-border-color) !important; background-color: var(--app-input-bg) !important; box-shadow: inset 0 1px 2px rgba(0,0,0,0.05); padding: 0.75rem !important; }}
@@ -394,7 +395,6 @@ label[for*="text_input_main_alpha_v3"] > .label-text::before {{ content: '📝';
 label[for*="speech_prompt_alpha_v3"] > .label-text::before {{ content: '🗣️'; }}
 label[for*="speaker_voice_alpha_v3"] > .label-text::before {{ content: '🎤'; }}
 label[for*="temperature_slider_alpha_v3"] > .label-text::before {{ content: '🌡️'; }}
 #output_audio_player_alpha_v3 audio {{ width: 100%; border-radius: var(--radius-input); margin-top:0.8rem; }}
 .temp_description_class_alpha_v3 {{ font-size: 0.85em; color: #777; margin-top: -0.4rem; margin-bottom: 1rem; }}
 .app-footer-final {{text-align:center;font-size:0.9em;color: var(--app-text-secondary);opacity:0.8; margin-top:3rem;padding:1.5rem 0; border-top:1px solid var(--app-border-color);}}
@@ -407,76 +407,88 @@ alpha_header_html_v3 = """
 </div>
 """
-with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), css=custom_css_inspired_by_image, title="آلفا TTS") as demo:
-    gr.HTML(alpha_header_html_v3)
-    with gr.Column(elem_classes=["main-content-panel-alpha"]):
-        use_file_input_cb = gr.Checkbox(label="📄 استفاده از فایل متنی (.txt)", value=False, elem_id="use_file_cb_alpha_v3")
-        uploaded_file_input = gr.File(
-            label=" ",
-            file_types=['.txt'],
-            visible=False,
-            elem_id="file_uploader_alpha_main_v3"
-        )
-        text_to_speak_tb = gr.Textbox(
-            label="متن فارسی برای تبدیل",
-            placeholder="مثال: سلام، فردا هوا چطور است؟",
-            lines=5,
-            value="",
-            visible=True,
-            elem_id="text_input_main_alpha_v3"
-        )
-        use_file_input_cb.change(
-            fn=lambda x: (gr.update(visible=x, label=" " if x else "متن فارسی برای تبدیل"), gr.update(visible=not x)),
-            inputs=use_file_input_cb,
-            outputs=[uploaded_file_input, text_to_speak_tb]
-        )
-        speech_prompt_tb = gr.Textbox(
-            label="سبک گفتار (اختیاری)",
-            placeholder="مثال: با لحنی شاد و پرانرژی",
-            value="با لحنی دوستانه و رسا صحبت کن.",
-            lines=2, elem_id="speech_prompt_alpha_v3"
-        )
-        speaker_voice_dd = gr.Dropdown(
-            SPEAKER_VOICES, label="انتخاب گوینده و لهجه", value="Charon", elem_id="speaker_voice_alpha_v3"
-        )
-        temperature_slider = gr.Slider(
-            minimum=0.1, maximum=1.5, step=0.05, value=0.9, label="میزان خلاقیت صدا",
-            elem_id="temperature_slider_alpha_v3"
-        )
-        gr.Markdown("<p class='temp_description_class_alpha_v3'>مقادیر بالاتر = تنوع بیشتر، مقادیر پایین‌تر = یکنواختی بیشتر.</p>")
-        generate_button = gr.Button("🚀 تولید و پخش صدا", elem_classes=["generate-button-final"], elem_id="generate_button_alpha_v3")
-        output_audio = gr.Audio(label=" ", type="filepath", elem_id="output_audio_player_alpha_v3")
-        generate_button.click(
-            fn=gradio_tts_interface,
-            inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ],
-            outputs=[output_audio]
-        )
-        gr.Markdown("<h3 class='section-title-main-alpha' style='margin-top:2.5rem; text-align:center; border-bottom:none;'>نمونه‌های کاربردی</h3>", elem_id="examples_section_title_v3")
-        gr.Examples(
-            examples=[
-                [False, None, "سلام بر شما، امیدوارم روز خوبی داشته باشید.", "با لحنی گرم و صمیمی.", "Zephyr", 0.85],
-                [False, None, "این یک آزمایش برای بررسی کیفیت صدای تولید شده توسط هوش مصنوعی آلفا است. امیدوارم از نتیجه راضی باشید.", "با صدایی طبیعی و روان.", "Charon", 0.9],
-                [False, None, "آیا می‌توانم سوالی از شما بپرسم؟ لطفاً راهنمایی کنید.", "با کنجکاوی", "Puck", 0.95],
-                # یک نمونه طولانی‌تر برای تست تقسیم به چند قطعه و چرخش کلید
-                [False, None,
-                 "این یک متن بسیار طولانی است که به احتمال زیاد به چندین قطعه تقسیم خواهد شد. هدف از این نمونه، بررسی عملکرد صحیح تقسیم متن و همچنین آزمایش مکانیزم چرخش کلید API در صورتی که سهمیه یک کلید در حین پردازش تمام شود، می‌باشد. امیدواریم که برنامه بتواند به طور خودکار به کلید بعدی سوئیچ کرده و فرآیند تولید صدا را با موفقیت به اتمام برساند. این بخش اول است. این بخش دوم است. و این هم بخش سوم برای طولانی‌تر کردن متن.",
-                 "با لحنی آرام و واضح", "Achird", 0.8],
-            ],
-            inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ],
-            outputs=[output_audio],
-            fn=gradio_tts_interface,
-            cache_examples=False
-        )
-    gr.Markdown("<p class='app-footer-final'>Alpha Language Learning © 2024</p>")
 if __name__ == "__main__":
-    if NUM_API_KEYS > 0 :
         demo.launch()
-    else:
-        _log("🔴 برنامه به دلیل عدم وجود کلید API جیمینای اجرا نشد. لطفاً Secrets را بررسی کنید.")

 import struct
 import time
 import zipfile
+# --- START: تغییر نحوه Import برای google-generativeai ---
+try:
+    import google.generativeai as genai # روش پیشنهادی برای import
+    from google.generativeai import types # اگر از types استفاده می‌کنید، به همین شکل باقی بماند
+    from google.api_core import exceptions as google_exceptions
+    GOOGLE_LIBS_AVAILABLE = True
+except ImportError as e:
+    print(f"❌ خطای حیاتی: عدم موفقیت در import کتابخانه‌های گوگل: {e}")
+    print("   لطفاً از صحت نصب 'google-generativeai' و 'google-api-core' در requirements.txt و ری‌استارت Space مطمئن شوید.")
+    GOOGLE_LIBS_AVAILABLE = False
+    # در ادامه برنامه، قبل از استفاده از genai و ... باید GOOGLE_LIBS_AVAILABLE را چک کنیم
+    # یا برنامه را همینجا متوقف کنیم اگر این کتابخانه‌ها حیاتی هستند.
+    # برای سادگی فعلی، فرض می‌کنیم اگر import نشوند، در ادامه با خطا مواجه می‌شویم.
+# --- END: تغییر نحوه Import ---
 try:
     from pydub import AudioSegment
     PYDUB_AVAILABLE = True
 except ImportError:
+    print("⚠️ کتابخانه pydub یافت نشد. قابلیت ادغام فایل‌های صوتی غیرفعال خواهد بود.")
     PYDUB_AVAILABLE = False
 # --- START: منطق چرخش API Key ---
   i += 1
 NUM_API_KEYS = len(GEMINI_API_KEYS)
 CURRENT_KEY_INDEX_GLOBAL = 0
 def _log(message):
     print(f"[لاگ آلفا TTS] {message}")
+if not GOOGLE_LIBS_AVAILABLE:
+    _log("🔴 به دلیل عدم بارگذاری کتابخانه‌های اصلی گوگل، عملکرد برنامه مختل خواهد شد.")
 if NUM_API_KEYS == 0:
+  _log("⛔️ هشدار: هیچ Secret با نام GEMINI_API_KEY_n یافت نشد! برنامه بدون کلید API کار نخواهد کرد.")
 else:
   _log(f"✅ تعداد {NUM_API_KEYS} کلید API جیمینای بارگذاری شد.")
 def get_api_key_for_attempt(attempt_within_request):
   if NUM_API_KEYS == 0:
+    return None, -1, -1
   actual_key_index_in_list = (CURRENT_KEY_INDEX_GLOBAL + attempt_within_request) % NUM_API_KEYS
   key_to_use = GEMINI_API_KEYS[actual_key_index_in_list]
+  key_display_number = actual_key_index_in_list + 1
   return key_to_use, key_display_number, actual_key_index_in_list
 def advance_global_key_index_for_next_request():
     global CURRENT_KEY_INDEX_GLOBAL
     if NUM_API_KEYS > 0:
         CURRENT_KEY_INDEX_GLOBAL = (CURRENT_KEY_INDEX_GLOBAL + 1) % NUM_API_KEYS
 ]
 FIXED_MODEL_NAME = "gemini-2.5-flash-preview-tts"
 DEFAULT_MAX_CHUNK_SIZE = 3800
+DEFAULT_SLEEP_BETWEEN_REQUESTS = 6 # کمی کاهش یافته
+RETRY_SLEEP_AFTER_QUOTA_ERROR = 2
 DEFAULT_OUTPUT_FILENAME_BASE = "alpha_tts_audio"
 def save_binary_file(file_name, data):
     except Exception as e: _log(f"❌ خطا در ادغام فایل‌های صوتی: {e}"); return False
 def core_generate_audio(text_input, prompt_input, selected_voice, temperature_val):
+    if not GOOGLE_LIBS_AVAILABLE:
+        _log("❌ کتابخانه‌های گوگل بارگذاری نشده‌اند. امکان تولید صدا وجود ندارد.")
+        return None
+    if NUM_API_KEYS == 0:
+        _log("❌ هیچ کلید API برای استفاده موجود نیست.")
+        # advance_global_key_index_for_next_request() # حتی اگر کلیدی نیست، برای یکنواختی فراخوانی می‌شود
+        return None
     _log("🚀 شروع فرآیند تولید صدا...")
     output_base_name = DEFAULT_OUTPUT_FILENAME_BASE
     max_chunk, sleep_time = DEFAULT_MAX_CHUNK_SIZE, DEFAULT_SLEEP_BETWEEN_REQUESTS
     if not text_input or not text_input.strip():
         _log("❌ متن ورودی خالی است.")
+        advance_global_key_index_for_next_request()
         return None
     text_chunks = smart_text_split(text_input, max_chunk)
         return None
     generated_files = []
+    all_chunks_processed = True
     for chunk_idx, chunk_text in enumerate(text_chunks):
         chunk_processed_successfully = False
         _log(f"  🔊 پردازش قطعه {chunk_idx + 1}/{len(text_chunks)}...")
+        max_attempts_for_chunk = NUM_API_KEYS # اگر NUM_API_KEYS صفر باشد، این حلقه اجرا نمی‌شود (بالاتر هندل شده)
         for attempt_num_for_chunk in range(max_attempts_for_chunk):
             selected_api_key, key_display_num, actual_key_idx = get_api_key_for_attempt(attempt_num_for_chunk)
+            # selected_api_key در این نقطه نباید None باشد چون NUM_API_KEYS > 0 است
             _log(f"     प्रयास {attempt_num_for_chunk + 1}/{max_attempts_for_chunk} برای قطعه {chunk_idx+1} با کلید شماره {key_display_num} (...{selected_api_key[-4:]})")
             try:
+                # استفاده از `genai` که در ابتدای فایل import شده
+                client = genai.Client(api_key=selected_api_key)
                 if prompt_input and prompt_input.strip():
                     processed_prompt = prompt_input.strip()
                 else:
                     final_text_for_api = chunk_text.strip()
+                # استفاده از `types` که در ابتدای فایل import شده
                 contents = [types.Content(role="user", parts=[types.Part.from_text(text=final_text_for_api)])]
                 config = types.GenerateContentConfig(temperature=temperature_val, response_modalities=["audio"],
                     speech_config=types.SpeechConfig(voice_config=types.VoiceConfig(
                         prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_voice))))
+                fname_base = f"{output_base_name}_part{chunk_idx+1:03d}"
                 response = client.models.generate_content(model=FIXED_MODEL_NAME, contents=contents, config=config)
                 if response.candidates and response.candidates[0].content and response.candidates[0].content.parts and response.candidates[0].content.parts[0].inline_data:
                     if "audio/L" in inline_data.mime_type and ext == ".wav": data_buffer = convert_to_wav(data_buffer, inline_data.mime_type)
                     if not ext.startswith("."): ext = "." + ext
                     temp_fpath_for_chunk = f"{fname_base}{ext}"
                     if os.path.exists(temp_fpath_for_chunk):
                         try: os.remove(temp_fpath_for_chunk)
+                        except OSError: pass
                     fpath = save_binary_file(temp_fpath_for_chunk, data_buffer)
                     if fpath:
                         generated_files.append(fpath)
                         chunk_processed_successfully = True
                         _log(f"      ✅ قطعه {chunk_idx+1} با کلید شماره {key_display_num} موفقیت آمیز بود.")
+                        if chunk_idx < len(text_chunks) - 1:
+                             time.sleep(DEFAULT_SLEEP_BETWEEN_REQUESTS)
+                        break
                 else:
                     _log(f"      ⚠️ پاسخ API برای قطعه {chunk_idx+1} با کلید {key_display_num} بدون داده صوتی بود.")
+            except google_exceptions.ResourceExhausted as e_quota: # استفاده از google_exceptions
+                _log(f"      ❌ خطای سهمیه برای قطعه {chunk_idx+1} با کلید شماره {key_display_num}: {str(e_quota)[:100]}...")
+                if attempt_num_for_chunk < max_attempts_for_chunk - 1:
                     _log(f"         ... تلاش با کلید بعدی پس از {RETRY_SLEEP_AFTER_QUOTA_ERROR} ثانیه.")
                     time.sleep(RETRY_SLEEP_AFTER_QUOTA_ERROR)
                 else:
                     _log(f"      ⛔️ تمام کلیدهای API برای قطعه {chunk_idx+1} امتحان شدند و ناموفق بودند (خطای سهمیه).")
+                    all_chunks_processed = False
             except Exception as e_general:
+                _log(f"      ❌ خطای عمومی در تولید قطعه {chunk_idx+1} با کلید {key_display_num}: {str(e_general)[:150]}")
                 if attempt_num_for_chunk < max_attempts_for_chunk - 1:
+                     time.sleep(RETRY_SLEEP_AFTER_QUOTA_ERROR)
                 else:
+                    all_chunks_processed = False
             if chunk_processed_successfully:
+                break
         if not chunk_processed_successfully:
             _log(f"  ⛔️ پردازش قطعه {chunk_idx+1} پس از {max_attempts_for_chunk} تلاش ناموفق بود.")
             all_chunks_processed = False
+            break
+    advance_global_key_index_for_next_request()
     if not all_chunks_processed or not generated_files:
+        _log("❌ هیچ فایل صوتی معتبری تولید نشد.")
+        for fp in generated_files: # پاک کردن فایل‌های جزئی ایجاد شده
             try: os.remove(fp)
             except: pass
         return None
     final_audio_file = None
     final_output_path_base = f"{DEFAULT_OUTPUT_FILENAME_BASE}_final"
                          _log(f"خطا در تغییر نام اولین قطعه (پس از ادغام ناموفق): {e_rename}")
                          final_audio_file = generated_files[0]
+            for fp_cleanup in generated_files: # پاک کردن فایل‌های جزئی
                 if final_audio_file and os.path.abspath(fp_cleanup) == os.path.abspath(final_audio_file):
                     continue
                 try: os.remove(fp_cleanup)
                         try: os.remove(generated_files[i_gf])
                         except: pass
                 except Exception as e_rename_single:
+                    _log(f"خطا در تغییر نام اولین قطعه (بدون pydub): {e_rename_single}")
                     final_audio_file = generated_files[0]
     elif len(generated_files) == 1:
         try:
         _log(f"⚠️ فایل نهایی '{final_audio_file}' پس از پردازش وجود ندارد!")
         return None
     else:
         _log(f"❓ وضعیت نامشخص برای فایل نهایی.")
         return None
         actual_text = text_to_speak
         if not actual_text or not actual_text.strip(): _log("❌ متن ورودی برای تبدیل خالی است."); return None
+    if not GOOGLE_LIBS_AVAILABLE: # بررسی اولیه
+        gr.Warning("خطای سیستمی: کتابخانه‌های مورد نیاز گوگل بارگذاری نشده‌اند. لطفاً با پشتیبانی تماس بگیرید.")
+        return None
+    if NUM_API_KEYS == 0:
+        gr.Warning("خطای سیستمی: هیچ کلید API برای پردازش موجود نیست. لطفاً تنظیمات را بررسی کنید.")
         return None
     final_path = core_generate_audio(actual_text, speech_prompt, speaker_voice, temperature)
+    if final_path is None:
+        gr.Info("متاسفانه در حال حاضر امکان تولید صدا وجود ندارد. لطفاً دقایقی دیگر مجدداً تلاش کنید یا با متن کوتاه‌تری امتحان کنید.")
     return final_path
+# --- CSS ---
 custom_css_inspired_by_image = f"""
 @import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;700;800&display=swap');
 :root {{
     --app-font: 'Vazirmatn', sans-serif;
+    --app-header-grad-start: #2980b9;
+    --app-header-grad-end: #2ecc71;
     --app-panel-bg: #FFFFFF;
     --app-input-bg: #F7F7F7;
     --app-button-bg: #2979FF;
 .main-content-panel-alpha {{ padding: 1.8rem 1.5rem; max-width: 680px; margin: -2.5rem auto 2rem auto; width: 90%; background-color: var(--app-panel-bg); border-radius: var(--radius-card); box-shadow: var(--shadow-card); position:relative; z-index:10; }}
 @media (max-width: 768px) {{ .main-content-panel-alpha {{ width: 95%; padding: 1.5rem 1rem; margin-top: -2rem; }} .app-header-alpha h1 {{font-size:2em;}} .app-header-alpha p {{font-size:1em;}} }}
 footer {{display:none !important;}}
 .gr-button.generate-button-final {{ background: var(--app-button-bg) !important; color: white !important; border:none !important; border-radius: var(--radius-input) !important; padding: 0.8rem 1.5rem !important; font-weight: 700 !important; font-size:1.05em !important; transition: all 0.3s ease; box-shadow: var(--shadow-button); width:100%; margin-top:1.5rem !important; }}
 .gr-button.generate-button-final:hover {{ filter: brightness(1.1); transform: translateY(-2px); box-shadow: 0 6px 12px -3px rgba(41,121,255,0.6);}}
 .gr-input > label + div > textarea, .gr-dropdown > label + div > div > input, .gr-dropdown > label + div > div > select, .gr-textbox > label + div > textarea, .gr-file > label + div {{ border-radius: var(--radius-input) !important; border: 1px solid var(--app-border-color) !important; background-color: var(--app-input-bg) !important; box-shadow: inset 0 1px 2px rgba(0,0,0,0.05); padding: 0.75rem !important; }}
 label[for*="speech_prompt_alpha_v3"] > .label-text::before {{ content: '🗣️'; }}
 label[for*="speaker_voice_alpha_v3"] > .label-text::before {{ content: '🎤'; }}
 label[for*="temperature_slider_alpha_v3"] > .label-text::before {{ content: '🌡️'; }}
 #output_audio_player_alpha_v3 audio {{ width: 100%; border-radius: var(--radius-input); margin-top:0.8rem; }}
 .temp_description_class_alpha_v3 {{ font-size: 0.85em; color: #777; margin-top: -0.4rem; margin-bottom: 1rem; }}
 .app-footer-final {{text-align:center;font-size:0.9em;color: var(--app-text-secondary);opacity:0.8; margin-top:3rem;padding:1.5rem 0; border-top:1px solid var(--app-border-color);}}
 </div>
 """
+# --- Gradio UI ---
+# فقط در صورتی که کتابخانه اصلی گوگل بارگذاری شده باشد، UI را بساز
+if GOOGLE_LIBS_AVAILABLE:
+    with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn")]), css=custom_css_inspired_by_image, title="آلفا TTS") as demo:
+        gr.HTML(alpha_header_html_v3)
+        with gr.Column(elem_classes=["main-content-panel-alpha"]):
+            use_file_input_cb = gr.Checkbox(label="📄 استفاده از فایل متنی (.txt)", value=False, elem_id="use_file_cb_alpha_v3")
+            uploaded_file_input = gr.File(
+                label=" ",
+                file_types=['.txt'],
+                visible=False,
+                elem_id="file_uploader_alpha_main_v3"
+            )
+            text_to_speak_tb = gr.Textbox(
+                label="متن فارسی برای تبدیل",
+                placeholder="مثال: سلام، فردا هوا چطور است؟",
+                lines=5,
+                value="",
+                visible=True,
+                elem_id="text_input_main_alpha_v3"
+            )
+            use_file_input_cb.change(
+                fn=lambda x: (gr.update(visible=x, label=" " if x else "متن فارسی برای تبدیل"), gr.update(visible=not x)),
+                inputs=use_file_input_cb,
+                outputs=[uploaded_file_input, text_to_speak_tb]
+            )
+            speech_prompt_tb = gr.Textbox(
+                label="سبک گفتار (اختیاری)",
+                placeholder="مثال: ب�� لحنی شاد و پرانرژی",
+                value="با لحنی دوستانه و رسا صحبت کن.",
+                lines=2, elem_id="speech_prompt_alpha_v3"
+            )
+            speaker_voice_dd = gr.Dropdown(
+                SPEAKER_VOICES, label="انتخاب گوینده و لهجه", value="Charon", elem_id="speaker_voice_alpha_v3"
+            )
+            temperature_slider = gr.Slider(
+                minimum=0.1, maximum=1.5, step=0.05, value=0.9, label="میزان خلاقیت صدا",
+                elem_id="temperature_slider_alpha_v3"
+            )
+            gr.Markdown("<p class='temp_description_class_alpha_v3'>مقادیر بالاتر = تنوع بیشتر، مقادیر پایین‌تر = یکنواختی بیشتر.</p>")
+            generate_button = gr.Button("🚀 تولید و پخش صدا", elem_classes=["generate-button-final"], elem_id="generate_button_alpha_v3")
+            output_audio = gr.Audio(label=" ", type="filepath", elem_id="output_audio_player_alpha_v3")
+            generate_button.click(
+                fn=gradio_tts_interface,
+                inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ],
+                outputs=[output_audio]
+            )
+            gr.Markdown("<h3 class='section-title-main-alpha' style='margin-top:2.5rem; text-align:center; border-bottom:none;'>نمونه‌های کاربردی</h3>", elem_id="examples_section_title_v3")
+            gr.Examples(
+                examples=[
+                    [False, None, "سلام بر شما، امیدوارم روز خوبی داشته باشید.", "با لحنی گرم و صمیمی.", "Zephyr", 0.85],
+                    [False, None, "این یک آزمایش برای بررسی کیفیت صدای تولید شده توسط هوش مصنوعی آلفا است. امیدوارم از نتیجه راضی باشید.", "با صدایی طبیعی و روان.", "Charon", 0.9],
+                    [False, None, "آیا می‌توانم سوالی از شما بپرسم؟ لطفاً راهنمایی کنید.", "با کنجکاوی", "Puck", 0.95],
+                    [False, None,
+                    "این یک متن بسیار طولانی است که به احتمال زیاد به چندین قطعه تقسیم خواهد شد. هدف از این نمونه، بررسی عملکرد صحیح تقسیم متن و همچنین آزمایش مک��نیزم چرخش کلید API در صورتی که سهمیه یک کلید در حین پردازش تمام شود، می‌باشد. امیدواریم که برنامه بتواند به طور خودکار به کلید بعدی سوئیچ کرده و فرآیند تولید صدا را با موفقیت به اتمام برساند. این بخش اول است. این بخش دوم است. و این هم بخش سوم برای طولانی‌تر کردن متن.",
+                    "با لحنی آرام و واضح", "Achird", 0.8],
+                ],
+                inputs=[ use_file_input_cb, uploaded_file_input, text_to_speak_tb, speech_prompt_tb, speaker_voice_dd, temperature_slider ],
+                outputs=[output_audio],
+                fn=gradio_tts_interface,
+                cache_examples=False
+            )
+        gr.Markdown("<p class='app-footer-final'>Alpha Language Learning © 2024</p>")
+# --- Launch ---
 if __name__ == "__main__":
+    if GOOGLE_LIBS_AVAILABLE and NUM_API_KEYS > 0: # فقط در صورتی که کتابخانه و کلیدها موجود باشند اجرا کن
         demo.launch()
+    elif not GOOGLE_LIBS_AVAILABLE:
+        _log("🔴 برنامه به دلیل عدم بارگذاری کتابخانه‌های گوگل اجرا نشد. requirements.txt و لاگ‌های Build را بررسی کنید.")
+        # می‌توانید یک UI ساده با پیام خطا با Gradio نمایش دهید
+        with gr.Blocks() as error_demo:
+            gr.Markdown("# خطای سیستمی \n\n متاسفانه برنامه به دلیل مشکلات فنی در بارگذاری کتابخانه‌های اصلی قادر به اجرا نیست. لطفاً با مدیر سیستم تماس بگیرید.")
+        error_demo.launch()
+    elif NUM_API_KEYS == 0:
+        _log("🔴 برنامه به دلیل عدم وجود کلید API جیمینای اجرا نشد. لطفاً Secrets را بررسی کنید.")
+        with gr.Blocks() as error_demo:
+            gr.Markdown("# خطای پیکربندی \n\n هیچ کلید API معتبری برای سرویس Gemini یافت نشد. لطفاً از تنظیم صحیح Secrets مطمئن شوید.")
+        error_demo.launch()