Spaces:

Hamed744
/

Ttspro

Running

App Files Files Community

Hamed744 commited on Jun 4

Commit

b62be89

verified ·

1 Parent(s): 2757c04

Update app.py

Browse files

Files changed (1) hide show

app.py +341 -394

app.py CHANGED Viewed

@@ -6,11 +6,11 @@ import re
 import struct
 import time
 import zipfile
-import google.generativeai as genai
-from google.generativeai import types
-import traceback
 # خواندن کلید API از Hugging Face Secrets
 HF_GEMINI_API_KEY = os.environ.get("GEMINI_API_KEY")
 try:
@@ -19,48 +19,64 @@ try:
 except ImportError:
     PYDUB_AVAILABLE = False
     print("⚠️ کتابخانه pydub در دسترس نیست. قابلیت ادغام فایل‌های صوتی غیرفعال خواهد بود.")
 # --- ثابت‌ها ---
-SPEAKER_VOICES = [ # لیست کامل گوینده‌ها از کد اولیه شما
-    "Achird", "Zubenelgenubi", "Vindemiatrix", "Sadachbia", "Sadaltager", "Sulafat",
-    "Laomedeia", "Achernar", "Alnilam", "Schedar", "Gacrux", "Pulcherrima",
-    "Umbriel", "Algieba", "Despina", "Erinome", "Algenib", "Rasalthgeti",
-    "Orus", "Aoede", "Callirrhoe", "Autonoe", "Enceladus", "Iapetus",
-    "Zephyr", "Puck", "Charon", "Kore", "Fenrir", "Leda"
-]
-# **بازگشت به نام مدل‌های اصلی TTS شما**
-MODELS = ["gemini-2.5-flash-preview-tts", "gemini-2.5-pro-preview-tts"]
-MODEL_NAMES_FARSI = {
-    "gemini-2.5-flash-preview-tts": "جمینای ۲.۵ فلش (اختصاصی TTS، سریع)", # نام اصلی
-    "gemini-2.5-pro-preview-tts": "جمینای ۲.۵ پرو (اختصاصی TTS، کیفیت بالا)"  # نام اصلی
 }
-SPEAKER_VOICES_FARSI_SAMPLE = { # نمونه نام‌های فارسی برای گوینده‌ها
-    "Charon": "شارون (مردانه، پیش‌فرض)", "Achernar": "آخرالنهر (مردانه)",
-    "Vindemiatrix": "ویندمیاتريکس (زنانه)", "Schedar": "صدر (مردانه)",
-    "Laomedeia": "لائومدیا (زنانه)", "Sulafat": "سولافات (مردانه)"
-    # ... می‌توانید برای همه گوینده‌ها نام فارسی تعریف کنید
 }
 # --- توابع کمکی ---
 def save_binary_file(file_name, data):
     abs_file_name = os.path.abspath(file_name)
     try:
-        with open(abs_file_name, "wb") as f: f.write(data)
-        print(f"✅ فایل در مسیر ذخیره شد: {abs_file_name}"); return abs_file_name
-    except Exception as e: print(f"❌ خطا در ذخیره فایل {abs_file_name}: {e}"); return None
 def convert_to_wav(audio_data: bytes, mime_type: str) -> bytes:
     parameters = parse_audio_mime_type(mime_type)
-    bits_per_sample, rate, num_channels = parameters["bits_per_sample"], parameters["rate"], 1
-    data_size = len(audio_data); bytes_per_sample = bits_per_sample // 8
-    block_align = num_channels * bytes_per_sample; byte_rate = rate * block_align
     chunk_size = 36 + data_size
-    return struct.pack("<4sI4s4sIHHIIHH4sI", b"RIFF", chunk_size, b"WAVE", b"fmt ", 16, 1, num_channels, rate, byte_rate, block_align, bits_per_sample, b"data", data_size) + audio_data
 def parse_audio_mime_type(mime_type: str) -> dict[str, int | None]:
-    bits_per_sample, rate = 16, 24000
     if mime_type:
-        mime_type_lower = mime_type.lower(); parts = mime_type_lower.split(";")
         for param in parts:
             param = param.strip()
             if param.startswith("rate="):
@@ -68,455 +84,386 @@ def parse_audio_mime_type(mime_type: str) -> dict[str, int | None]:
                 except: pass
             elif param.startswith("audio/l"):
                 try:
-                    potential_bits = param.split("l", 1)[1].split(";",1)[0]
                     if potential_bits.isdigit(): bits_per_sample = int(potential_bits)
                 except: pass
     return {"bits_per_sample": bits_per_sample, "rate": rate}
 def load_text_from_gr_file(file_obj):
-    if file_obj is None: return "", "فایلی برای ورودی متن ارائه نشده است."
     try:
-        with open(file_obj.name, 'r', encoding='utf-8') as f: content = f.read().strip()
-        if not content: return "", "فایل متنی خالی است."
         return content, f"متن با موفقیت از فایل '{os.path.basename(file_obj.name)}' ({len(content)} کاراکتر) بارگذاری شد."
-    except Exception as e: return "", f"خطا در خواندن فایل متنی: {e}"
-# ** تابع smart_text_split با استفاده از max_chunk_size ورودی **
-def smart_text_split(text, max_chunk_size=3800):
-    if not text: return []
-    if len(text) <= max_chunk_size:
-        return [text.strip()]
-    chunks = []
-    current_chunk = ""
-    # تقسیم بر اساس جملات (با پشتیبانی از علائم نگارشی فارسی و انگلیسی)
     sentences = re.split(r'(?<=[.!?؟])\s+', text)
     for sentence in sentences:
-        sentence = sentence.strip()
-        if not sentence:
-            continue
-        # اگر اضافه کردن جمله فعلی از حد مجاز بیشتر شود
-        if len(current_chunk) + len(sentence) + (1 if current_chunk else 0) > max_chunk_size:
-            # اگر current_chunk چیزی دارد، آن را اضافه کن
-            if current_chunk:
-                chunks.append(current_chunk)
                 current_chunk = ""
-            # اگر خود جمله هم از حد مجاز طولانی‌تر است، آن را بشکن
-            if len(sentence) > max_chunk_size:
-                # تقسیم جمله طولانی به قطعات کوچکتر
-                for i in range(0, len(sentence), max_chunk_size):
-                    chunks.append(sentence[i:i + max_chunk_size].strip())
-            else:
-                current_chunk = sentence # شروع چانک جدید با این جمله
-        else:
-            # اضافه کردن جمله به چانک فعلی
-            if current_chunk:
-                current_chunk += " " + sentence
-            else:
-                current_chunk = sentence
-    # اضافه کردن آخرین چانک اگر چیزی باقی مانده باشد
-    if current_chunk:
-        chunks.append(current_chunk)
-    return [c for c in chunks if c] # حذف چانک‌های خالی احتمالی
 def merge_audio_files_func(file_paths, output_path):
     if not PYDUB_AVAILABLE: return False, "pydub در دسترس نیست. امکان ادغام فایل‌ها وجود ندارد.", None
-    if not file_paths: return False, "هیچ فایل صوتی برای ادغام وجود ندارد.", None
     try:
         combined = AudioSegment.empty()
-        for i, file_path in enumerate(file_paths):
-            if os.path.exists(file_path):
                 try:
-                    audio = AudioSegment.from_file(file_path)
                     combined += audio
                     if i < len(file_paths) - 1: combined += AudioSegment.silent(duration=200)
                 except Exception as e_load:
-                    msg = f"خطا در بارگذاری فایل صوتی '{os.path.basename(file_path)}' با pydub: {e_load}"
-                    print(f"⚠️ {msg}"); return False, msg, None
-            else:
-                msg = f"فایل برای ادغام یافت نشد: {os.path.basename(file_path)}"
-                print(f"⚠️ {msg}"); return False, msg, None
         abs_output_path = os.path.abspath(output_path)
         combined.export(abs_output_path, format="wav")
-        return True, f"فایل ادغام شده با موفقیت در '{os.path.basename(abs_output_path)}' (فرمت WAV) ذخیره شد.", abs_output_path
-    except Exception as e:
-        msg = f"خطا در ادغام فایل‌ها: {e}"
-        print(f"❌ {msg}"); return False, msg, None
 def create_zip_file(file_paths, zip_name):
     abs_zip_name = os.path.abspath(zip_name)
     try:
         with zipfile.ZipFile(abs_zip_name, 'w') as zipf:
-            for file_path in file_paths:
-                if os.path.exists(file_path):
-                    zipf.write(file_path, os.path.basename(file_path))
-        return True, f"فایل ZIP با نام '{os.path.basename(abs_zip_name)}' ایجاد شد.", abs_zip_name
     except Exception as e: return False, f"خطا در ایجاد فایل ZIP: {e}", None
 # --- تابع اصلی تولید صدا ---
 def generate_audio_for_gradio(
-    use_file_input_checkbox, text_file_obj, speech_prompt_input, text_to_speak_input,
-    max_chunk_size_from_slider, # ** استفاده از مقدار اسلایدر **
-    sleep_slider, temperature_slider, model_dropdown_key,
-    speaker_dropdown, output_filename_base_input, merge_checkbox, delete_partials_checkbox,
     progress=gr.Progress(track_tqdm=True)
 ):
-    status_messages = ["🚀 فرآیند تبدیل متن به گفتار آغاز شد..."]
     progress(0, desc="در حال آماده‌سازی...")
     api_key_to_use = HF_GEMINI_API_KEY
     if not api_key_to_use:
-        status_messages.extend(["❌ خطا: کلید API جمینای (GEMINI_API_KEY) در تنظیمات Secret این Space یافت نشد.",
-                                "⬅️ لطفاً آن را در بخش Settings > Secrets مربوط به این Space تنظیم کنید."])
         return None, None, "\n".join(status_messages)
-    genai.configure(api_key=api_key_to_use)
-    status_messages.append("🔑 کلید API با موفقیت از Secrets بارگذاری و برای استفاده تنظیم شد.")
-    actual_text_input = ""
     if use_file_input_checkbox:
         if text_file_obj is None:
-            status_messages.append("❌ خطا: گزینه 'استفاده از فایل متنی' انتخاب شده، اما هیچ فایلی آپلود نشده است.")
             return None, None, "\n".join(status_messages)
         actual_text_input, msg = load_text_from_gr_file(text_file_obj)
-        status_messages.append(msg)
-        if not actual_text_input: return None, None, "\n".join(status_messages)
     else:
         actual_text_input = text_to_speak_input
-        status_messages.append("⌨️ از متن وارد شده به صورت دستی استفاده می‌شود.")
-    if not actual_text_input or actual_text_input.strip() == "":
-        status_messages.append("❌ خطا: متن ورودی خالی است."); return None, None, "\n".join(status_messages)
-    status_messages.append("✅ کلاینت جمینای (از طریق genai.configure) آماده است.")
-    # ** استفاده از max_chunk_size_from_slider **
-    text_chunks = smart_text_split(actual_text_input, int(max_chunk_size_from_slider))
-    status_messages.append(f"📊 متن به {len(text_chunks)} قطعه تقسیم شد (حداکثر {max_chunk_size_from_slider} کاراکتر در هر قطعه).")
-    for i, chunk_text_content in enumerate(text_chunks): status_messages.append(f"  📝 قطعه {i+1}: {len(chunk_text_content)} کاراکتر")
-    generated_audio_files = []
-    run_id = base64.urlsafe_b64encode(os.urandom(6)).decode()
-    temp_output_dir = f"temp_audio_{run_id}"; os.makedirs(temp_output_dir, exist_ok=True)
     output_base_name_safe = re.sub(r'[\s\\\/\:\*\?\"\<\>\|\%]+', '_', output_filename_base_input)
     total_chunks = len(text_chunks)
     for i, chunk_text_content in enumerate(text_chunks):
-        progress(0.1 + (0.7 * (i / total_chunks)), desc=f"در حال تولید قطعه {i+1} از {total_chunks}...")
-        status_messages.append(f"\n🔊 در حال تولید صدا برای قطعه {i+1}/{total_chunks} با مدل '{model_dropdown_key}'...")
-        text_for_tts_api = chunk_text_content
-        if speech_prompt_input.strip():
-            # نحوه صحیح ترکیب پرامپت با متن اصلی برای مدل‌های TTS باید طبق مستندات باشد.
-            # این روش ساده ممکن است برای برخی مدل‌ها کار کند:
-            text_for_tts_api = f"Prompt: \"{speech_prompt_input}\"\n\nText: \"{chunk_text_content}\""
-            status_messages.append(f"ℹ️ اعمال پرامپت سبک: '{speech_prompt_input}'")
-        # با بازگشت به مدل‌های اختصاصی TTS، ساختار contents و generation_config باید مطابق انتظار آن‌ها باشد.
-        # ** این ساختار از کد اولیه شما گرفته شده است و باید با مدل‌های *-preview-tts کار کند **
-        contents_for_api = [
-            types.Content(
-                role="user", # یا "model" اگر پرامپت سبک به عنوان بخشی از تاریخچه چت در نظر گرفته شود
-                parts=[
-                    types.Part.from_text(text=text_for_tts_api),
-                ],
-            ),
-        ]
-        generation_config = types.GenerateContentConfig( # استفاده از GenerateContentConfig
             temperature=float(temperature_slider),
-            response_modalities=["audio"], # درخواست خروجی صوتی
-            speech_config=types.SpeechConfig( # ** ارسال speech_config **
                 voice_config=types.VoiceConfig(
-                    prebuilt_voice_config=types.PrebuiltVoiceConfig(
-                        voice_name=speaker_dropdown
-                    )
                 )
-            ),
         )
-        status_messages.append(f"ℹ️ تنظیمات گفتار: گوینده '{speaker_dropdown}'")
         try:
-            chunk_filename_base = f"{output_base_name_safe}_part_{i+1:03d}"
-            chunk_filepath_prefix = os.path.join(temp_output_dir, chunk_filename_base)
-            audio_data_received = False
-            model_instance = genai.GenerativeModel(model_dropdown_key)
-            # استفاده از استریم با generation_config که شامل speech_config است
-            for stream_response_chunk in model_instance.generate_content_stream(
-                contents=contents_for_api, # ارسال contents ساخته شده
-                generation_config=generation_config # ارسال generation_config ساخته شده
             ):
-                if (stream_response_chunk.candidates and stream_response_chunk.candidates[0].content and
-                    stream_response_chunk.candidates[0].content.parts and
-                    stream_response_chunk.candidates[0].content.parts[0].inline_data):
-                    inline_data = stream_response_chunk.candidates[0].content.parts[0].inline_data
                     data_buffer, api_mime_type = inline_data.data, inline_data.mime_type
                     audio_data_received = True
                     status_messages.append(f"ℹ️ MIME Type دریافتی از API: {api_mime_type}")
-                    file_extension = ".wav"
                     if api_mime_type and ("mp3" in api_mime_type.lower() or "mpeg" in api_mime_type.lower()):
-                        file_extension = ".mp3"; status_messages.append(f"ℹ️ ذخیره با فرمت MP3: {api_mime_type}")
                     elif api_mime_type and "wav" in api_mime_type.lower() and not ("audio/l16" in api_mime_type.lower() or "audio/l24" in api_mime_type.lower()):
-                        file_extension = ".wav"; status_messages.append(f"ℹ️ ذخیره با فرمت WAV: {api_mime_type}")
                     else:
-                        status_messages.append(f"ℹ️ تبدیل به فرمت WAV برای MIME Type: {api_mime_type or 'نامشخص'}")
                         data_buffer = convert_to_wav(data_buffer, api_mime_type)
-                    status_messages.append(f"ℹ️ پسوند فایل نهایی: {file_extension}")
-                    generated_file_path = save_binary_file(f"{chunk_filepath_prefix}{file_extension}", data_buffer)
-                    if generated_file_path:
-                        generated_audio_files.append(generated_file_path)
-                        status_messages.append(f"✅ قطعه {i+1} ذخیره شد: {os.path.basename(generated_file_path)}")
                     else: status_messages.append(f"❌ عدم موفقیت در ذخیره قطعه {i+1}.")
                     break
-                elif stream_response_chunk.text: status_messages.append(f"ℹ️ پیام متنی از API (حین استریم): {stream_response_chunk.text}")
             if not audio_data_received:
-                status_messages.append(f"❌ هیچ داده صوتی برای قطعه {i+1} دریافت نشد.")
-                if 'stream_response_chunk' in locals() and stream_response_chunk and \
-                   hasattr(stream_response_chunk, 'prompt_feedback') and stream_response_chunk.prompt_feedback and \
-                   hasattr(stream_response_chunk.prompt_feedback, 'block_reason') and stream_response_chunk.prompt_feedback.block_reason:
-                    status_messages.append(f"🛑 دلیل مسدود شدن (از بازخورد پرامپت): "
-                                           f"{stream_response_chunk.prompt_feedback.block_reason_message or stream_response_chunk.prompt_feedback.block_reason}")
-        except Exception as e:
-            is_quota_error = False
-            # نام کلاس‌های خطا در کتابخانه google-generativeai ممکن است کمی متفاوت باشد.
-            # BlockedPromptError و StopCandidateException معمولاً در types.generation_types یا مستقیماً types هستند.
-            if hasattr(types, 'BlockedPromptError') and isinstance(e, types.BlockedPromptError):
-                status_messages.append(f"❌ محتوای قطعه {i+1} توسط API مسدود شد: {e}")
-            elif hasattr(types, 'StopCandidateException') and isinstance(e, types.StopCandidateException):
-                 status_messages.append(f"❌ تولید صدا برای قطعه {i+1} به دلیل پایان نامناسب متوقف شد: {e}")
-                 if hasattr(e, 'response') and hasattr(e.response, 'prompt_feedback'):
-                     status_messages.append(f"  بازخورد API: {e.response.prompt_feedback}")
-            elif isinstance(e, genai.errors.GoogleAPIError): # کلاس والد برای خطاهای API گوگل
-                status_messages.append(f"❌ خطای API گوگل در قطعه {i+1} ({type(e).__name__}): {e}")
-                # بررسی دقیق‌تر برای خطای سهمیه با استفاده از پیام خطا
-                error_message_upper = str(getattr(e, 'message', '')).upper()
-                if "QUOTA" in error_message_upper or "RESOURCE_EXHAUSTED" in error_message_upper:
-                     status_messages.append("🚫 شما از سهمیه رایگان/فعلی خود برای این مدل فراتر رفته‌اید. لطفاً طرح خود را بررسی کنید یا بعداً دوباره امتحان نمایید.")
-                     is_quota_error = True
-                elif hasattr(e, 'message'):
-                     status_messages.append(f"   پیام خطا از API: {e.message}")
-                status_messages.append(traceback.format_exc())
-            else:
-                status_messages.extend([f"❌ خطا در تولید/پردازش قطعه {i+1}: {type(e).__name__} - {e}", traceback.format_exc()])
-            if is_quota_error and model_dropdown_key.endswith("-pro-preview-tts"):
-                status_messages.append("💡 پیشنهاد: از مدل 'جمینای فلش' که محدودیت کمتری دارد استفاده کنید یا برای استفاده از مدل پرو، طرح خود را در گوگل ارتقا دهید.")
-        if not audio_data_received and i < total_chunks -1 :
-             status_messages.append(f"⚠️ به دلیل خطا در قطعه {i+1}، ادامه تولید سایر قطعات ممکن است با مشکل مواجه شود.")
-        if i < total_chunks - 1 and float(sleep_slider) > 0 :
-            status_messages.append(f"⏱️ انتظار به مدت {sleep_slider} ثانیه..."); time.sleep(float(sleep_slider))
-    progress(0.85, desc="پردازش فایل‌های نهایی...")
     if not generated_audio_files:
         status_messages.append("❌ هیچ فایل صوتی با موفقیت تولید یا ذخیره نشد!")
-        progress(1, desc="پایان با خطا."); return None, None, "\n".join(status_messages)
-    status_messages.append(f"\n🎉 {len(generated_audio_files)} فایل(های) صوتی تولید شد!")
-    output_audio_path_for_player, output_path_for_download = None, None
-    if merge_checkbox and len(generated_audio_files) > 1 and PYDUB_AVAILABLE:
-        status_messages.append(f"🔗 در حال ادغام {len(generated_audio_files)} فایل صوتی...")
-        merged_filename_path = os.path.join(temp_output_dir, f"{output_base_name_safe}_merged.wav")
-        success_merge, msg_merge, merged_p = merge_audio_files_func(generated_audio_files, merged_filename_path)
-        status_messages.append(msg_merge)
-        if success_merge:
-            output_audio_path_for_player, output_path_for_download = merged_p, merged_p
-            if delete_partials_checkbox:
-                status_messages.append("🗑️ در حال حذف فایل‌های جزئی...")
-                for file_p in generated_audio_files:
-                    try: os.remove(file_p); status_messages.append(f"  🗑️ حذف شد: {os.path.basename(file_p)}")
-                    except Exception as e_del: status_messages.append(f"  ⚠️ عدم موفقیت در حذف {os.path.basename(file_p)}: {e_del}")
         else:
-            status_messages.append("⚠️ ادغام ناموفق بود. فایل ZIP از قطعات ارائه می‌شود.")
-            success_zip, msg_zip, zip_p = create_zip_file(generated_audio_files, os.path.join(temp_output_dir, f"{output_base_name_safe}_all_parts.zip"))
-            status_messages.append(msg_zip)
-            if success_zip: output_path_for_download = zip_p
     elif len(generated_audio_files) == 1:
-        single_file_path = generated_audio_files[0]
-        output_audio_path_for_player, output_path_for_download = single_file_path, single_file_path
-        status_messages.append(f"🎵 فایل صوتی تکی: {os.path.basename(single_file_path)}")
-    elif len(generated_audio_files) > 1:
-        if not PYDUB_AVAILABLE and merge_checkbox: status_messages.append("⚠️ pydub در دسترس نیست، امکان ادغام وجود ندارد. فایل ZIP ارائه می‌شود.")
-        status_messages.append("📦 چندین قطعه تولید شد. در حال ایجاد فایل ZIP...")
-        success_zip, msg_zip, zip_p = create_zip_file(generated_audio_files, os.path.join(temp_output_dir, f"{output_base_name_safe}_all_parts.zip"))
-        status_messages.append(msg_zip)
-        if success_zip: output_path_for_download = zip_p
     final_status = "\n".join(status_messages)
     print(final_status)
-    progress(1, desc="انجام شد!")
-    return output_audio_path_for_player, output_path_for_download, final_status
-# --- تعریف CSS سفارشی ---
-FLY_PRIMARY_COLOR_HEX = "#2563EB"; FLY_SECONDARY_COLOR_HEX = "#059669"; FLY_ACCENT_COLOR_HEX = "#D97706";
-FLY_TEXT_COLOR_HEX = "#111827"; FLY_SUBTLE_TEXT_HEX = "#4B5563"; FLY_LIGHT_BACKGROUND_HEX = "#F9FAFB";
-FLY_WHITE_HEX = "#FFFFFF"; FLY_BORDER_COLOR_HEX = "#E5E7EB"; FLY_INPUT_BG_HEX = "#FFFFFF";
-custom_css_v2 = f"""
-@import url('https://fonts.googleapis.com/css2?family=Vazirmatn:wght@300;400;500;600;700;800&display=swap');
-@import url('https://fonts.googleapis.com/css2?family=Inter:wght@400;500;600;700;800&display=swap');
-:root {{
-    --font-persian: 'Vazirmatn', 'Inter', sans-serif; --font-english: 'Inter', sans-serif;
-    --primary-color: {FLY_PRIMARY_COLOR_HEX}; --secondary-color: {FLY_SECONDARY_COLOR_HEX};
-    --accent-color: {FLY_ACCENT_COLOR_HEX}; --text-color: {FLY_TEXT_COLOR_HEX};
-    --subtle-text-color: {FLY_SUBTLE_TEXT_HEX}; --light-bg-color: {FLY_LIGHT_BACKGROUND_HEX};
-    --white-color: {FLY_WHITE_HEX}; --border-color: {FLY_BORDER_COLOR_HEX};
-    --input-bg-color: {FLY_INPUT_BG_HEX};
-    --radius-sm: 0.375rem; --radius-md: 0.625rem; --radius-lg: 0.875rem;
-    --shadow-sm: 0 1px 2px 0 rgba(0,0,0,0.05);
-    --shadow-md: 0 4px 8px -2px rgba(0,0,0,0.08), 0 2px 4px -2px rgba(0,0,0,0.05);
-    --shadow-lg: 0 12px 20px -4px rgba(0,0,0,0.08), 0 4px 8px -3px rgba(0,0,0,0.05);
-    --transition-ease: all 0.25s cubic-bezier(0.4, 0, 0.2, 1);
-}}
-body, .gradio-container {{ font-family: var(--font-persian); direction: rtl; background-color: var(--light-bg-color); color: var(--text-color); line-height: 1.7; font-size: 16px; scroll-behavior: smooth; }}
-.gradio-container {{ max-width: 100% !important; min-height: 100vh; margin:0 auto !important; padding:0 !important; border-radius:0 !important; box-shadow:none !important; }}
-.app-header-card {{ padding: 2.5rem 1.5rem; margin:0; background: linear-gradient(140deg, var(--primary-color) 10%, var(--secondary-color) 90%); color: var(--white-color); border-bottom-left-radius: var(--radius-lg); border-bottom-right-radius: var(--radius-lg); box-shadow: var(--shadow-lg); text-align: center; position:relative; overflow:hidden; }}
-.app-header-card::before {{ content:''; position:absolute; top:-60px; left:-60px; width:200px; height:200px; background:rgba(255,255,255,0.07); border-radius:50%; filter:blur(10px); animation: pulse-bubble 8s infinite ease-in-out; }}
-.app-header-card::after {{ content:''; position:absolute; bottom:-70px; right:-70px; width:250px; height:250px; background:rgba(255,255,255,0.05); border-radius:45% 55% 60% 40% / 40% 50% 50% 60% ; filter:blur(15px); animation: pulse-bubble 10s infinite ease-in-out reverse; }}
-@keyframes pulse-bubble {{ 0%, 100% {{ transform: scale(1); opacity: 0.05; }} 50% {{ transform: scale(1.1); opacity: 0.1; }} }}
-.app-header-card h1 {{ font-size: 2.2em !important; font-weight: 800 !important; margin-bottom: 0.6rem; text-shadow: 0 2px 5px rgba(0,0,0,0.15); animation: slideInDown 0.8s ease-out; }}
-.app-header-card .app-subtitle {{ font-size: 1.05em !important; opacity: 0.9; animation: fadeInUp 0.8s 0.2s ease-out backwards; }}
-.main-content-wrapper {{ padding: 1.5rem 1rem; width:100%; max-width: 960px; margin: -2.5rem auto 2.5rem auto; position:relative; z-index:10; }}
-.content-panel {{ background-color: var(--white-color); padding: 2rem 1.75rem; border-radius: var(--radius-lg); box-shadow: var(--shadow-xl); animation: zoomIn 0.6s ease-out; }}
-.section-title {{ font-size: 1.3em; font-weight: 700; color: var(--primary-color); margin-bottom: 1.2rem; border-bottom: 3px solid var(--primary-color); padding-bottom: 0.6rem; display:inline-block; }}
-.gr-button.lg.primary, button[variant="primary"].generate-button-main {{ background: linear-gradient(135deg, var(--accent-color) 0%, color-mix(in srgb, var(--accent-color) 80%, #A15E00) 100%) !important; color: var(--white-color) !important; font-weight: 700 !important; border-radius: var(--radius-md) !important; border: none !important; box-shadow: 0 3px 6px rgba(0,0,0,0.1), 0 1px 3px rgba(0,0,0,0.08) !important; padding: 0.85rem 1.8rem !important; font-size: 1.05em !important; transition: var(--transition-ease); transform: perspective(1px) translateZ(0); }}
-.gr-button.lg.primary:hover, button[variant="primary"].generate-button-main:hover {{ background: linear-gradient(135deg, color-mix(in srgb, var(--accent-color) 90%, black) 0%, color-mix(in srgb, var(--accent-color) 70%, #A15E00) 100%) !important; transform: translateY(-2px) scale(1.02); box-shadow: 0 6px 12px rgba(0,0,0,0.12), 0 3px 6px rgba(0,0,0,0.1) !important; }}
-.gr-input > label + div > textarea, .gr-dropdown > label + div > div > input, .gr-dropdown > label + div > div > select, .gr-textbox > label + div > textarea, .gr-number > label + div > input[type="number"] {{ border-radius: var(--radius-md) !important; border: 1.5px solid var(--border-color) !important; background-color: var(--input-bg-color) !important; padding: 0.7rem 0.85rem !important; font-size: 0.98em !important; transition: var(--transition-ease); }}
-.gr-input > label + div > textarea:focus, .gr-dropdown > label + div > div > input:focus, .gr-dropdown > label + div > div > select:focus, .gr-textbox > label + div > textarea:focus, .gr-number > label + div > input[type="number"]:focus {{ border-color: var(--primary-color) !important; box-shadow: 0 0 0 3px color-mix(in srgb, var(--primary-color) 20%, transparent) !important; background-color: var(--white-color) !important; }}
-label > .label-text {{ font-weight: 600 !important; color: var(--subtle-text-color) !important; font-size: 0.92em !important; margin-bottom: 0.4rem !important; }}
-.gr-accordion > .gr-button {{ background-color: var(--light-bg-color) !important; border-radius: var(--radius-md) !important; font-weight: 600 !important; padding: 0.6rem 0.8rem !important; transition: var(--transition-ease); border: 1px solid var(--border-color) !important; }}
-.gr-accordion > .gr-button:hover {{ background-color: color-mix(in srgb, var(--light-bg-color) 90%, var(--border-color)) !important; }}
-.gr-accordion > .gr-panel {{ background-color: color-mix(in srgb, var(--light-bg-color) 97%, var(--border-color)) !important; border-radius: var(--radius-md) !important; padding: 1.2rem !important; margin-top:0.5rem; border: 1px solid var(--border-color); transition: var(--transition-ease); }}
-.status-log-panel {{ background-color: var(--input-bg-color); border: 1px solid var(--border-color); border-radius: var(--radius-md); padding: 0.75rem 1rem; min-height: 180px; box-shadow: inset 0 1px 3px rgba(0,0,0,0.04); }}
-.status-log-panel textarea {{ background-color: transparent !important; border: none !important; font-size: 0.88em !important; color: var(--subtle-text-color); line-height:1.6; }}
-.api-warning-box {{ background-color: color-mix(in srgb, var(--accent-color) 10%, #fff) !important; color: color-mix(in srgb, var(--accent-color) 85%, black) !important; padding: 1rem 1.2rem !important; border-radius: var(--radius-md) !important; border: 1.5px solid color-mix(in srgb, var(--accent-color) 40%, transparent) !important; text-align: center !important; margin-bottom: 1.5rem !important; font-size: 0.92em !important; box-shadow: var(--shadow-sm); }}
-.success-message-box {{ background-color: color-mix(in srgb, var(--secondary-color) 10%, #fff) !important; color: color-mix(in srgb, var(--secondary-color) 85%, black) !important; padding: 1rem 1.2rem !important; border-radius: var(--radius-md) !important; border: 1.5px solid color-mix(in srgb, var(--secondary-color) 40%, transparent) !important; text-align: center !important; margin-bottom: 1.5rem !important; font-size: 0.92em !important; box-shadow: var(--shadow-sm); }}
-.app-footer-text {{ text-align: center; font-size: 0.88em; color: var(--subtle-text-color); margin-top: 3rem; padding: 1.5rem 0; border-top: 1px solid var(--border-color); }}
-footer, .gradio-footer {{ display: none !important; visibility: hidden !important; }}
-#output_audio_col, #output_download_col {{ padding-top:1.2rem; }}
-.gr-form {{ gap: 1.5rem !important; }}
-.compact-group .gr-form {{ gap: 0.9rem !important; }}
-#examples-section .gr-sample-button {{ background-color: color-mix(in srgb, var(--secondary-color) 12%, transparent) !important; color: var(--secondary-color) !important; border-radius: var(--radius-sm) !important; font-size: 0.88em !important; padding: 0.4rem 0.7rem !important; border: 1.5px solid color-mix(in srgb, var(--secondary-color) 35%, transparent) !important; margin: 0.25rem !important; transition: var(--transition-ease); }}
-#examples-section .gr-sample-button:hover {{ background-color: color-mix(in srgb, var(--secondary-color) 22%, transparent) !important; transform: translateY(-1px); box-shadow: var(--shadow-sm); }}
-#examples-separator > div > hr, #examples-separator > div > p {{ margin-top: 2rem !important; margin-bottom: 1.5rem !important; height: 1.5px !important; background-color: var(--border-color) !important; border: none !important; opacity: 0.7; font-size:0 !important; }}
-@media (max-width: 768px) {{ .main-content-wrapper {{ margin-top: -1.5rem; padding: 0.75rem; }} .content-panel {{ padding: 1.2rem; }} .app-header-card h1 {{ font-size: 1.8em !important; }} .app-header-card .app-subtitle {{ font-size: 0.95em !important; }} .section-title {{ font-size:1.15em; }} }}
-@keyframes slideInDown {{ from {{ opacity: 0; transform: translateY(-20px); }} to {{ opacity: 1; transform: translateY(0); }} }}
-@keyframes fadeInUp {{ from {{ opacity: 0; transform: translateY(20px); }} to {{ opacity: 1; transform: translateY(0); }} }}
-@keyframes zoomIn {{ from {{ opacity: 0; transform: scale(0.95); }} to {{ opacity: 1; transform: scale(1); }} }}
-"""
 # --- تعریف رابط کاربری Gradio ---
-with gr.Blocks(theme=gr.themes.Base(font=[gr.themes.GoogleFont("Vazirmatn"), "system-ui"]), css=custom_css_v2, title="آواگر جمینای - نسخه پلاس") as demo:
-    gr.HTML(f"""
-        <div class="app-header-card">
-            <h1>💎 آواگر جمینای پلاس</h1>
-            <p class="app-subtitle">تجربه نوین تبدیل متن به گفتار فارسی با هوش مصنوعی Gemini و ظاهری چشم‌نواز</p>
-        </div>
-    """)
-    with gr.Column(elem_classes="main-content-wrapper"):
-        with gr.Group(elem_classes="content-panel"):
-            if not HF_GEMINI_API_KEY:
-                gr.HTML(f"<div class='api-warning-box'>⚠️ <strong>هشدار حیاتی:</strong> کلید API جمینای (<code>GEMINI_API_KEY</code>) در Hugging Face Secrets یافت نشد. "
-                        "این ابزار برای کار کردن به این کلید نیاز دارد. لطفاً آن را در بخش 'Settings' > 'Secrets' این Space تنظیم کنید.</div>")
-            else:
-                 gr.HTML(f"<div class='success-message-box'>"
-                        "🔑 کلید API جمینای با موفقیت از Secrets بارگذاری شد. آواگر جمینای پلاس آماده خدمت‌رسانی است!</div>")
-            with gr.Row(equal_height=False):
-                with gr.Column(scale=3, min_width=320):
-                    gr.Markdown("<h3 class='section-title'>۱. متن و سبک گفتار</h3>", elem_id="input-section")
-                    use_file_cb = gr.Checkbox(label="📁 استفاده از فایل متنی (.txt) برای متن اصلی", value=False, elem_id="use-file-checkbox")
-                    text_file_upload = gr.File(label="آپلود فایل متنی شما", file_types=['.txt'], visible=False, elem_id="text-file-uploader")
-                    text_to_speak_tb = gr.Textbox(
-                        label="📝 متن اصلی برای تبدیل به گفتار:", lines=8,
-                        placeholder="متن خود را در اینجا تایپ کنید، یا از گزینه بالا فایل خود را بارگذاری نمایید...",
-                        visible=True, text_align="right", elem_id="text-input-main"
-                    )
-                    use_file_cb.change(lambda x: (gr.update(visible=x), gr.update(visible=not x)), [use_file_cb], [text_file_upload, text_to_speak_tb])
-                    speech_prompt_tb = gr.Textbox(
-                        label="🗣️ فرمان سبک گفتار (اختیاری، برای هدایت لحن و احساسات صدا)",
-                        placeholder="مثال: «با صدایی گرم و دوستانه، مانند یک معلم مهربان صحبت کن»",
-                        text_align="right", elem_id="speech-prompt-input", info="این فرمان به هوش مصنوعی کمک می‌کند تا سبک گفتار را بهتر درک کند."
-                    )
-                with gr.Column(scale=2, min_width=300):
-                    gr.Markdown("<h3 class='section-title'>۲. تنظیمات پیشرفته صدا</h3>", elem_id="settings-section")
-                    model_choices_farsi = [(MODEL_NAMES_FARSI.get(key, key), key) for key in MODELS]
-                    model_name_dd = gr.Dropdown(choices=model_choices_farsi, label="🤖 انتخاب مدل Gemini (TTS)", value=MODELS[0], elem_id="model-selector", info="مدل پرو کیفیت بالاتری دارد اما ممکن است محدودیت بیشتری داشته باشد.")
-                    speaker_choices_farsi = [(SPEAKER_VOICES_FARSI_SAMPLE.get(v, v) + f" ({v})", v) for v in SPEAKER_VOICES]
-                    speaker_voice_dd = gr.Dropdown(choices=speaker_choices_farsi, label="🎤 انتخاب صدای گوینده", value="Charon", elem_id="speaker-selector")
-                    temp_slider = gr.Slider(minimum=0.0, maximum=1.0, step=0.05, value=0.75, label="🌡️ دمای خلاقیت مدل", elem_id="temperature-slider", info="مقادیر بالاتر (نزدیک به ۱) تنوع بیشتری در صدا ایجاد می‌کنند.")
-                    with gr.Accordion("جزئیات بیشتر (تقسیم‌بندی متن و نام فایل)", open=False, elem_id="advanced-settings-accordion"):
-                        # ** اسلایدر max_chunk_size دوباره فعال شد **
-                        max_chunk_size_slider_ui = gr.Slider(minimum=1000, maximum=5000, step=100, value=3800, label="🧩 حداکثر کاراکتر در هر قطعه API (برای TTS)", elem_id="chunk-size-slider", info="مقدار پیشنهادی: ۳۰۰۰ تا ۴۰۰۰ کاراکتر.")
-                        sleep_slider = gr.Slider(minimum=0, maximum=5, step=0.25, value=0.5, label="⏱️ تاخیر بین درخواست‌ها به API (ثانیه)", elem_id="sleep-slider", info="برای جلوگیری از خطای محدودیت درخواست.")
-                        output_filename_tb = gr.Textbox(label="💾 نام پایه برای فایل‌های خروجی (انگلیسی، بدون پسوند)", value="gemini_voice_output", elem_id="output-filename-input")
-                    with gr.Group(elem_classes="compact-group", elem_id="merge-options-group"):
-                        gr.Markdown("گزینه‌های ادغام (در صورت تولید بیش از یک قطعه صوتی):", elem_id="merge-options-title")
-                        merge_cb = gr.Checkbox(label="🔗 ادغام خودکار قطعات صوتی به یک فایل WAV", value=True, visible=PYDUB_AVAILABLE, elem_id="merge-checkbox")
-                        delete_partials_cb = gr.Checkbox(label="🗑️ حذف فایل‌های قطعه‌بندی شده پس از ادغام موفق", value=True, visible=PYDUB_AVAILABLE, elem_id="delete-partials-checkbox")
-                        if PYDUB_AVAILABLE:
-                             merge_cb.change(lambda x: gr.update(visible=x), [merge_cb], [delete_partials_cb])
-                        else:
-                            gr.HTML("<div class='api-warning-box' style='background-color: #FEF3C7 !important; color: #92400E !important; border-color: #FDE68A !important; margin-top:0.5rem;'>⚠️ قابلیت ادغام فایل‌ها به دلیل عدم دسترسی به کتابخانه <code>pydub</code> غیرفعال است. صداها به صورت جداگانه ذخیره خواهند شد.</div>")
-            submit_btn = gr.Button("✨ هم‌اکنون صدا را تولید کن! ✨", variant="primary", elem_id="generate-button-main", elem_classes=["generate-button-main"])
-            with gr.Accordion("🎧 نتیجه و گزارش فرآیند 📊", open=True, elem_id="output-report-accordion"):
-                with gr.Row():
-                    with gr.Column(scale=1, elem_id="output_audio_col"):
-                        output_audio_player = gr.Audio(label="🔊 فایل صوتی نهایی (قابل پخش)", type="filepath", autoplay=True, elem_id="audio-player-output", show_label=True)
-                    with gr.Column(scale=1, elem_id="output_download_col"):
-                        output_file_downloader = gr.File(label="📁 دانلود فایل نهایی (فرمت WAV یا ZIP)", type="filepath", elem_id="file-downloader-output", show_label=True)
-                status_log_tb = gr.Textbox(label="📜 گزارش کامل وضعیت و پیام‌های سیستم:", lines=10, interactive=False, text_align="right", elem_id="status-log-textbox", elem_classes=["status-log-panel"], show_label=True)
-            submit_btn.click(
-                fn=generate_audio_for_gradio,
-                inputs=[
-                    use_file_cb, text_file_upload, speech_prompt_tb, text_to_speak_tb,
-                    max_chunk_size_slider_ui, # ** ارسال مقدار اسلایدر به تابع **
-                    sleep_slider, temp_slider,
-                    model_name_dd, speaker_voice_dd, output_filename_tb,
-                    merge_cb, delete_partials_cb
-                ],
-                outputs=[output_audio_player, output_file_downloader, status_log_tb]
             )
-            gr.Markdown("---", elem_id="examples-separator")
-            gr.Examples(
-                label="💡 چند نمونه برای شروع سریع (روی یکی کلیک کنید):",
-                examples=[ # ** مقادیر max_chunk_size در مثال‌ها به‌روز شد **
-                    [False, None, "یک راوی با صدایی گرم و دلنشین، مناسب برای کتاب صوتی.", "در زمان‌های قدیم، در سرزمینی دور، پادشاهی عادل زندگی می‌کرد که مردمش او را بسیار دوست داشتند.", 3800, 0.5, 0.75, MODELS[0], "Charon", "داستان_پادشاه", True, True],
-                    [False, None, "با لحنی پرشور و هیجان‌انگیز، مانند یک گزارشگر ورزشی.", "و گل! یک گل باورنکردنی در دقیقه‌ی نود! تماشاگران به وجد آمده‌اند!", 3500, 0.5, 0.8, MODELS[1], "Achernar", "گزارش_فوتبال", True, True],
-                ],
-                fn=generate_audio_for_gradio,
-                inputs=[ # ** ورودی max_chunk_size_slider_ui اضافه شد **
-                    use_file_cb, text_file_upload, speech_prompt_tb, text_to_speak_tb,
-                    max_chunk_size_slider_ui, sleep_slider, temp_slider,
-                    model_name_dd, speaker_voice_dd, output_filename_tb,
-                    merge_cb, delete_partials_cb
-                ],
-                outputs=[output_audio_player, output_file_downloader, status_log_tb],
-                cache_examples=False, elem_id="examples-section"
             )
-    gr.HTML("<p class='app-footer-text'>طراحی و توسعه با ❤️ توسط <a href='https://huggingface.co/Hamed744' target='_blank' style='color:var(--primary-color); text-decoration:none; font-weight:600;'>Hamed744 (AIGOLDEN)</a> | نسخه ۱.۳ آواگر جمینای پلاس</p>")
 if __name__ == "__main__":
-    if not PYDUB_AVAILABLE: print("هشدار: کتابخانه pydub نصب نشده یا کار نمی‌کند.")
-    if not HF_GEMINI_API_KEY: print("هشدار: متغیر محیطی GEMINI_API_KEY تنظیم نشده است.")
-    demo.launch(debug=os.environ.get("GRADIO_DEBUG", "False").lower() == "true", share=False)

 import struct
 import time
 import zipfile
+from google import genai
+from google.genai import types
 # خواندن کلید API از Hugging Face Secrets
+# این متغیر محیطی توسط Space در زمان اجرا اگر Secret تنظیم شده باشد، تزریق می‌شود.
 HF_GEMINI_API_KEY = os.environ.get("GEMINI_API_KEY")
 try:
 except ImportError:
     PYDUB_AVAILABLE = False
     print("⚠️ کتابخانه pydub در دسترس نیست. قابلیت ادغام فایل‌های صوتی غیرفعال خواهد بود.")
+    print("اگر ادغام فایل‌ها مد نظر است، pydub را به requirements.txt اضافه کرده و از وجود ffmpeg در محیط اطمینان حاصل کنید.")
 # --- ثابت‌ها ---
+SPEAKER_VOICES_FA = {
+    "آکیرد (زن)": "Achird", "زُبِن‌الجُنوبی (مرد)": "Zubenelgenubi", "ویندِمیاطریکس (زن)": "Vindemiatrix",
+    "سَعدالاَخبیه (مرد)": "Sadachbia", "سَعدالتَجر (زن)": "Sadaltager", "سولافات (مرد)": "Sulafat",
+    "لائومِدِیا (زن)": "Laomedeia", "آکِرنار (مرد)": "Achernar", "النِلام (زن)": "Alnilam",
+    "شِدار (مرد)": "Schedar", "گاکراکس (زن)": "Gacrux", "پولکِریما (مرد)": "Pulcherrima",
+    "آمبرِیِل (زن)": "Umbriel", "اَلجِیبا (مرد)": "Algieba", "دِسپینا (زن)": "Despina",
+    "اِرینومه (مرد)": "Erinome", "اَلجِنیب (زن)": "Algenib", "رأس‌الجاثی (مرد)": "Rasalthgeti",
+    "اوروس (زن)": "Orus", "آئوئِده (مرد)": "Aoede", "کالیرهوئه (زن)": "Callirrhoe",
+    "اوتونوئه (مرد)": "Autonoe", "اِنسِلادوس (زن)": "Enceladus", "یاپِتوس (مرد)": "Iapetus",
+    "زِفیر (زن)": "Zephyr", "پاک (مرد)": "Puck", "کارون (زن، پیش‌فرض)": "Charon",
+    "کوره (مرد)": "Kore", "فِنریر (زن)": "Fenrir", "لِدا (مرد)": "Leda"
 }
+MODELS_FA = {
+    "جمینای ۲.۵ فلش (سریع‌تر، کیفیت خوب)": "gemini-2.5-flash-preview-tts",
+    "جمینای ۲.۵ پرو (کندتر، کیفیت بالاتر)": "gemini-2.5-pro-preview-tts"
 }
+SPEAKER_VOICES_LIST = list(SPEAKER_VOICES_FA.keys())
+MODELS_LIST = list(MODELS_FA.keys())
 # --- توابع کمکی ---
 def save_binary_file(file_name, data):
     abs_file_name = os.path.abspath(file_name)
     try:
+        with open(abs_file_name, "wb") as f:
+            f.write(data)
+        print(f"✅ فایل در مسیر زیر ذخیره شد: {abs_file_name}")
+        return abs_file_name
+    except Exception as e:
+        print(f"❌ خطا در ذخیره فایل {abs_file_name}: {e}")
+        return None
 def convert_to_wav(audio_data: bytes, mime_type: str) -> bytes:
     parameters = parse_audio_mime_type(mime_type)
+    bits_per_sample = parameters["bits_per_sample"]
+    sample_rate = parameters["rate"]
+    num_channels = 1
+    data_size = len(audio_data)
+    bytes_per_sample = bits_per_sample // 8
+    block_align = num_channels * bytes_per_sample
+    byte_rate = sample_rate * block_align
     chunk_size = 36 + data_size
+    header = struct.pack(
+        "<4sI4s4sIHHIIHH4sI",
+        b"RIFF", chunk_size, b"WAVE", b"fmt ", 16, 1, num_channels,
+        sample_rate, byte_rate, block_align, bits_per_sample, b"data", data_size
+    )
+    return header + audio_data
 def parse_audio_mime_type(mime_type: str) -> dict[str, int | None]:
+    bits_per_sample = 16
+    rate = 24000
     if mime_type:
+        mime_type_lower = mime_type.lower()
+        parts = mime_type_lower.split(";")
         for param in parts:
             param = param.strip()
             if param.startswith("rate="):
                 except: pass
             elif param.startswith("audio/l"):
                 try:
+                    potential_bits = param.split("l", 1)[1]
                     if potential_bits.isdigit(): bits_per_sample = int(potential_bits)
                 except: pass
     return {"bits_per_sample": bits_per_sample, "rate": rate}
 def load_text_from_gr_file(file_obj):
+    if file_obj is None:
+        return "", "فایلی برای ورودی متن انتخاب نشده است."
     try:
+        with open(file_obj.name, 'r', encoding='utf-8') as f:
+            content = f.read().strip()
+        if not content:
+            return "", "فایل متنی خالی است."
         return content, f"متن با موفقیت از فایل '{os.path.basename(file_obj.name)}' ({len(content)} کاراکتر) بارگذاری شد."
+    except Exception as e:
+        return "", f"خطا در خواندن فایل متنی: {e}"
+def smart_text_split(text, max_size=3800):
+    if len(text) <= max_size: return [text]
+    chunks, current_chunk = [], ""
     sentences = re.split(r'(?<=[.!?؟])\s+', text)
     for sentence in sentences:
+        if not sentence: continue
+        if len(current_chunk) + len(sentence) + 1 > max_size:
+            if current_chunk: chunks.append(current_chunk.strip())
+            if len(sentence) > max_size:
+                words = sentence.split(' ')
+                temp_part = ""
+                for word in words:
+                    if len(temp_part) + len(word) + 1 > max_size:
+                        if temp_part: chunks.append(temp_part.strip())
+                        if len(word) > max_size:
+                            for i in range(0, len(word), max_size): chunks.append(word[i:i+max_size])
+                            temp_part = ""
+                        else: temp_part = word
+                    else: temp_part += (" " if temp_part else "") + word
+                if temp_part: chunks.append(temp_part.strip())
                 current_chunk = ""
+            else: current_chunk = sentence
+        else: current_chunk += (" " if current_chunk else "") + sentence
+    if current_chunk: chunks.append(current_chunk.strip())
+    return chunks
 def merge_audio_files_func(file_paths, output_path):
     if not PYDUB_AVAILABLE: return False, "pydub در دسترس نیست. امکان ادغام فایل‌ها وجود ندارد.", None
+    if not file_paths: return False, "فایل صوتی برای ادغام وجود ندارد.", None
     try:
         combined = AudioSegment.empty()
+        for i, fp in enumerate(file_paths):
+            if os.path.exists(fp):
                 try:
+                    audio = AudioSegment.from_file(fp, format=fp.split('.')[-1]) # Guess format from extension
                     combined += audio
                     if i < len(file_paths) - 1: combined += AudioSegment.silent(duration=200)
                 except Exception as e_load:
+                    return False, f"خطا در بارگذاری فایل صوتی '{os.path.basename(fp)}': {e_load}", None
+            else: return False, f"فایل برای ادغام یافت نشد: {os.path.basename(fp)}", None
         abs_output_path = os.path.abspath(output_path)
         combined.export(abs_output_path, format="wav")
+        return True, f"فایل ادغام شده با موفقیت در '{os.path.basename(abs_output_path)}' ذخیره شد.", abs_output_path
+    except Exception as e: return False, f"خطا در ادغام فایل‌ها: {e}", None
 def create_zip_file(file_paths, zip_name):
     abs_zip_name = os.path.abspath(zip_name)
     try:
         with zipfile.ZipFile(abs_zip_name, 'w') as zipf:
+            for fp in file_paths:
+                if os.path.exists(fp): zipf.write(fp, os.path.basename(fp))
+        return True, f"فایل ZIP با موفقیت در '{os.path.basename(abs_zip_name)}' ایجاد شد.", abs_zip_name
     except Exception as e: return False, f"خطا در ایجاد فایل ZIP: {e}", None
 # --- تابع اصلی تولید صدا ---
 def generate_audio_for_gradio(
+    use_file_input_checkbox, text_file_obj,
+    speech_prompt_input, text_to_speak_input,
+    max_chunk_slider, sleep_slider, temperature_slider,
+    model_dropdown_fa, speaker_dropdown_fa, output_filename_base_input,
+    merge_checkbox, delete_partials_checkbox,
     progress=gr.Progress(track_tqdm=True)
 ):
+    status_messages = ["🚀 شروع فرآیند تبدیل متن به گفتار..."]
     progress(0, desc="در حال آماده‌سازی...")
     api_key_to_use = HF_GEMINI_API_KEY
     if not api_key_to_use:
+        status_messages.append("❌ خطا: کلید API جمینای (GEMINI_API_KEY) در Hugging Face Secrets یافت نشد.")
+        status_messages.append("⬅️ لطفاً آن را در بخش Settings > Secrets در تنظیمات Space خود اضافه کنید.")
         return None, None, "\n".join(status_messages)
+    os.environ["GEMINI_API_KEY"] = api_key_to_use
+    status_messages.append("🔑 کلید API با موفقیت از Secrets بارگذاری شد.")
+    actual_text_input, msg = ("", "")
     if use_file_input_checkbox:
         if text_file_obj is None:
+            status_messages.append("❌ خطا: گزینه 'استفاده از فایل متنی' انتخاب شده، اما فایلی آپلود نشده است.")
             return None, None, "\n".join(status_messages)
         actual_text_input, msg = load_text_from_gr_file(text_file_obj)
     else:
         actual_text_input = text_to_speak_input
+        msg = "⌨️ استفاده از متن وارد شده دستی."
+    status_messages.append(msg)
+    if not actual_text_input: return None, None, "\n".join(status_messages)
+    try:
+        status_messages.append("🛠️ در حال مقداردهی اولیه کلاینت جمینای...")
+        progress(0.1, desc="مقداردهی کلاینت جمینای...")
+        client = genai.Client(api_key=os.environ.get("GEMINI_API_KEY"))
+        status_messages.append("✅ کلاینت جمینای با موفقیت مقداردهی شد.")
+    except Exception as e:
+        status_messages.append(f"❌ خطا در مقداردهی کلاینت جمینای: {e}")
+        return None, None, "\n".join(status_messages)
+    text_chunks = smart_text_split(actual_text_input, int(max_chunk_slider))
+    status_messages.append(f"📊 متن به {len(text_chunks)} قطعه تقسیم شد.")
+    for i, chunk_text in enumerate(text_chunks): status_messages.append(f"  📝 قطعه {i+1}: {len(chunk_text)} کاراکتر")
+    generated_audio_files, run_id = [], base64.urlsafe_b64encode(os.urandom(6)).decode()
+    temp_output_dir = f"temp_audio_{run_id}"
+    os.makedirs(temp_output_dir, exist_ok=True)
     output_base_name_safe = re.sub(r'[\s\\\/\:\*\?\"\<\>\|\%]+', '_', output_filename_base_input)
+    # Map selected FA names to actual API names
+    selected_model_api_name = MODELS_FA[model_dropdown_fa]
+    selected_speaker_api_name = SPEAKER_VOICES_FA[speaker_dropdown_fa]
     total_chunks = len(text_chunks)
     for i, chunk_text_content in enumerate(text_chunks):
+        progress_val = 0.1 + (0.7 * (i / total_chunks))
+        progress(progress_val, desc=f"در حال تولید قطعه {i+1} از {total_chunks}...")
+        status_messages.append(f"\n🔊 تولید صدا برای قطعه {i+1}/{total_chunks}...")
+        final_text_for_api = f'"{speech_prompt_input}"\n{chunk_text_content}' if speech_prompt_input.strip() else chunk_text_content
+        contents_for_api = [types.Content(role="user", parts=[types.Part.from_text(text=final_text_for_api)])]
+        generate_content_config = types.GenerateContentConfig(
             temperature=float(temperature_slider),
+            response_modalities=["audio"],
+            speech_config=types.SpeechConfig(
                 voice_config=types.VoiceConfig(
+                    prebuilt_voice_config=types.PrebuiltVoiceConfig(voice_name=selected_speaker_api_name)
                 )
+            )
         )
+        audio_data_received = False
         try:
+            for stream_resp_chunk in client.models.generate_content_stream(
+                model=selected_model_api_name, contents=contents_for_api, config=generate_content_config,
             ):
+                if (stream_resp_chunk.candidates and stream_resp_chunk.candidates[0].content and
+                    stream_resp_chunk.candidates[0].content.parts and
+                    stream_resp_chunk.candidates[0].content.parts[0].inline_data):
+                    inline_data = stream_resp_chunk.candidates[0].content.parts[0].inline_data
                     data_buffer, api_mime_type = inline_data.data, inline_data.mime_type
                     audio_data_received = True
                     status_messages.append(f"ℹ️ MIME Type دریافتی از API: {api_mime_type}")
+                    file_ext = ".wav" # پیش‌فرض wav و تبدیل
                     if api_mime_type and ("mp3" in api_mime_type.lower() or "mpeg" in api_mime_type.lower()):
+                        file_ext = ".mp3"
+                        status_messages.append(f"ℹ️ ذخیره به صورت MP3 بر اساس MIME: {api_mime_type}")
                     elif api_mime_type and "wav" in api_mime_type.lower() and not ("audio/l16" in api_mime_type.lower() or "audio/l24" in api_mime_type.lower()):
+                        file_ext = ".wav"
+                        status_messages.append(f"ℹ️ ذخیره به صورت WAV بر اساس MIME: {api_mime_type}")
                     else:
+                        status_messages.append(f"ℹ️ تبدیل به WAV برای MIME: {api_mime_type or 'نامشخص'}")
                         data_buffer = convert_to_wav(data_buffer, api_mime_type)
+                    status_messages.append(f"ℹ️ پسوند فایل تعیین شده: {file_ext}")
+                    chunk_fp_prefix = os.path.join(temp_output_dir, f"{output_base_name_safe}_part_{i+1:03d}")
+                    gen_file_path = save_binary_file(f"{chunk_fp_prefix}{file_ext}", data_buffer)
+                    if gen_file_path:
+                        generated_audio_files.append(gen_file_path)
+                        status_messages.append(f"✅ قطعه {i+1} ذخیره شد: {os.path.basename(gen_file_path)}")
                     else: status_messages.append(f"❌ عدم موفقیت در ذخیره قطعه {i+1}.")
                     break
+                elif stream_resp_chunk.text: status_messages.append(f"ℹ️ پیام متنی از API (حین استریم): {stream_resp_chunk.text}")
             if not audio_data_received:
+                status_messages.append(f"❌ داده صوتی برای قطعه {i+1} در استریم دریافت نشد.")
+                if stream_resp_chunk and stream_resp_chunk.prompt_feedback and stream_resp_chunk.prompt_feedback.block_reason:
+                    status_messages.append(f"🛑 دلیل بلاک شدن توسط API: {stream_resp_chunk.prompt_feedback.block_reason_message or stream_resp_chunk.prompt_feedback.block_reason}")
+        except Exception as e:
+            status_messages.append(f"❌ خطا در تولید/پردازش قطعه {i+1}: {e}")
+            import traceback; status_messages.append(traceback.format_exc())
+            continue
+        if i < total_chunks - 1:
+            status_messages.append(f"⏱️ انتظار به مدت {sleep_slider} ثانیه...")
+            time.sleep(float(sleep_slider))
+    progress(0.85, desc="پردازش فایل‌های تولید شده...")
     if not generated_audio_files:
         status_messages.append("❌ هیچ فایل صوتی با موفقیت تولید یا ذخیره نشد!")
+        final_status = "\n".join(status_messages)
+        print(final_status)
+        progress(1, desc="پایان با خطا.")
+        return None, None, final_status
+    status_messages.append(f"\n🎉 {len(generated_audio_files)} فایل صوتی تولید شد!")
+    out_audio_player_path, out_download_path = None, None
+    if merge_checkbox and len(generated_audio_files) > 1:
+        if not PYDUB_AVAILABLE:
+            status_messages.append("⚠️ pydub در دسترس نیست. امکان ادغام وجود ندارد. فایل ZIP قطعات ارائه می‌شود.")
+            success, msg, zip_p = create_zip_file(generated_audio_files, os.path.join(temp_output_dir, f"{output_base_name_safe}_all_parts.zip"))
+            status_messages.append(msg)
+            if success: out_download_path = zip_p
         else:
+            status_messages.append(f"🔗 در حال ادغام {len(generated_audio_files)} فایل...")
+            merged_fp = os.path.join(temp_output_dir, f"{output_base_name_safe}_merged.wav")
+            success, msg, merged_p = merge_audio_files_func(generated_audio_files, merged_fp)
+            status_messages.append(msg)
+            if success:
+                out_audio_player_path, out_download_path = merged_p, merged_p
+                if delete_partials_checkbox:
+                    status_messages.append("🗑️ در حال حذف فایل‌های جزئی...")
+                    for fp in generated_audio_files:
+                        try: os.remove(fp); status_messages.append(f"  🗑️ حذف شد: {os.path.basename(fp)}")
+                        except Exception as e_del: status_messages.append(f"  ⚠️ عدم موفقیت در حذف {os.path.basename(fp)}: {e_del}")
+            else:
+                status_messages.append("⚠️ ادغام ناموفق بود. فایل ZIP قطعات ارائه می‌شود.")
+                success_zip, msg_zip, zip_p = create_zip_file(generated_audio_files, os.path.join(temp_output_dir, f"{output_base_name_safe}_all_parts.zip"))
+                status_messages.append(msg_zip)
+                if success_zip: out_download_path = zip_p
     elif len(generated_audio_files) == 1:
+        single_fp = generated_audio_files[0]
+        out_audio_player_path, out_download_path = single_fp, single_fp
+        status_messages.append(f"🎵 فایل صوتی تکی: {os.path.basename(single_fp)}")
+    else:
+        status_messages.append("📦 چندین قطعه تولید شده است. در حال ایجاد فایل ZIP.")
+        success, msg, zip_p = create_zip_file(generated_audio_files, os.path.join(temp_output_dir, f"{output_base_name_safe}_all_parts.zip"))
+        status_messages.append(msg)
+        if success: out_download_path = zip_p
     final_status = "\n".join(status_messages)
     print(final_status)
+    print(f"DEBUG: مسیر فایل برای پخش‌کننده: {out_audio_player_path}")
+    print(f"DEBUG: مسیر فایل برای دانلود: {out_download_path}")
+    progress(1, desc="پایان!")
+    return out_audio_player_path, out_download_path, final_status
 # --- تعریف رابط کاربری Gradio ---
+css = """
+body { font-family: 'Vazirmatn', 'Tahoma', sans-serif; direction: rtl; }
+.gradio-container { max-width: 900px !important; margin: auto !important; }
+footer { display: none !important; } /* Hide default Gradio footer */
+.gr-button { font-weight: bold; }
+.st-emotion-cache-1uj092c, .st-emotion-cache-1wnczdq { font-family: 'Vazirmatn', 'Tahoma', sans-serif !important; } /* Forcing font on some elements */
+.rtl-override { direction: rtl !important; text-align: right !important; }
+.rtl-override input, .rtl-override textarea, .rtl-override select { direction: rtl !important; text-align: right !important; }
+label > .label-text { font-size: 1.1em !important; margin-bottom: 5px !important; }
+.gr-input, .gr-dropdown, .gr-slider { margin-bottom: 10px !important; }
+"""
+with gr.Blocks(theme=gr.themes.Soft(primary_hue=gr.themes.colors.blue, secondary_hue=gr.themes.colors.sky, font=[gr.themes.GoogleFont("Vazirmatn"), "Tahoma", "sans-serif"]), css=css, title="تبدیل متن به گفتار با جمینای") as demo:
+    gr.Markdown("<h1 style='text-align: center; color: #2A7AF2;'>🎵 تبدیل متن به گفتار با API جمینای 🗣️</h1>", elem_classes=["rtl-override"])
+    if not HF_GEMINI_API_KEY:
+        gr.Warning(
+            "کلید API جمینای (GEMINI_API_KEY) در Hugging Face Secrets یافت نشد. "
+            "برای کارکرد صحیح اپلیکیشن، لطفاً آن را در بخش 'Settings' > 'Secrets' این Space با نام `GEMINI_API_KEY` اضافه کنید."
+        )
+    else:
+        gr.Info("کلید API جمینای با موفقیت از Secrets بارگذاری شد. اپلیکیشن آماده تولید صدا است!")
+    gr.Markdown(
+        "این ابزار متن شما را با استفاده از مدل‌های پیشرفته جمینای گوگل به گفتار تبدیل می‌کند. "
+        "مطمئن شوید که کلید API جمینای خود را در بخش Secrets این Space تنظیم کرده‌اید."
+        "\n\nمی‌توانید کلید API خود را از [Google AI Studio](https://aistudio.google.com/app/apikey) دریافت کنید.",
+        elem_classes=["rtl-override"]
+    )
+    with gr.Row(elem_classes=["rtl-override"]):
+        with gr.Column(scale=2):
+            gr.Markdown("### ۱. ورودی متن", elem_classes=["rtl-override"])
+            use_file = gr.Checkbox(label="📁 استفاده از فایل متنی (.txt)", value=False, elem_classes=["rtl-override"])
+            text_file = gr.File(
+                label="بارگذاری فایل متنی", file_types=['.txt'], visible=False, elem_classes=["rtl-override"]
             )
+            text_to_speak = gr.Textbox(
+                label="📝 متنی که می‌خواهید به گفتار تبدیل شود (یا از فایل بالا استفاده کنید):",
+                lines=8, placeholder="متن خود را اینجا وارد کنید...", visible=True, elem_classes=["rtl-override"]
+            )
+            use_file.change(lambda x: (gr.update(visible=x), gr.update(visible=not x)), [use_file], [text_file, text_to_speak])
+            speech_prompt = gr.Textbox(
+                label="🗣️ پرامپت راهنمای گفتار (اختیاری):",
+                placeholder="مثال: «با لحنی دوستانه و پرانرژی، مانند یک یوتیوبر»",
+                info="این پرامپت بر سبک، احساسات و ویژگی‌های صدای خروجی تأثیر می‌گذارد.", elem_classes=["rtl-override"]
             )
+        with gr.Column(scale=1):
+            gr.Markdown("### ۲. تنظیمات تولید صدا", elem_classes=["rtl-override"])
+            model_name_fa = gr.Dropdown(
+                MODELS_LIST, label="🤖 انتخاب مدل:", value=MODELS_LIST[0], elem_classes=["rtl-override"]
+            )
+            speaker_voice_fa = gr.Dropdown(
+                SPEAKER_VOICES_LIST, label="🎤 انتخاب گوینده:", value="کارون (زن، پیش‌فرض)", elem_classes=["rtl-override"]
+            )
+            temperature = gr.Slider(
+                minimum=0.0, maximum=1.0, step=0.05, value=0.7, label="🌡️ دما (Temperature):",
+                info="میزان خلاقیت و تنوع صدا (0.0 تا 1.0). مقادیر بالاتر تنوع بیشتری ایجاد می‌کنند.", elem_classes=["rtl-override"]
+            )
+            max_chunk_size = gr.Slider(
+                minimum=1000, maximum=4000, step=100, value=3800, label="🧩 حداکثر کاراکتر در هر قطعه:",
+                info="متن برای ارسال به API به قطعات کوچکتر تقسیم می‌شود.", elem_classes=["rtl-override"]
+            )
+            sleep_between_requests = gr.Slider(
+                minimum=1, maximum=15, step=0.5, value=3, label="⏱️ تاخیر بین درخواست‌ها (ثانیه):",
+                info="برای مدیریت محدودیت‌های API (مثلاً جمینای فلش ۶۰ درخواست در دقیقه).", elem_classes=["rtl-override"]
+            )
+            output_filename_base = gr.Textbox(
+                label="💾 نام پایه فایل خروجی:", value="صدای_جمینای", elem_classes=["rtl-override"]
+            )
+            with gr.Group(visible=PYDUB_AVAILABLE):
+                merge_audio = gr.Checkbox(label="🔗 ادغام قطعات صوتی (در صورت وجود بیش از یک قطعه)", value=True, elem_classes=["rtl-override"])
+                delete_partials = gr.Checkbox(label="🗑️ حذف قطعات پس از ادغام", value=True, visible=True, elem_classes=["rtl-override"])
+                merge_audio.change(lambda x: gr.update(visible=x), [merge_audio], [delete_partials])
+            if not PYDUB_AVAILABLE:
+                 gr.Markdown("<small style='color: orange;'>⚠️ قابلیت ادغام غیرفعال است: کتابخانه `pydub` یافت نشد.</small>", elem_classes=["rtl-override"])
+    submit_button = gr.Button("✨ تولید صدا ✨", variant="primary", elem_classes=["rtl-override"], scale=2)
+    gr.Markdown("---", elem_classes=["rtl-override"])
+    gr.Markdown("### ۳. خروجی و گزارش", elem_classes=["rtl-override"])
+    with gr.Row(elem_classes=["rtl-override"]):
+        with gr.Column(scale=1):
+            output_audio_player = gr.Audio(label="🎧 فایل صوتی تولید شده:", type="filepath", format="wav")
+        with gr.Column(scale=1):
+            output_file_download = gr.File(label="📥 دانلود فایل خروجی:", type="filepath")
+    status_textbox = gr.Textbox(label="📊 گزارش وضعیت:", lines=10, interactive=False, max_lines=20, elem_classes=["rtl-override"])
+    submit_button.click(
+        fn=generate_audio_for_gradio,
+        inputs=[
+            use_file, text_file, speech_prompt, text_to_speak,
+            max_chunk_size, sleep_between_requests, temperature,
+            model_name_fa, speaker_voice_fa, output_filename_base, # Use FA dropdowns
+            merge_audio, delete_partials
+        ],
+        outputs=[output_audio_player, output_file_download, status_textbox]
+    )
+    gr.Markdown("---", elem_classes=["rtl-override"])
+    # The encoded text part:
+    encoded_text_creator = "Q3JlYXRlIGJ5IDogYWlnb2xkZW4=" # "Created by : aigolden"
+    try:
+        decoded_text_creator = base64.b64decode(encoded_text_creator.encode('utf-8')).decode('utf-8')
+        gr.Markdown(f"<p style='text-align:center; font-size:small; color: #555;'><em>{decoded_text_creator} | ترجمه و بهبود توسط مدل هوش مصنوعی</em></p>", elem_classes=["rtl-override"])
+    except: pass
+    gr.Examples(
+        examples=[
+            [False, None, "راوی با لحنی دوستانه و آموزنده.", "سلام دنیا! این یک آزمایش برای تبدیل متن به گفتار با استفاده از جمینای و گرادیو است. امیدوارم به خوبی کار کند!", 3800, 3, 0.7, MODELS_LIST[0], "کارون (زن، پیش‌فرض)", "مثال_سلام", True, True],
+            [False, None, "گوینده خبر هیجان‌زده.", "خبر فوری! هوش مصنوعی اکنون می‌تواند گفتاری شبیه به انسان تولید کند. این فناوری به سرعت در حال پیشرفت است!", 3000, 3, 0.8, MODELS_LIST[1], "آکِرنار (مرد)", "مثال_خبر", True, True],
+            [True, "sample_text.txt", "داستان‌گویی با لحنی آرام.", "", 3500, 4, 0.6, MODELS_LIST[0], "ویندِمیاطریکس (زن)", "مثال_از_فایل", True, False]
+        ],
+        fn=generate_audio_for_gradio,
+        inputs=[
+            use_file, text_file, speech_prompt, text_to_speak,
+            max_chunk_size, sleep_between_requests, temperature,
+            model_name_fa, speaker_voice_fa, output_filename_base,
+            merge_audio, delete_partials
+        ],
+        outputs=[output_audio_player, output_file_download, status_textbox],
+        cache_examples=False, # API calls
+        label="نمونه‌های آماده (برای استفاده از مثال فایل، فایل sample_text.txt باید موجود باشد):",
+        elem_classes=["rtl-override"]
+    )
+    gr.Markdown("<small style='display: block; text-align: center;'>برای استفاده از مثال «فایل متنی نمونه»، ابتدا یک فایل با نام `sample_text.txt` حاوی متن دلخواه در ریشه این Space ایجاد کنید، یا فایل متنی خود را بارگذاری نمایید.</small>", elem_classes=["rtl-override"])
 if __name__ == "__main__":
+    if not PYDUB_AVAILABLE: print("هشدار: کتابخانه pydub نصب نشده یا کار نمی‌کند. ادغام فایل‌های صوتی غیرفعال خواهد بود.")
+    if not HF_GEMINI_API_KEY: print("هشدار: متغیر محیطی GEMINI_API_KEY تنظیم نشده است. اپلیکیشن در اجرای محلی ممکن است بدون کلید API کار نکند.")
+    demo.launch(debug=True, share=False)