Spaces:

doropiza
/

extractive_summary

Sleeping

App Files Files Community

doropiza commited on Jun 4

Commit

d7e9bfb

1 Parent(s): ddf4ee3

commit

Browse files

Files changed (2) hide show

app.py +116 -78
requirements.txt +11 -8

app.py CHANGED Viewed

@@ -6,61 +6,92 @@ import requests
 from bs4 import BeautifulSoup
 import re
 import warnings
 warnings.filterwarnings("ignore")
 class TextSummarizer:
     def __init__(self):
-        # GPUが利用可能かチェック
-        self.device = "cuda" if torch.cuda.is_available() else "cpu"
         print(f"使用デバイス: {self.device}")
         print(f"PyTorch バージョン: {torch.__version__}")
-        # PyTorch v2.6未満の場合は警告
-        torch_version = torch.__version__.split('+')[0]  # +cu121などを除去
-        major, minor = map(int, torch_version.split('.')[:2])
-        if major < 2 or (major == 2 and minor < 6):
-            print("⚠️  警告: PyTorch v2.6未満です。セキュリティ脆弱性(CVE-2025-32434)のため、アップグレードを推奨します。")
-            print("   アップグレード: pip install torch>=2.6.0")
-        # safetensorsを優先したモデル読み込み
         try:
             print("モデルを読み込み中...")
-            self.summarizer = pipeline(
-                "summarization",
-                model="facebook/bart-large-cnn",
-                device=0 if self.device == "cuda" else -1,
-                framework="pt",
-                use_safetensors=True,  # safetensorsを優先
-                trust_remote_code=False  # セキュリティ強化
-            )
-            print("✅ モデルの読み込みが完了しました (safetensors使用)")
         except Exception as e:
             print(f"❌ メインモデル読み込みエラー: {e}")
-            # より軽量なフォールバック（safetensors対応）
             try:
-                print("フォールバックモデルを試行中...")
                 self.summarizer = pipeline(
                     "summarization",
-                    model="sshleifer/distilbart-cnn-12-6",
-                    device=0 if self.device == "cuda" else -1,
-                    use_safetensors=True,
-                    trust_remote_code=False
                 )
-                print("✅ フォール��ックモデルの読み込みが完了しました")
             except Exception as e2:
-                print(f"❌ フォールバックモデルもエラー: {e2}")
-                # 最終フォールバック（safetensorsなし）
-                try:
-                    print("最終フォールバック（レガシーモード）...")
-                    self.summarizer = pipeline(
-                        "summarization",
-                        model="sshleifer/distilbart-cnn-12-6",
-                        device=0 if self.device == "cuda" else -1
-                    )
-                    print("⚠️  レガシーモードで読み込み完了（safetensorsなし）")
-                except Exception as e3:
-                    print(f"❌ 全てのモデル読み込みに失敗: {e3}")
-                    raise Exception("モデルの読み込みに失敗しました。requirements.txtを確認し、依存関係を更新してください。")
     def clean_text(self, text):
         """テキストの前処理"""
@@ -89,8 +120,9 @@ class TextSummarizer:
         return chunks
     def summarize_text(self, text, max_length=150, min_length=50):
-        """テキストを要約"""
         try:
             cleaned_text = self.clean_text(text)
@@ -285,14 +317,14 @@ def process_url_input(url, max_length, min_length):
 def create_interface():
     with gr.Blocks(title="🤖 ローカルLLM テキスト要約ツール", theme=gr.themes.Soft()) as app:
         gr.Markdown("""
-        # 🤖 ローカルLLM テキスト要約ツール (v5 Security Update)
         このツールは、ローカルで動作するLLMを使用してテキストを要約し、構造化された形式で出力します。
-        ## 🔒 セキュリティアップデート
-        - **PyTorch v2.6+** 対応（CVE-2025-32434 対策）
-        - **safetensors** 形式を優先使用
-        - **trust_remote_code=False** でセキュリティ強化
         ## 📝 対応入力形式
         - **テキスト直接入力**
@@ -383,51 +415,57 @@ def create_interface():
         3. **実行**: 対応する実行ボタンをクリック
         4. **結果確認**: 構造化された要約結果を確認
-        ## ⚙️ 技術仕様 (v5 Security Update)
-        - **モデル**: Facebook BART (ローカル実行)
-        - **セキュリティ**: PyTorch v2.6+ (CVE-2025-32434 対策)
-        - **フォーマット**: safetensors優先
-        - **GPU加速**: CUDA対応
         - **出力形式**: 構造化Markdown
-        ## 🔒 セキュリティ機能
-        - safetensors形式での安全なモデル読み込み
-        - trust_remote_code=False設定
-        - 脆弱性対策済みPyTorchバージョン要求
         """)
     return app
 if __name__ == "__main__":
-    # セキュリティアップデート情報
-    print("""
-    🔒 セキュリティアップデート v5 🔒
-    PyTorch脆弱性(CVE-2025-32434)対応のため、以下の更新が必要です:
-    pip install torch>=2.6.0 transformers>=4.40.0 safetensors>=0.4.0
-    または、requirements.txtを更新:
-    pip install -r requirements.txt
-    GPU使用の場合:
-    pip install torch>=2.6.0+cu121 --extra-index-url https://download.pytorch.org/whl/cu121
     """)
-    # PyTorchバージョンチェック
-    torch_version = torch.__version__.split('+')[0]
-    major, minor = map(int, torch_version.split('.')[:2])
-    if major < 2 or (major == 2 and minor < 6):
-        print(f"⚠️  現在のPyTorchバージョン: {torch.__version__}")
-        print("🚨 セキュリティリスクあり - アップグレードを強く推奨します")
     else:
-        print(f"✅ PyTorchバージョン: {torch.__version__} (セキュア)")
     # アプリケーション起動
     app = create_interface()
-    app.launch(
-        server_name="0.0.0.0",  # 外部アクセス許可
-        server_port=7860,
-        share=True,  # パブリックURL生成
-        debug=True
-    )

 from bs4 import BeautifulSoup
 import re
 import warnings
+import os
 warnings.filterwarnings("ignore")
+# ZeroGPU環境の検出
+IS_ZEROGPU = os.environ.get("SPACE_ID") is not None and "zero-gpu" in os.environ.get("SPACE_ID", "").lower()
+# ZeroGPU用のデコレータ（利用可能な場合のみ）
+try:
+    import spaces
+    if IS_ZEROGPU:
+        zerogpu_decorator = spaces.GPU
+    else:
+        zerogpu_decorator = lambda duration=None: lambda func: func
+except ImportError:
+    zerogpu_decorator = lambda duration=None: lambda func: func
 class TextSummarizer:
     def __init__(self):
+        # 環境の検出
+        self.is_zerogpu = IS_ZEROGPU
+        print(f"実行環境: {'ZeroGPU' if self.is_zerogpu else 'Local/Standard'}")
+        # デバイス設定
+        if self.is_zerogpu:
+            self.device = "cuda"  # ZeroGPUでは常にCUDA
+        else:
+            self.device = "cuda" if torch.cuda.is_available() else "cpu"
         print(f"使用デバイス: {self.device}")
         print(f"PyTorch バージョン: {torch.__version__}")
+        # ZeroGPU以外でのバージョンチェック
+        if not self.is_zerogpu:
+            torch_version = torch.__version__.split('+')[0]
+            try:
+                major, minor = map(int, torch_version.split('.')[:2])
+                if major < 2 or (major == 2 and minor < 6):
+                    print("⚠️  警告: PyTorch v2.6未満です。セキュリティ脆弱性(CVE-2025-32434)のため、アップグレードを推奨します。")
+            except ValueError:
+                print("⚠️  PyTorchバージョンの解析に失敗しました")
+        # モデル読み込み（ZeroGPU対応）
+        self._load_model()
+    def _load_model(self):
+        """モデルの読み込み（環境に応じて最適化）"""
         try:
             print("モデルを読み込み中...")
+            # ZeroGPU環境では軽量モデルを優先
+            if self.is_zerogpu:
+                model_name = "sshleifer/distilbart-cnn-12-6"  # より軽量
+            else:
+                model_name = "facebook/bart-large-cnn"
+            # モデル読み込み設定
+            pipeline_kwargs = {
+                "task": "summarization",
+                "model": model_name,
+                "device": 0 if self.device == "cuda" else -1,
+                "framework": "pt"
+            }
+            # safetensorsが利用可能な場合のみ使用
+            try:
+                self.summarizer = pipeline(**pipeline_kwargs, use_safetensors=True, trust_remote_code=False)
+                print(f"✅ {model_name} の読み込み完了 (safetensors使用)")
+            except Exception:
+                # safetensorsが使えない場合はフォールバック
+                self.summarizer = pipeline(**pipeline_kwargs)
+                print(f"✅ {model_name} の読み込み完了 (標準形式)")
         except Exception as e:
             print(f"❌ メインモデル読み込みエラー: {e}")
+            # 最軽量フォールバック
             try:
+                print("最軽量フォールバックモデルを試行中...")
                 self.summarizer = pipeline(
                     "summarization",
+                    model="sshleifer/distilbart-cnn-6-6",  # 最軽量
+                    device=0 if self.device == "cuda" else -1
                 )
+                print("✅ 最軽量モデルで読み込み完了")
             except Exception as e2:
+                print(f"❌ 全てのモデル読み込みに失敗: {e2}")
+                raise Exception(f"モデルの読み込みに失敗しました: {e2}")
     def clean_text(self, text):
         """テキストの前処理"""
         return chunks
+    @zerogpu_decorator(duration=60)
     def summarize_text(self, text, max_length=150, min_length=50):
+        """テキストを要約（ZeroGPU対応）"""
         try:
             cleaned_text = self.clean_text(text)
 def create_interface():
     with gr.Blocks(title="🤖 ローカルLLM テキスト要約ツール", theme=gr.themes.Soft()) as app:
         gr.Markdown("""
+        # 🤖 ローカルLLM テキスト要約ツール (ZeroGPU対応)
         このツールは、ローカルで動作するLLMを使用してテキストを要約し、構造化された形式で出力します。
+        ## 🚀 環境対応
+        - **ZeroGPU**: Hugging Face Spaces自動最適化
+        - **ローカル環境**: PyTorch v2.6+ セキュリティ対応
+        - **safetensors**: 利用可能時に自動使用
         ## 📝 対応入力形式
         - **テキスト直接入力**
         3. **実行**: 対応する実行ボタンをクリック
         4. **結果確認**: 構造化された要約結果を確認
+        ## ⚙️ 技術仕様 (ZeroGPU対応)
+        - **モデル**: DistilBART/BART (環境に応じて自動選択)
+        - **ZeroGPU**: Hugging Face Spaces最適化
+        - **セキュリティ**: safetensors自動対応
+        - **GPU加速**: 環境自動検出
         - **出力形式**: 構造化Markdown
+        ## 🔧 環境別最適化
+        - ZeroGPU: 軽量モデル自動選択
+        - ローカル: 高性能モデル利用可能
+        - セキュリティ: 環境に応じた安全設定
         """)
     return app
 if __name__ == "__main__":
+    # 環境情報表示
+    print(f"""
+    🚀 テキスト要約ツール起動 🚀
+    実行環境: {'ZeroGPU (Hugging Face Spaces)' if IS_ZEROGPU else 'ローカル環境'}
+    PyTorchバージョン: {torch.__version__}
     """)
+    if IS_ZEROGPU:
+        print("✅ ZeroGPU環境で最適化済み")
     else:
+        # ローカル環境でのセキュリティチェック
+        try:
+            torch_version = torch.__version__.split('+')[0]
+            major, minor = map(int, torch_version.split('.')[:2])
+            if major < 2 or (major == 2 and minor < 6):
+                print("⚠️  セキュリティ警告: PyTorch v2.6未満")
+                print("   推奨: pip install torch>=2.6.0")
+            else:
+                print("✅ PyTorchセキュリティ: OK")
+        except ValueError:
+            print("⚠️  PyTorchバージョン確認不能")
     # アプリケーション起動
     app = create_interface()
+    if IS_ZEROGPU:
+        # ZeroGPU環境用設定
+        app.launch()
+    else:
+        # ローカル環境用設定
+        app.launch(
+            server_name="0.0.0.0",
+            server_port=7860,
+            share=True,
+            debug=True
+        )

requirements.txt CHANGED Viewed

@@ -1,6 +1,6 @@
-# Core ML Libraries - Updated for security (CVE-2025-32434)
-torch>=2.6.0
-transformers>=4.40.0
 tokenizers>=0.15.0
 safetensors>=0.4.0
@@ -31,10 +31,10 @@ huggingface-hub>=0.20.0
 # unidic-lite>=1.0.8
 # mecab-python3>=1.0.6
-# Optional: GPU Support (CUDA 12.1+)
-# torch>=2.6.0+cu121 --extra-index-url https://download.pytorch.org/whl/cu121
-# torchvision>=0.18.0+cu121 --extra-index-url https://download.pytorch.org/whl/cu121
-# torchaudio>=2.6.0+cu121 --extra-index-url https://download.pytorch.org/whl/cu121
 # Development Tools (optional)
 # jupyter>=1.0.0
@@ -43,4 +43,7 @@ huggingface-hub>=0.20.0
 # Security
 certifi>=2023.5.7
-urllib3>=2.0.3

+# Core ML Libraries - ZeroGPU Compatible
+torch  # ZeroGPUで自動管理
+transformers>=4.35.0
 tokenizers>=0.15.0
 safetensors>=0.4.0
 # unidic-lite>=1.0.8
 # mecab-python3>=1.0.6
+# For Local Environment (comment out for ZeroGPU)
+# torch>=2.6.0
+# torchvision>=0.18.0
+# torchaudio>=2.6.0
 # Development Tools (optional)
 # jupyter>=1.0.0
 # Security
 certifi>=2023.5.7
+urllib3>=2.0.3
+# ZeroGPU specific (uncomment if needed)
+# spaces>=0.19.0