Spaces:

VietCat
/

gpt2-vietnamese-api

Sleeping

VietCat commited on May 7

Commit

9f79fe4

1 Parent(s): 2c6b9b1

fix build error

Files changed (3) hide show

Dockerfile CHANGED Viewed

@@ -2,6 +2,11 @@ FROM python:3.10-slim
 WORKDIR /app
 # Install dependencies
 COPY requirements.txt .
 RUN pip install --no-cache-dir -r requirements.txt
@@ -9,12 +14,14 @@ RUN pip install --no-cache-dir -r requirements.txt
 # Copy source code
 COPY app.py .
-# Set up Hugging Face cache
-RUN mkdir -p /app/cache
 ENV HF_HOME=/app/cache \
-    PYTHONUNBUFFERED=1
 EXPOSE 7860
-CMD ["python", "app.py"]

 WORKDIR /app
+# Install system dependencies
+RUN apt-get update && apt-get install -y --no-install-recommends \
+    gcc \
+    && rm -rf /var/lib/apt/lists/*
 # Install dependencies
 COPY requirements.txt .
 RUN pip install --no-cache-dir -r requirements.txt
 # Copy source code
 COPY app.py .
+# Create cache directory and set permissions
+RUN mkdir -p /app/cache && chmod -R 777 /app/cache
+# Set env vars
 ENV HF_HOME=/app/cache \
+    PYTHONUNBUFFERED=1 \
+    PYTHONWARNINGS=ignore::FutureWarning
 EXPOSE 7860
+CMD ["python", "app.py"]

app.py CHANGED Viewed

@@ -1,23 +1,37 @@
 import os
-os.environ["HF_HOME"] = "/tmp/hf_home"
 from transformers import GPT2LMHeadModel, GPT2Tokenizer
 import torch
 import gradio as gr
 model_id = "NlpHUST/gpt2-vietnamese"
-tokenizer = GPT2Tokenizer.from_pretrained(model_id)
-model = GPT2LMHeadModel.from_pretrained(model_id)
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model.to(device)
 model.eval()
 def generate_text(prompt, max_length=100, temperature=1.0):
-    inputs = tokenizer.encode(prompt, return_tensors="pt").to(device)
-    outputs = model.generate(inputs, max_length=max_length, temperature=temperature, do_sample=True)
-    return tokenizer.decode(outputs[0], skip_special_tokens=True)
 demo = gr.Interface(
     fn=generate_text,
     inputs=[
@@ -32,4 +46,4 @@ demo = gr.Interface(
 )
 if __name__ == "__main__":
-    demo.launch(server_name="0.0.0.0", server_port=7860)

 import os
 from transformers import GPT2LMHeadModel, GPT2Tokenizer
 import torch
 import gradio as gr
+# Load model and tokenizer
 model_id = "NlpHUST/gpt2-vietnamese"
+try:
+    tokenizer = GPT2Tokenizer.from_pretrained(model_id)
+    model = GPT2LMHeadModel.from_pretrained(model_id)
+except Exception as e:
+    print(f"Error loading model: {e}")
+    raise e
+# Set device
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model.to(device)
 model.eval()
 def generate_text(prompt, max_length=100, temperature=1.0):
+    try:
+        inputs = tokenizer.encode(prompt, return_tensors="pt").to(device)
+        outputs = model.generate(
+            inputs,
+            max_length=max_length,
+            temperature=temperature,
+            do_sample=True,
+            num_beams=1
+        )
+        return tokenizer.decode(outputs[0], skip_special_tokens=True)
+    except Exception as e:
+        return f"Error generating text: {e}"
+# Gradio interface
 demo = gr.Interface(
     fn=generate_text,
     inputs=[
 )
 if __name__ == "__main__":
+    demo.launch(server_name="0.0.0.0", server_port=7860)

requirements.txt CHANGED Viewed

@@ -1,4 +1,16 @@
 transformers==4.40.0
-torch==2.1.2
 gradio==4.44.1

+# CPU-friendly PyTorch
+torch==2.1.2+cpu
+-f https://download.pytorch.org/whl/torch_stable.html
+# Transformers / Sentence Transformers
 transformers==4.40.0
+sentence-transformers==2.7.0
+# Gradio app
 gradio==4.44.1
+fastapi
+uvicorn
+# Tools
+pandas
+numpy