# Chọn image cơ bản FROM ubuntu:22.04 # Cài đặt thư viện cần thiết RUN apt-get update && apt-get install -y \ unzip wget curl python3 python3-pip # Sao chép binary LLaMA đã build vào container COPY llama_bin.zip /app/llama_bin.zip WORKDIR /app # Giải nén binaries RUN unzip llama_bin.zip && rm llama_bin.zip && chmod +x bin/server # Tạo thư mục models RUN mkdir -p /models # Tải mô hình Qwen2.5-0.5B-Instruct-GGUF RUN wget -O /models/qwen2.5-0.5b-instruct-q5_k_m.gguf \ https://huggingface.co/Qwen/Qwen2.5-0.5B-Instruct-GGUF/resolve/main/qwen2.5-0.5b-instruct-q5_k_m.gguf # Chạy server với mô hình Qwen CMD ["./bin/server", "-m", "/models/qwen2.5-0.5b-instruct-q5_k_m.gguf", "-p", "8000"]