Spaces:

TheVera
/

decision-making-model

Sleeping

App Files Files Community

TheVera commited on Jul 31, 2024

Commit

761f569

verified ·

1 Parent(s): e6e4784

Update app.py

Browse files

Files changed (1) hide show

app.py +9 -12

app.py CHANGED Viewed

@@ -1,16 +1,15 @@
-import uvicorn
 import os
 from flask import Flask, request, jsonify
 from huggingface_hub import InferenceClient
 app = Flask(__name__)
-# API_URL = "https://api-inference.huggingface.co/models/mistralai/Mixtral-8x7B-Instruct-v0.1"
-# Use environment variables for configuration
-API_URL = "https://api-inference.huggingface.co/models/mistralai/Mixtral-8x7B-Instruct-v0.1"
-# API_KEY = os.getenv("API_KEY", "your_default_api_key")  # Default API_KEY can be set here
-API_KEY = os.getenv("API_KEY")
 def format_prompt(message, custom_instructions=None):
     prompt = ""
@@ -34,9 +33,8 @@ def normalize_text(text):
         text = text.replace(british, american)
     return text
 def Mistral7B(prompt, instructions, api_key, temperature=0.1, max_new_tokens=2, top_p=0.95, repetition_penalty=1.0):
-    global API_URL
     try:
         temperature = max(float(temperature), 1e-2)
         top_p = float(top_p)
@@ -52,13 +50,12 @@ def Mistral7B(prompt, instructions, api_key, temperature=0.1, max_new_tokens=2,
         custom_instructions = instructions
         formatted_prompt = format_prompt(prompt, custom_instructions)
-        client = InferenceClient(api_url=API_URL, token=api_key)
-        response = client.text_generation(formatted_prompt, **generate_kwargs)
         return response
     except Exception as e:
         return str(e)
 @app.route("/generate-text", methods=["POST"])
 def generate_text():
     data = request.json
@@ -75,4 +72,4 @@ def generate_text():
     return jsonify({"response": response}), 200
 if __name__ == "__main__":
-    uvicorn.run(app, host="0.0.0.0", port=int(os.getenv("PORT", 8000)))

 import os
+import uvicorn
 from flask import Flask, request, jsonify
 from huggingface_hub import InferenceClient
 app = Flask(__name__)
+# Fixed API URL
+MODEL_ID = "mistralai/Mixtral-8x7B-Instruct-v0.1"
+# Use environment variable for the API key
+API_KEY = os.getenv("API_KEY")
 def format_prompt(message, custom_instructions=None):
     prompt = ""
         text = text.replace(british, american)
     return text
 def Mistral7B(prompt, instructions, api_key, temperature=0.1, max_new_tokens=2, top_p=0.95, repetition_penalty=1.0):
     try:
         temperature = max(float(temperature), 1e-2)
         top_p = float(top_p)
         custom_instructions = instructions
         formatted_prompt = format_prompt(prompt, custom_instructions)
+        client = InferenceClient(token=api_key)
+        response = client.text_generation(formatted_prompt, model=MODEL_ID, **generate_kwargs)
         return response
     except Exception as e:
         return str(e)
 @app.route("/generate-text", methods=["POST"])
 def generate_text():
     data = request.json
     return jsonify({"response": response}), 200
 if __name__ == "__main__":
+    uvicorn.run(app, host="0.0.0.0", port=int(os.getenv("PORT", 8000)))