Spaces:

LiveRAG
/

Challenge

Running

App Files Files Community

Orensomekh commited on Apr 29

Commit

6cfe4e2

verified ·

1 Parent(s): 46ed82b

Upload Falcon_Ai71_Usage.ipynb

Browse files

Files changed (1) hide show

Operational_Instructions/Falcon_Ai71_Usage.ipynb +140 -0

Operational_Instructions/Falcon_Ai71_Usage.ipynb ADDED Viewed

	@@ -0,0 +1,140 @@

+{
+ "cells": [
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "!pip install ai71 python-dotenv"
+   ]
+  },
+  {
+   "cell_type": "code",
+   "execution_count": null,
+   "metadata": {},
+   "outputs": [],
+   "source": [
+    "import os\n",
+    "import time\n",
+    "from ai71 import AI71\n",
+    "from concurrent.futures import ThreadPoolExecutor, as_completed\n",
+    "\n",
+    "# Optinal, but nice way to load environment variables from a .env file\n",
+    "from dotenv import load_dotenv\n",
+    "\n",
+    "load_dotenv()\n",
+    "AI71_API_KEY = os.getenv(\"AI71_API_KEY\")\n",
+    "AI71_BASE_URL = os.getenv(\"AI71_BASE_URL\")\n",
+    "\n",
+    "client = AI71(api_key=AI71_API_KEY, base_url=AI71_BASE_URL)\n",
+    "\n",
+    "def complete(client: AI71, messages: list[dict], model: str = \"tiiuae/falcon3-10b-instruct\", max_tokens: int = 100, n_retries: int = 5):\n",
+    "    \"\"\"Runs a single completion request.\n",
+    "    Args:\n",
+    "        client (AI71): The AI71 client.\n",
+    "        messages (list[dict]): List of messages for the request. (a conversation)\n",
+    "        model (str): Model to use for completion.\n",
+    "        max_tokens (int): Maximum number of tokens to generate.\n",
+    "        n_retries (int): Number of retries on failure.\n",
+    "    Returns:\n",
+    "        dict: The result of the completion request.\n",
+    "    \"\"\"\n",
+    "    retries = 0\n",
+    "    while True:\n",
+    "        try:\n",
+    "            return client.chat.completions.create(\n",
+    "                model=model,\n",
+    "                messages=messages,\n",
+    "                max_tokens=max_tokens,\n",
+    "            )\n",
+    "        except Exception as e:\n",
+    "            retries += 1\n",
+    "            if n_retries < retries:\n",
+    "                raise e\n",
+    "            print(f\"Retrying for the {retries} time(s)... (error: {e})\")\n",
+    "            time.sleep(retries)\n",
+    "\n",
+    "def batch_complete(\n",
+    "    client: AI71,\n",
+    "    list_of_messages: list[list[dict]],\n",
+    "    model: str = \"tiiuae/falcon3-10b-instruct\",\n",
+    "    max_tokens: int = 100,\n",
+    "    n_retries: int = 5,\n",
+    "    n_parallel: int = 10):\n",
+    "    \"\"\"Runs a batch of completions in parallel.\n",
+    "    Args:\n",
+    "        client (AI71): The AI71 client.\n",
+    "        list_of_messages (list[list[dict]]): List of messages for each request. (list of conversations)\n",
+    "        model (str): Model to use for completion.\n",
+    "        max_tokens (int): Maximum number of tokens to generate.\n",
+    "        n_retries (int): Number of retries on failure.\n",
+    "        n_parallel (int): Number of parallel requests.\n",
+    "    Returns:\n",
+    "        list: List of results for each request.\n",
+    "    \"\"\"\n",
+    "\n",
+    "    results = []\n",
+    "\n",
+    "    with ThreadPoolExecutor(max_workers=n_parallel) as executor:\n",
+    "        # Submit requests\n",
+    "        futures = [\n",
+    "            executor.submit(complete, client, messages, model, max_tokens, n_retries)\n",
+    "            for i, messages in enumerate(list_of_messages)\n",
+    "        ]\n",
+    "\n",
+    "        # Collect results as they complete\n",
+    "        for future in as_completed(futures):\n",
+    "            try:\n",
+    "                result = future.result()\n",
+    "                results.append(result)\n",
+    "            except Exception as e:\n",
+    "                print(f\"Request failed: {e}\")\n",
+    "                results.append(None)\n",
+    "\n",
+    "    return results\n",
+    "\n",
+    "# Simple single request:\n",
+    "result = complete(client, [\n",
+    "    {\"role\":\"system\",\"content\": \"You are a helpful assistant\"},\n",
+    "    {\"role\":\"user\",\"content\":\"What is artificial intelligence?\"}\n",
+    "])\n",
+    "print(result)\n",
+    "\n",
+    "# Run a batch of requests:\n",
+    "results = batch_complete(\n",
+    "    client,\n",
+    "    [\n",
+    "        [\n",
+    "            {\"role\":\"system\",\"content\": \"You are a helpful assistant\"},\n",
+    "            {\"role\":\"user\",\"content\":\"What is artificial intelligence?\"}\n",
+    "        ]\n",
+    "    ] * 20,\n",
+    "    n_parallel=10,\n",
+    ")\n",
+    "results"
+   ]
+  }
+ ],
+ "metadata": {
+  "kernelspec": {
+   "display_name": ".venv",
+   "language": "python",
+   "name": "python3"
+  },
+  "language_info": {
+   "codemirror_mode": {
+    "name": "ipython",
+    "version": 3
+   },
+   "file_extension": ".py",
+   "mimetype": "text/x-python",
+   "name": "python",
+   "nbconvert_exporter": "python",
+   "pygments_lexer": "ipython3",
+   "version": "3.12.8"
+  }
+ },
+ "nbformat": 4,
+ "nbformat_minor": 2
+}