hashiruAI

Sleeping

App Files Files Community

helloparthshah commited on May 31

Commit

1c31898

1 Parent(s): eb1e30c

Tracking budget for manager too

Browse files

Files changed (2) hide show

src/manager/manager.py +18 -0
src/models/models.json +8 -8

src/manager/manager.py CHANGED Viewed

@@ -47,6 +47,8 @@ class GeminiManager:
     def __init__(self, system_prompt_file="./src/models/system6.prompt",
                  gemini_model="gemini-2.5-pro-exp-03-25",
                  modes: List[Mode] = []):
         load_dotenv()
         self.budget_manager = BudgetManager()
@@ -110,6 +112,14 @@ class GeminiManager:
                           jitter=None)
     def generate_response(self, messages):
         tools = self.toolsLoader.getTools()
         return self.client.models.generate_content_stream(
             model=self.model_name,
             contents=messages,
@@ -141,6 +151,7 @@ class GeminiManager:
                 }
             }
             try:
                 toolResponse = self.toolsLoader.runTool(
                     function_call.name, function_call.args)
             except Exception as e:
@@ -187,6 +198,7 @@ class GeminiManager:
                     response={"result": f"{function_call.name} with {function_call.args} doesn't follow the required format, please read the other tool implementations for reference." + str(e)})
             parts.append(tool_content)
             i += 1
         yield {
             "role": "tool",
             "content": repr(types.Content(
@@ -305,6 +317,8 @@ class GeminiManager:
         except Exception as e:
             pass
         yield from self.invoke_manager(messages)
     def invoke_manager(self, messages):
         chat_history = self.format_chat_history(messages)
@@ -342,6 +356,10 @@ class GeminiManager:
                     "role": "assistant",
                     "content": full_text,
                 })
             if function_call_requests:
                 messages = messages + function_call_requests
             yield messages

     def __init__(self, system_prompt_file="./src/models/system6.prompt",
                  gemini_model="gemini-2.5-pro-exp-03-25",
                  modes: List[Mode] = []):
+        self.input_tokens = 0
+        self.output_tokens = 0
         load_dotenv()
         self.budget_manager = BudgetManager()
                           jitter=None)
     def generate_response(self, messages):
         tools = self.toolsLoader.getTools()
+        response = self.client.models.count_tokens(
+            model=self.model_name,
+            contents=messages,
+        )
+        self.budget_manager.add_to_expense_budget(
+            response.total_tokens * 0.10/1000000  # Assuming $0.10 per million tokens
+        )
+        self.input_tokens += response.total_tokens
         return self.client.models.generate_content_stream(
             model=self.model_name,
             contents=messages,
                 }
             }
             try:
+                self.input_tokens += len(repr(function_call).split())
                 toolResponse = self.toolsLoader.runTool(
                     function_call.name, function_call.args)
             except Exception as e:
                     response={"result": f"{function_call.name} with {function_call.args} doesn't follow the required format, please read the other tool implementations for reference." + str(e)})
             parts.append(tool_content)
             i += 1
+        self.output_tokens += len(repr(parts).split())
         yield {
             "role": "tool",
             "content": repr(types.Content(
         except Exception as e:
             pass
         yield from self.invoke_manager(messages)
+        print("Tokens used: Input: {}, Output: {}".format(
+            self.input_tokens, self.output_tokens))
     def invoke_manager(self, messages):
         chat_history = self.format_chat_history(messages)
                     "role": "assistant",
                     "content": full_text,
                 })
+                self.output_tokens += len(full_text.split())
+                self.budget_manager.add_to_expense_budget(
+                    len(full_text.split()) * 0.40/1000000  # Assuming $0.40 per million tokens
+                )
             if function_call_requests:
                 messages = messages + function_call_requests
             yield messages

src/models/models.json CHANGED Viewed

@@ -1,12 +1,12 @@
 {
-    "Poet": {
-        "base_model": "gemini-1.5-flash",
-        "description": "Agent that writes poems",
-        "system_prompt": "You are an agent that writes poems. When asked to write a poem, you should write a poem on the topic provided.",
-        "create_resource_cost": 0,
-        "invoke_resource_cost": 0,
         "create_expense_cost": 0,
-        "invoke_expense_cost": 0.075,
-        "output_expense_cost": 0.3
     }
 }

 {
+    "KunalPaiResearcher": {
+        "base_model": "mistral",
+        "description": "Agent to research and summarize information about Kunal Pai",
+        "system_prompt": "You are an AI agent that specializes in researching individuals based on publicly available information and creating concise summaries of their background, education, work experience, and research interests.",
+        "create_resource_cost": 20,
+        "invoke_resource_cost": 100,
         "create_expense_cost": 0,
+        "invoke_expense_cost": 0,
+        "output_expense_cost": 0
     }
 }