Spaces:

huggingface
/

inference-playground

Running on CPU Upgrade

inference-playground / src /routes /api /generate /adapter.ts

Thomas G. Lopes

MCPs (#91)

52c6f5c unverified 13 days ago

2.19 kB

	/* eslint-disable @typescript-eslint/no-explicit-any -- Sorry */
	import { omit } from "$lib/utils/object.svelte.js";
	import { InferenceClient } from "@huggingface/inference";
	import type { ChatCompletionInputMessage } from "@huggingface/tasks";
	import OpenAI from "openai";
	import type { Stream } from "openai/streaming.mjs";
	import type { GenerateRequest, OpenAIFunctionSchema } from "./types.js";
	import type { ChatCompletionMessage } from "openai/resources/index.mjs";

	export type GenerationArgs = {
	model: string;
	messages: Array<ChatCompletionInputMessage \| ChatCompletionMessage>;
	provider?: string;
	config?: Record<string, unknown>;
	tools?: OpenAIFunctionSchema[];
	response_format?: unknown;
	};

	export interface Adapter {
	stream: (args: GenerationArgs) => Promise<Stream<OpenAI.Chat.Completions.ChatCompletionChunk>>;
	generate: (args: GenerationArgs) => Promise<OpenAI.Chat.Completions.ChatCompletion>;
	}

	function createCustomAdapter({ model }: GenerateRequest): Adapter {
	// Handle OpenAI-compatible custom models
	const openai = new OpenAI({
	apiKey: model.accessToken,
	baseURL: model.endpointUrl,
	});

	return {
	stream: async (args: GenerationArgs) => {
	return await openai.chat.completions.create({
	...omit(args, "provider"),
	stream: true,
	} as OpenAI.ChatCompletionCreateParamsStreaming);
	},
	generate: (args: GenerationArgs) => {
	return openai.chat.completions.create({
	...omit(args, "provider"),
	stream: false,
	} as OpenAI.ChatCompletionCreateParamsNonStreaming);
	},
	};
	}

	function createHFAdapter({ accessToken }: GenerateRequest): Adapter {
	const client = new InferenceClient(accessToken);
	return {
	stream: (args: GenerationArgs) => {
	return client.chatCompletionStream({
	...args,
	provider: args.provider as any,
	response_format: args.response_format as any,
	tools: args.tools as any,
	} as any) as any;
	},
	generate: (args: GenerationArgs) => {
	return client.chatCompletion(args as any) as any;
	},
	};
	}

	export function createAdapter(body: GenerateRequest): Adapter {
	const { model } = body;

	if (model.isCustom) {
	return createCustomAdapter(body);
	}
	return createHFAdapter(body);
	}