chaima01
/

flan-t5-pilgrim

Text Generation

text2text-generation

Model card Files Files and versions Metrics Training metrics Community

flan-t5-pilgrim / inference.py

chaima01's picture

Create inference.py

8e44141 verified 2 months ago

history blame contribute delete

664 Bytes

	# inference.py

	from transformers import pipeline

	# This will be called once, at container startup
	def init():
	global generator
	generator = pipeline(
	"text2text-generation",
	model=".",
	tokenizer=".",
	device=0, # GPU 0
	max_length=128,
	do_sample=True,
	top_p=0.9,
	temperature=0.7
	)

	# This will be called for every request
	def run(request: dict):
	"""
	Expects: { "inputs": "<your-prompt>" }
	Returns: { "generated_text": "..." }
	"""
	prompt = request.get("inputs", "")
	outputs = generator(prompt)
	return { "generated_text": outputs[0]["generated_text"] }