VietCat commited on
Commit
a539a2e
·
1 Parent(s): 631df38

adjust generation time

Browse files
Files changed (1) hide show
  1. app.py +11 -8
app.py CHANGED
@@ -46,7 +46,7 @@ def clean_text(text):
46
  text = re.sub(r'\s+', ' ', text).strip() # Normalize spaces
47
  return text
48
 
49
- def generate_text(prompt, max_length=50, temperature=0.7):
50
  try:
51
  start_time = time.time()
52
  print_system_resources() # Print resources before generation
@@ -63,19 +63,19 @@ def generate_text(prompt, max_length=50, temperature=0.7):
63
  outputs = model.generate(
64
  input_ids=inputs["input_ids"],
65
  attention_mask=inputs["attention_mask"],
66
- max_new_tokens=30,
67
  min_length=10, # Ensure minimum output length
68
- temperature=temperature,
69
  do_sample=False, # Use greedy decoding for consistency
70
- num_beams=3, # Use beam search for better quality
71
  no_repeat_ngram_size=2,
72
  pad_token_id=tokenizer.pad_token_id,
73
  early_stopping=True
74
  )
75
  generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
 
76
  cleaned_text = clean_text(generated_text)
77
  elapsed_time = time.time() - start_time
78
- print_system_resources()
79
  print(f"Generation time: {elapsed_time:.2f} seconds")
80
  return cleaned_text
81
  except Exception as e:
@@ -85,9 +85,12 @@ def generate_text(prompt, max_length=50, temperature=0.7):
85
  demo = gr.Interface(
86
  fn=generate_text,
87
  inputs=[
88
- gr.Textbox(label="Nhập văn bản đầu vào", placeholder="Viết gì đó bằng tiếng Việt...", value="Hôm nay là một ngày đẹp trời"),
89
- gr.Slider(20, 100, value=50, step=10, label="Độ dài tối đa"),
90
- gr.Slider(0.5, 1.0, value=0.7, step=0.1, label="Nhiệt độ (Temperature)")
 
 
 
91
  ],
92
  outputs="text",
93
  title="Sinh văn bản tiếng Việt",
 
46
  text = re.sub(r'\s+', ' ', text).strip() # Normalize spaces
47
  return text
48
 
49
+ def generate_text(prompt, max_length=50):
50
  try:
51
  start_time = time.time()
52
  print_system_resources() # Print resources before generation
 
63
  outputs = model.generate(
64
  input_ids=inputs["input_ids"],
65
  attention_mask=inputs["attention_mask"],
66
+ max_new_tokens=20, # Reduce to speed up
67
  min_length=10, # Ensure minimum output length
 
68
  do_sample=False, # Use greedy decoding for consistency
69
+ num_beams=1, # Disable beam search for speed
70
  no_repeat_ngram_size=2,
71
  pad_token_id=tokenizer.pad_token_id,
72
  early_stopping=True
73
  )
74
  generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
75
+ print(f"Raw output: {generated_text}") # Debug raw output
76
  cleaned_text = clean_text(generated_text)
77
  elapsed_time = time.time() - start_time
78
+ print_system_resources() # Print resources after generation
79
  print(f"Generation time: {elapsed_time:.2f} seconds")
80
  return cleaned_text
81
  except Exception as e:
 
85
  demo = gr.Interface(
86
  fn=generate_text,
87
  inputs=[
88
+ gr.Textbox(
89
+ label="Nhập văn bản đầu vào",
90
+ placeholder="Viết đó bằng tiếng Việt...",
91
+ value="Hôm nay là một ngày đẹp trời" # Set default text
92
+ ),
93
+ gr.Slider(20, 100, value=50, step=10, label="Độ dài tối đa")
94
  ],
95
  outputs="text",
96
  title="Sinh văn bản tiếng Việt",