yxccai commited on
Commit
e48bb0e
·
verified ·
1 Parent(s): 477ebf7

Upload 3 files

Browse files
Files changed (3) hide show
  1. README.md +14 -13
  2. app.py +54 -0
  3. requirements.txt +3 -0
README.md CHANGED
@@ -1,13 +1,14 @@
1
- ---
2
- title: Text Api
3
- emoji: 😻
4
- colorFrom: indigo
5
- colorTo: yellow
6
- sdk: gradio
7
- sdk_version: 5.32.1
8
- app_file: app.py
9
- pinned: false
10
- license: apache-2.0
11
- ---
12
-
13
- Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference
 
 
1
+ ---
2
+ title: 文本风格转换器
3
+ emoji: 🗣️
4
+ colorFrom: blue
5
+ colorTo: green
6
+ sdk: gradio
7
+ sdk_version: 3.40.0
8
+ app_file: app.py
9
+ pinned: false
10
+ ---
11
+
12
+ # 中文文本风格转换器
13
+
14
+ 这是一个将书面化、技术性文本转换为自然、口语化表达的语言风格转换模型,基于 yxccai/text-style-converter 微调模型实现。
app.py ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import gradio as gr
2
+ from transformers import AutoTokenizer, AutoModelForCausalLM
3
+ import torch
4
+
5
+ # 模型名称(与你上传一致)
6
+ model_name = "yxccai/text-style-converter"
7
+
8
+ # 加载 tokenizer 和 model
9
+ tokenizer = AutoTokenizer.from_pretrained(model_name)
10
+ model = AutoModelForCausalLM.from_pretrained(
11
+ model_name,
12
+ torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32,
13
+ device_map="auto"
14
+ )
15
+
16
+ # 构建推理函数
17
+ def convert_style(input_text):
18
+ prompt = f"""以下是一个文本风格转换任务,请将书面化、技术性的输入文本转换为自然、口语化的表达方式。
19
+
20
+ ### 输入文本:
21
+ {input_text}
22
+
23
+ ### 输出文本:
24
+ """
25
+
26
+ inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
27
+ outputs = model.generate(
28
+ **inputs,
29
+ max_new_tokens=300,
30
+ temperature=0.7,
31
+ do_sample=True,
32
+ pad_token_id=tokenizer.eos_token_id
33
+ )
34
+ response = tokenizer.decode(outputs[0], skip_special_tokens=True)
35
+
36
+ # 提取输出部分
37
+ if "### 输出文本:" in response:
38
+ return response.split("### 输出文本:")[-1].strip()
39
+ return response.strip()
40
+
41
+ # 构建界面
42
+ iface = gr.Interface(
43
+ fn=convert_style,
44
+ inputs=gr.Textbox(label="输入书面化技术性文本"),
45
+ outputs=gr.Textbox(label="口语化转换结果"),
46
+ title="中文文本风格转换器",
47
+ description="将正式、技术性文本转换为自然、口语化表达的语言风格转换模型。",
48
+ examples=[
49
+ ["乙醇的检测方法包括酸碱度检查。"],
50
+ ["本品为薄膜衣片,除去包衣后显橙红色。"]
51
+ ]
52
+ )
53
+
54
+ iface.launch()
requirements.txt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ transformers>=4.30.0
2
+ torch>=2.0.0
3
+ gradio>=3.40.0