Spaces:
Running
Running
Update app.py
Browse files
app.py
CHANGED
@@ -24,7 +24,7 @@ cli_args = get_cli_args()
|
|
24 |
# 设置默认值(适用于 JSONL 文件)
|
25 |
DEFAULT_CONFIG = {
|
26 |
'model_path': 'BAAI/bge-base-en-v1.5',
|
27 |
-
'dataset_path': 'tool-embedding.jsonl', # JSONL 文件路径
|
28 |
'vector_size': 768,
|
29 |
'embedding_field': 'embedding', # JSON中存储embedding的字段名
|
30 |
'id_field': 'id' # JSON中作为待检索文本的字段
|
@@ -63,16 +63,17 @@ retriever = create_retriever(
|
|
63 |
)
|
64 |
|
65 |
# Streamlit 应用界面
|
66 |
-
st.title("
|
67 |
-
st.write("该应用基于预计算的 JSONL 文件 embedding,输入查询后将检索相似记录。")
|
68 |
|
69 |
# 查询输入
|
70 |
# 创建两列布局
|
71 |
col1, col2 = st.columns([2.5, 1])
|
|
|
72 |
with col1:
|
73 |
# 搜索输入框
|
74 |
query = st.text_input(
|
75 |
-
"
|
76 |
)
|
77 |
with col2:
|
78 |
# TopK选择滑块
|
@@ -80,7 +81,8 @@ with col2:
|
|
80 |
"Top K", 1, 100, 50, help="choose the number of results to display"
|
81 |
)
|
82 |
# 检索并展示结果
|
83 |
-
|
|
|
84 |
# 调用检索方法,返回JSON中id字段和对应的相似度得分
|
85 |
rec_ids, scores = retriever.search_return_id(query, top_k)
|
86 |
|
@@ -90,7 +92,7 @@ if st.button("query") and query:
|
|
90 |
"relevance": scores
|
91 |
})
|
92 |
|
93 |
-
st.subheader("🗂️
|
94 |
|
95 |
# 为 DataFrame 添加样式(交替行背景色)
|
96 |
styled_results = results_df.style.apply(
|
@@ -105,7 +107,7 @@ if st.button("query") and query:
|
|
105 |
st.dataframe(
|
106 |
styled_results,
|
107 |
column_config={
|
108 |
-
"tool": st.column_config.TextColumn("tool", help="
|
109 |
"relevance": st.column_config.ProgressColumn(
|
110 |
"relevance",
|
111 |
help="记录与查询的匹配程度",
|
|
|
24 |
# 设置默认值(适用于 JSONL 文件)
|
25 |
DEFAULT_CONFIG = {
|
26 |
'model_path': 'BAAI/bge-base-en-v1.5',
|
27 |
+
'dataset_path': 'src/tool-embedding.jsonl', # JSONL 文件路径
|
28 |
'vector_size': 768,
|
29 |
'embedding_field': 'embedding', # JSON中存储embedding的字段名
|
30 |
'id_field': 'id' # JSON中作为待检索文本的字段
|
|
|
63 |
)
|
64 |
|
65 |
# Streamlit 应用界面
|
66 |
+
st.title("Title")
|
67 |
+
# st.write("该应用基于预计算的 JSONL 文件 embedding,输入查询后将检索相似记录。")
|
68 |
|
69 |
# 查询输入
|
70 |
# 创建两列布局
|
71 |
col1, col2 = st.columns([2.5, 1])
|
72 |
+
query,topk = None, None
|
73 |
with col1:
|
74 |
# 搜索输入框
|
75 |
query = st.text_input(
|
76 |
+
"query", placeholder="your query", help=""
|
77 |
)
|
78 |
with col2:
|
79 |
# TopK选择滑块
|
|
|
81 |
"Top K", 1, 100, 50, help="choose the number of results to display"
|
82 |
)
|
83 |
# 检索并展示结果
|
84 |
+
|
85 |
+
if st.button("搜索") and query:
|
86 |
# 调用检索方法,返回JSON中id字段和对应的相似度得分
|
87 |
rec_ids, scores = retriever.search_return_id(query, top_k)
|
88 |
|
|
|
92 |
"relevance": scores
|
93 |
})
|
94 |
|
95 |
+
st.subheader("🗂️ 结果详情")
|
96 |
|
97 |
# 为 DataFrame 添加样式(交替行背景色)
|
98 |
styled_results = results_df.style.apply(
|
|
|
107 |
st.dataframe(
|
108 |
styled_results,
|
109 |
column_config={
|
110 |
+
"tool": st.column_config.TextColumn("tool", help="tool help text", width="medium"),
|
111 |
"relevance": st.column_config.ProgressColumn(
|
112 |
"relevance",
|
113 |
help="记录与查询的匹配程度",
|