Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
@@ -1,13 +1,9 @@
|
|
1 |
-
import os
|
2 |
-
os.environ['CUDA_VISIBLE_DEVICES'] = '3'
|
3 |
-
|
4 |
import os
|
5 |
import sys
|
6 |
import faiss
|
7 |
import numpy as np
|
8 |
import streamlit as st
|
9 |
from text2vec import SentenceModel
|
10 |
-
# 请确保 JSONLIndexer 在 src 目录下或者已正确安装
|
11 |
from src.jsonl_Indexer import JSONLIndexer
|
12 |
|
13 |
# 命令行参数处理函数
|
@@ -27,7 +23,7 @@ cli_args = get_cli_args()
|
|
27 |
# 设置默认值(适用于 JSONL 文件)
|
28 |
DEFAULT_CONFIG = {
|
29 |
'model_path': 'BAAI/bge-base-en-v1.5',
|
30 |
-
'dataset_path': '
|
31 |
'vector_size': 768,
|
32 |
'embedding_field': 'embedding', # JSON中存储embedding的字段名
|
33 |
'id_field': 'id' # JSON中作为待检索文本的字段
|
|
|
|
|
|
|
|
|
1 |
import os
|
2 |
import sys
|
3 |
import faiss
|
4 |
import numpy as np
|
5 |
import streamlit as st
|
6 |
from text2vec import SentenceModel
|
|
|
7 |
from src.jsonl_Indexer import JSONLIndexer
|
8 |
|
9 |
# 命令行参数处理函数
|
|
|
23 |
# 设置默认值(适用于 JSONL 文件)
|
24 |
DEFAULT_CONFIG = {
|
25 |
'model_path': 'BAAI/bge-base-en-v1.5',
|
26 |
+
'dataset_path': 'tool-embedding.jsonl', # JSONL 文件路径
|
27 |
'vector_size': 768,
|
28 |
'embedding_field': 'embedding', # JSON中存储embedding的字段名
|
29 |
'id_field': 'id' # JSON中作为待检索文本的字段
|