Spaces:

KevSun
/

LinguisticFeatures

Sleeping

KevSun commited on Jul 25, 2024

Commit

cf15af0

verified ·

1 Parent(s): 18d2947

Upload app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -7,7 +7,6 @@ from langdetect import detect, DetectorFactory
 import numpy as np
 import matplotlib.pyplot as plt
 import pandas as pd
-import torch
 st.set_page_config(page_title="Multilingual Text Analysis System", layout="wide")
@@ -59,7 +58,9 @@ def detect_language(text):
 @st.cache_data
 def tsne_visualization(embeddings, words):
-    tsne = TSNE(n_components=2, random_state=42)
     embeddings_2d = tsne.fit_transform(embeddings)
     df = pd.DataFrame(embeddings_2d, columns=['x', 'y'])
     df['word'] = words

 import numpy as np
 import matplotlib.pyplot as plt
 import pandas as pd
 st.set_page_config(page_title="Multilingual Text Analysis System", layout="wide")
 @st.cache_data
 def tsne_visualization(embeddings, words):
+    n_samples = len(embeddings)
+    perplexity = min(30, n_samples - 1)  # Ensure perplexity is less than the number of samples
+    tsne = TSNE(n_components=2, perplexity=perplexity, random_state=42)
     embeddings_2d = tsne.fit_transform(embeddings)
     df = pd.DataFrame(embeddings_2d, columns=['x', 'y'])
     df['word'] = words