Spaces:
Sleeping
Sleeping
import streamlit as st | |
import pandas as pd | |
import matplotlib.pyplot as plt | |
from transformers import AutoTokenizer, AutoModelForSequenceClassification | |
from scipy.special import softmax | |
import torch | |
st.set_page_config(page_title="Análise de Sentimentos", layout="wide") | |
st.title("🔍 Análise de Sentimentos") | |
st.markdown("Insira textos e escolha um modelo de linguagem para realizar a classificação de sentimentos.") | |
modelos_disponiveis = { | |
"FinBertPTBR (turing-usp) ": "turing-usp/FinBertPTBR", | |
"Multilingual Uncased BERT (nlptown)": "nlptown/bert-base-multilingual-uncased-sentiment", | |
"Multilingual Cased BERT (lxyuan)": "lxyuan/distilbert-base-multilingual-cased-sentiments-student", | |
"Multilingual Sentiment Analysis (tabularisai)" : "tabularisai/multilingual-sentiment-analysis" | |
} | |
modelo_escolhido = st.sidebar.selectbox("Escolha o modelo:", list(modelos_disponiveis.keys())) | |
model_name = modelos_disponiveis[modelo_escolhido] | |
def carregar_modelo(model_name): | |
tokenizer = AutoTokenizer.from_pretrained(model_name) | |
model = AutoModelForSequenceClassification.from_pretrained(model_name) | |
return tokenizer, model | |
tokenizer, model = carregar_modelo(model_name) | |
def avaliar_sentimento(texto): | |
inputs = tokenizer(texto, return_tensors="pt", padding=True, truncation=True, max_length=512) | |
with torch.no_grad(): | |
outputs = model(**inputs) | |
scores = softmax(outputs.logits[0].numpy()) | |
labels = model.config.id2label | |
resultado = {labels[i]: float(scores[i]) for i in range(len(scores))} | |
sentimento_previsto = max(resultado, key=resultado.get) | |
return {"sentimento": sentimento_previsto, "scores": resultado} | |
textos = st.text_area("Digite os textos (um por linha):", height=200) | |
if st.button("🔍 Analisar Sentimentos"): | |
linhas = [linha.strip() for linha in textos.strip().split("\n") if linha.strip()] | |
if not linhas: | |
st.warning("Por favor, insira ao menos um texto.") | |
else: | |
resultados = [] | |
for t in linhas: | |
res = avaliar_sentimento(t) | |
resultados.append({ | |
"Texto": t, | |
"Sentimento": res["sentimento"], | |
**res["scores"] | |
}) | |
df_resultados = pd.DataFrame(resultados) | |
st.success("Análise concluída!") | |
st.subheader("📋 Resultados") | |
st.dataframe(df_resultados, use_container_width=True) | |
st.subheader("📊 Distribuição de Sentimentos") | |
fig, ax = plt.subplots() | |
df_resultados["Sentimento"].value_counts().plot(kind='bar', ax=ax, rot=0) | |
ax.set_xlabel("Sentimento") | |
ax.set_ylabel("Frequência") | |
st.pyplot(fig) |