Spaces:

820nam
/

Test

Sleeping

File size: 4,222 Bytes

bfd4ab7
 
 
 
2e4d46c
bfd4ab7
 
 
 
2e4d46c
bfd4ab7
 
 
 
 
 
 
 
60f9cc3
 
bfd4ab7
60f9cc3
bfd4ab7
2e4d46c
 
 
 
 
 
71dba8d
bfd4ab7
 
 
 
 
 
2e4d46c
bfd4ab7
2e4d46c
bfd4ab7
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
2e4d46c
71dba8d
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
bfd4ab7

import streamlit as st
import pandas as pd
import requests
from transformers import pipeline, AutoTokenizer, AutoModelForSequenceClassification
import os

# 딥러닝 모델 로드
@st.cache_resource
def load_model():
    model_name = "bucketresearch/politicalBiasBERT"
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForSequenceClassification.from_pretrained(model_name)
    return pipeline("text-classification", model=model, tokenizer=tokenizer)

# 네이버 뉴스 API 호출
def fetch_naver_news(query, display=5):
    url = "https://openapi.naver.com/v1/search/news.json"
    headers = {
        "X-Naver-Client-Id": "I_8koTJh3R5l4wLurQbG",  # 여기에 직접 API 클라이언트 ID 입력
        "X-Naver-Client-Secret": "W5oWYlAgur",  # 여기에 직접 API 클라이언트 비밀키 입력
    }

    params = {"query": query, "display": display, "sort": "sim"}
    try:
        response = requests.get(url, headers=headers, params=params)
        response.raise_for_status()  # HTTP 오류 처리
        return response.json()
    except requests.exceptions.RequestException as e:
        st.error(f"API 호출 중 오류 발생: {e}")
        return None  # 뉴스 데이터가 없으면 None 반환

# 정치 성향 분류
def classify_sentiment(text, classifier):
    result = classifier(text, truncation=True, max_length=512)
    label = result[0]['label']
    score = result[0]['score']
    if label in ['LABEL_0', 'LABEL_1']:  # 라벨에 따라 수정 필요
        return "보수", score
    elif label in ['LABEL_4']:  # 라벨에 따라 수정 필요
        return "진보", score
    else:
        return "중립", score

# 뉴스 데이터 분석
def analyze_news(news_items, classifier):
    results = {"진보": 0, "보수": 0, "중립": 0}
    detailed_results = []

    for item in news_items:
        title = item["title"]
        description = item["description"]
        link = item["link"]
        combined_text = f"{title}. {description}"

        # 정치 성향 분류
        orientation, score = classify_sentiment(combined_text, classifier)
        results[orientation] += 1
        detailed_results.append({
            "제목": title,
            "요약": description,
            "링크": link,
            "성향": orientation,
            "점수": score,
        })

    return results, detailed_results

# Streamlit 앱 시작
st.title("정치 성향 분석 대시보드")
st.markdown("### 네이버 뉴스 데이터를 실시간으로 수집하고 정치 성향을 분석합니다.")

# 검색 키워드 입력
query = st.text_input("검색 키워드를 입력하세요", value="정치")

if st.button("분석 시작"):
    with st.spinner("데이터를 분석 중입니다..."):
        try:
            # 네이버 뉴스 데이터 수집
            news_data = fetch_naver_news(query, display=10)
            if news_data is None:
                st.error("뉴스 데이터가 없습니다.")
            else:
                news_items = news_data["items"]

                # 모델 로드
                classifier = load_model()

                # 뉴스 데이터 분석
                results, detailed_results = analyze_news(news_items, classifier)

                # 분석 결과 시각화
                st.subheader("분석 결과 요약")
                st.write(f"진보: {results['진보']}건")
                st.write(f"보수: {results['보수']}건")
                st.write(f"중립: {results['중립']}건")

                # 파이 차트
                st.subheader("성향 분포 차트")
                st.bar_chart(pd.DataFrame.from_dict(results, orient='index', columns=["건수"]))

                # 세부 결과 출력
                st.subheader("세부 결과")
                df = pd.DataFrame(detailed_results)
                st.dataframe(df)

                # 링크 포함한 뉴스 출력
                st.subheader("뉴스 링크")
                for index, row in df.iterrows():
                    st.write(f"- [{row['제목']}]({row['링크']}) (성향: {row['성향']}, 점수: {row['점수']:.2f})")
        except Exception as e:
            st.error(f"오류 발생: {e}")