Spaces:

820nam
/

Test

Sleeping

File size: 6,635 Bytes

384f5e4
bfd4ab7
ebf358a
f8297ef
0a4103c
7c4d402
febef4d
717fe8c
7916a48
 
 
7c4d402
 
717fe8c
37db576
 
 
 
 
 
 
 
 
 
 
 
c87048f
f8297ef
c87048f
f8297ef
 
0a4103c
 
 
 
 
bfd4ab7
0a4103c
 
 
 
 
 
 
 
 
 
717fe8c
0a4103c
 
 
 
 
8b3a49e
0a4103c
 
 
ebf358a
0a4103c
 
ebf358a
d84d5f9
ebf358a
d10e98d
7c4d402
 
 
0f0bb0d
7c4d402
 
 
c87048f
7c4d402
ebf358a
7c4d402
d10e98d
242b668
5a80960
 
0a4103c
 
 
 
5a80960
 
 
 
 
 
 
 
0a4103c
 
 
 
 
 
 
 
 
ebf358a
8b3a49e
ebf358a
0a4103c
bfd4ab7
 
fd2d980
bfd4ab7
717fe8c
0a4103c
 
8b3a49e
ebf358a
0a4103c
 
 
 
ebf358a
 
384f5e4
ebf358a
0a4103c
 
fd2d980
 
384f5e4
bfd4ab7
0a4103c
bfd4ab7
58522ef
ebf358a
f8297ef
0a4103c
 
f8297ef
c87048f
 
 
 
 
 
 
ebf358a
95eccad
0a4103c
fd2d980
0a4103c
384f5e4
fd2d980
384f5e4
fd2d980
 
 
0a4103c
 
ebf358a
 
0a4103c
 
58522ef
fd2d980
ebf358a
0a4103c
 
fd2d980
ebf358a
fd2d980
ebf358a
 
61b8502

import streamlit as st
import requests
import matplotlib.pyplot as plt
import seaborn as sns
from transformers import pipeline
import openai
import os

# Streamlit 페이지 설정을 가장 먼저 호출
st.set_page_config(page_title="정치적 관점 분석", page_icon="📰", layout="wide")

# OpenAI API 키 설정 (환경변수에서 가져오는 방법)
openai.api_key = os.getenv("OPENAI_API_KEY")

# 한글 폰트 설정 (Streamlit에서 적용하기 위해 CSS 추가)
st.markdown(
    """
    <style>
    body {
        font-family: 'Nanum Gothic', sans-serif;
    }
    </style>
    """,
    unsafe_allow_html=True
)

# matplotlib 한글 폰트 설정
import matplotlib
matplotlib.rcParams['font.family'] = 'NanumGothic'  # 한글 폰트를 설정합니다.
matplotlib.rcParams['axes.unicode_minus'] = False  # 마이너스 기호 깨짐 방지

# 네이버 뉴스 API를 통해 실제 뉴스 기사 가져오기
def fetch_naver_news(query, display=5):
    client_id = "I_8koTJh3R5l4wLurQbG"  # 네이버 개발자 센터에서 발급받은 Client ID
    client_secret = "W5oWYlAgur"  # 네이버 개발자 센터에서 발급받은 Client Secret

    url = "https://openapi.naver.com/v1/search/news.json"
    headers = {
        "X-Naver-Client-Id": client_id,
        "X-Naver-Client-Secret": client_secret,
    }
    params = {
        "query": query,
        "display": display,
        "start": 1,
        "sort": "date",  # 최신순으로 정렬
    }

    response = requests.get(url, headers=headers, params=params)
    if response.status_code == 200:
        news_data = response.json()
        return news_data['items']  # 뉴스 기사 리스트 반환
    else:
        st.error("뉴스 데이터를 불러오는 데 실패했습니다.")
        return []

# 정치 성향 분석 모델 로드
def load_sentiment_model():
    classifier = pipeline("text-classification", model="bucketresearch/politicalBiasBERT")
    return classifier

# GPT-4를 이용해 반대 관점 기사 생성
def generate_article_gpt4(prompt):
    try:
        # GPT-4 모델을 이용해 반대 관점 기사를 생성
        response = openai.ChatCompletion.create(
            model="gpt-4",  # GPT-4 모델을 사용
            messages=[ 
                {"role": "system", "content": "You are a helpful assistant that generates articles."},
                {"role": "user", "content": prompt}  # 사용자가 제공한 프롬프트
            ],
            max_tokens=1024,  # 글자 수 제한 해제 (최대 1024 토큰)
            temperature=0.7  # 창의성 정도
        )
        return response['choices'][0]['message']['content']  # GPT의 응답 텍스트 반환
    except Exception as e:
        return f"Error generating text: {e}"

# 정치 성향 분석
def analyze_article_sentiment(text, classifier):
    result = classifier(text[:512])  # 너무 긴 텍스트는 잘라서 분석
    label = result[0]["label"]
    score = result[0]["score"]

    # 모델에서 반환하는 라벨을 "진보", "보수", "중립"으로 매핑
    if label == "LEFT":
        return "진보", score
    elif label == "RIGHT":
        return "보수", score
    else:
        return "중립", score

# 정치적 관점 비교 및 반대 관점 생성
def analyze_news_political_viewpoint(query):
    # 뉴스 데이터 가져오기
    news_items = fetch_naver_news(query)
    if not news_items:
        return [], {}

    classifier = load_sentiment_model()
    results = []
    sentiment_counts = {"진보": 0, "보수": 0, "중립": 0}  # 매핑된 라벨에 맞게 초기화

    for item in news_items:
        title = item["title"]
        description = item["description"]
        link = item["link"]  # 뉴스 링크 가져오기
        combined_text = f"{title}. {description}"

        # 기사 성향 분석
        sentiment, score = analyze_article_sentiment(combined_text, classifier)
        sentiment_counts[sentiment] += 1  # 매핑된 키로 카운트 증가

        # 반대 관점 기사 생성
        opposite_perspective = "보수적" if sentiment == "진보" else "진보적"
        prompt = f"{combined_text}를 기반으로 {opposite_perspective} 관점의 기사를 작성해주세요."
        opposite_article = generate_article_gpt4(prompt)

        results.append({
            "제목": title,
            "원본 기사": description,
            "성향": sentiment,
            "성향 점수": score,
            "대조 관점 기사": opposite_article,
            "뉴스 링크": link  # 링크 추가
        })

    return results, sentiment_counts

# 성향 분포 시각화 (막대 그래프)
def visualize_sentiment_distribution(sentiment_counts):
    fig, ax = plt.subplots(figsize=(8, 5))
    labels = list(sentiment_counts.keys())
    sizes = list(sentiment_counts.values())

    # 색상 설정 (부드러운 팔레트)
    color_palette = sns.color_palette("pastel")[0:len(sizes)]
    
    ax.bar(labels, sizes, color=color_palette)
    ax.set_xlabel('성향', fontsize=14)
    ax.set_ylabel('건수', fontsize=14)
    ax.set_title('뉴스 성향 분포', fontsize=16)
    st.pyplot(fig)

# Streamlit 애플리케이션
st.title("📰 정치적 관점 비교 분석 도구")
st.markdown("뉴스 기사의 정치 성향 분석과 반대 관점 기사를 생성하여 비교합니다.")

# 사용자로부터 검색어 입력 받기
query = st.text_input("검색 키워드를 입력하세요", value="정치")

# 분석 시작 버튼
if st.button("🔍 분석 시작"):
    with st.spinner("분석 중..."):
        analysis_results, sentiment_counts = analyze_news_political_viewpoint(query)

        if analysis_results:
            st.success("뉴스 분석이 완료되었습니다.")
            
            # 성향 분포 시각화 (막대 그래프)
            st.subheader("📊 성향 분포 시각화")
            visualize_sentiment_distribution(sentiment_counts)
            
            # 상세 분석 결과 출력
            st.subheader("📝 상세 분석 결과")
            for result in analysis_results:
                st.write(f"#### {result['제목']}")
                st.write(f"- **원본 기사**: {result['원본 기사']}")
                st.write(f"- **성향**: {result['성향']} (점수: {result['성향 점수']:.2f})")
                st.write(f"- **대조 관점 기사**: {result['대조 관점 기사']}")
                st.write(f"- **뉴스 링크**: [링크]({result['뉴스 링크']})")  # 링크 출력
                st.write("---")
        else:
            st.error("분석된 뉴스 데이터가 없습니다.")