Spaces:

820nam
/

Test

Sleeping

App Files Files Community

820nam commited on Nov 28, 2024

Commit

bfd4ab7

verified ·

1 Parent(s): b726836

Create app.py

Browse files

Files changed (1) hide show

app.py +102 -0

app.py ADDED Viewed

	@@ -0,0 +1,102 @@

+import streamlit as st
+import pandas as pd
+import requests
+from transformers import pipeline, AutoTokenizer, AutoModelForSequenceClassification
+# 딥러닝 모델 로드
+@st.cache_resource
+def load_model():
+    model_name = "nlptown/bert-base-multilingual-uncased-sentiment"
+    tokenizer = AutoTokenizer.from_pretrained(model_name)
+    model = AutoModelForSequenceClassification.from_pretrained(model_name)
+    return pipeline("text-classification", model=model, tokenizer=tokenizer)
+# 네이버 뉴스 API 호출
+def fetch_naver_news(query, display=5):
+    url = "https://openapi.naver.com/v1/search/news.json"
+    headers = {
+        "X-Naver-Client-Id": "YOUR_CLIENT_ID",
+        "X-Naver-Client-Secret": "YOUR_CLIENT_SECRET",
+    }
+    params = {"query": query, "display": display, "sort": "sim"}
+    response = requests.get(url, headers=headers, params=params)
+    response.raise_for_status()
+    return response.json()
+# 정치 성향 분류
+def classify_sentiment(text, classifier):
+    result = classifier(text, truncation=True, max_length=512)
+    label = result[0]['label']
+    score = result[0]['score']
+    if label in ['LABEL_0', 'LABEL_1']:
+        return "보수", score
+    elif label in ['LABEL_4']:
+        return "진보", score
+    else:
+        return "중립", score
+# 뉴스 데이터 분석
+def analyze_news(news_items, classifier):
+    results = {"진보": 0, "보수": 0, "중립": 0}
+    detailed_results = []
+    for item in news_items:
+        title = item["title"]
+        description = item["description"]
+        link = item["link"]
+        combined_text = f"{title}. {description}"
+        # 정치 성향 분류
+        orientation, score = classify_sentiment(combined_text, classifier)
+        results[orientation] += 1
+        detailed_results.append({
+            "제목": title,
+            "요약": description,
+            "링크": link,
+            "성향": orientation,
+            "점수": score,
+        })
+    return results, detailed_results
+# Streamlit 앱 시작
+st.title("정치 성향 분석 대시보드")
+st.markdown("### 네이버 뉴스 데이터를 실시간으로 수집하고 정치 성향을 분석합니다.")
+# 검색 키워드 입력
+query = st.text_input("검색 키워드를 입력하세요", value="정치")
+if st.button("분석 시작"):
+    with st.spinner("데이터를 분석 중입니다..."):
+        try:
+            # 네이버 뉴스 데이터 수집
+            news_data = fetch_naver_news(query, display=10)
+            news_items = news_data["items"]
+            # 모델 로드
+            classifier = load_model()
+            # 뉴스 데이터 분석
+            results, detailed_results = analyze_news(news_items, classifier)
+            # 분석 결과 시각화
+            st.subheader("분석 결과 요약")
+            st.write(f"진보: {results['진보']}건")
+            st.write(f"보수: {results['보수']}건")
+            st.write(f"중립: {results['중립']}건")
+            # 파이 차트
+            st.subheader("성향 분포 차트")
+            st.bar_chart(pd.DataFrame.from_dict(results, orient='index', columns=["건수"]))
+            # 세부 결과 출력
+            st.subheader("세부 결과")
+            df = pd.DataFrame(detailed_results)
+            st.dataframe(df)
+            # 링크 포함한 뉴스 출력
+            st.subheader("뉴스 링크")
+            for index, row in df.iterrows():
+                st.write(f"- [{row['제목']}]({row['링크']}) (성향: {row['성향']}, 점수: {row['점수']:.2f})")
+        except Exception as e:
+            st.error(f"오류 발생: {e}")