Spaces:

820nam
/

Test

Sleeping

App Files Files Community

Test / app.py

820nam

Update app.py

60f9cc3 verified 8 months ago

raw

history blame

4.22 kB

	import streamlit as st
	import pandas as pd
	import requests
	from transformers import pipeline, AutoTokenizer, AutoModelForSequenceClassification
	import os

	# 딥러닝 모델 로드
	@st.cache_resource
	def load_model():
	model_name = "bucketresearch/politicalBiasBERT"
	tokenizer = AutoTokenizer.from_pretrained(model_name)
	model = AutoModelForSequenceClassification.from_pretrained(model_name)
	return pipeline("text-classification", model=model, tokenizer=tokenizer)

	# 네이버 뉴스 API 호출
	def fetch_naver_news(query, display=5):
	url = "https://openapi.naver.com/v1/search/news.json"
	headers = {
	"X-Naver-Client-Id": "I_8koTJh3R5l4wLurQbG", # 여기에 직접 API 클라이언트 ID 입력
	"X-Naver-Client-Secret": "W5oWYlAgur", # 여기에 직접 API 클라이언트 비밀키 입력
	}

	params = {"query": query, "display": display, "sort": "sim"}
	try:
	response = requests.get(url, headers=headers, params=params)
	response.raise_for_status() # HTTP 오류 처리
	return response.json()
	except requests.exceptions.RequestException as e:
	st.error(f"API 호출 중 오류 발생: {e}")
	return None # 뉴스 데이터가 없으면 None 반환

	# 정치 성향 분류
	def classify_sentiment(text, classifier):
	result = classifier(text, truncation=True, max_length=512)
	label = result[0]['label']
	score = result[0]['score']
	if label in ['LABEL_0', 'LABEL_1']: # 라벨에 따라 수정 필요
	return "보수", score
	elif label in ['LABEL_4']: # 라벨에 따라 수정 필요
	return "진보", score
	else:
	return "중립", score

	# 뉴스 데이터 분석
	def analyze_news(news_items, classifier):
	results = {"진보": 0, "보수": 0, "중립": 0}
	detailed_results = []

	for item in news_items:
	title = item["title"]
	description = item["description"]
	link = item["link"]
	combined_text = f"{title}. {description}"

	# 정치 성향 분류
	orientation, score = classify_sentiment(combined_text, classifier)
	results[orientation] += 1
	detailed_results.append({
	"제목": title,
	"요약": description,
	"링크": link,
	"성향": orientation,
	"점수": score,
	})

	return results, detailed_results

	# Streamlit 앱 시작
	st.title("정치 성향 분석 대시보드")
	st.markdown("### 네이버 뉴스 데이터를 실시간으로 수집하고 정치 성향을 분석합니다.")

	# 검색 키워드 입력
	query = st.text_input("검색 키워드를 입력하세요", value="정치")

	if st.button("분석 시작"):
	with st.spinner("데이터를 분석 중입니다..."):
	try:
	# 네이버 뉴스 데이터 수집
	news_data = fetch_naver_news(query, display=10)
	if news_data is None:
	st.error("뉴스 데이터가 없습니다.")
	else:
	news_items = news_data["items"]

	# 모델 로드
	classifier = load_model()

	# 뉴스 데이터 분석
	results, detailed_results = analyze_news(news_items, classifier)

	# 분석 결과 시각화
	st.subheader("분석 결과 요약")
	st.write(f"진보: {results['진보']}건")
	st.write(f"보수: {results['보수']}건")
	st.write(f"중립: {results['중립']}건")

	# 파이 차트
	st.subheader("성향 분포 차트")
	st.bar_chart(pd.DataFrame.from_dict(results, orient='index', columns=["건수"]))

	# 세부 결과 출력
	st.subheader("세부 결과")
	df = pd.DataFrame(detailed_results)
	st.dataframe(df)

	# 링크 포함한 뉴스 출력
	st.subheader("뉴스 링크")
	for index, row in df.iterrows():
	st.write(f"- [{row['제목']}]({row['링크']}) (성향: {row['성향']}, 점수: {row['점수']:.2f})")
	except Exception as e:
	st.error(f"오류 발생: {e}")