Spaces:

820nam
/

Test

Sleeping

App Files Files Community

Test / app.py

820nam

Update app.py

ebf358a verified 8 months ago

raw

history blame

4.33 kB

	import streamlit as st
	import requests
	import openai
	from transformers import pipeline
	import matplotlib.pyplot as plt
	import pandas as pd

	# OpenAI API 키 설정
	openai.api_key = "YOUR_OPENAI_API_KEY"

	# Step 1: 네이버 뉴스 데이터 수집
	def fetch_news(query, display=5):
	client_id = "YOUR_NAVER_CLIENT_ID"
	client_secret = "YOUR_NAVER_CLIENT_SECRET"
	url = "https://openapi.naver.com/v1/search/news.json"
	headers = {"X-Naver-Client-Id": client_id, "X-Naver-Client-Secret": client_secret}
	params = {"query": query, "display": display, "start": 1, "sort": "date"}
	response = requests.get(url, headers=headers, params=params)
	return response.json()["items"] if response.status_code == 200 else []

	# Step 2: 정치 성향 분석 모델 로드
	def load_sentiment_model():
	return pipeline("text-classification", model="bucketresearch/politicalBiasBERT")

	# Step 3: GPT-4를 사용해 대조 관점 기사 생성
	def generate_article_gpt4(prompt):
	try:
	response = openai.ChatCompletion.create(
	model="gpt-4",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=512,
	temperature=0.7,
	)
	return response['choices'][0]['message']['content']
	except Exception as e:
	return f"Error generating text: {e}"

	# Step 4: 뉴스 데이터 분석 및 결과 생성
	def analyze_news_political_viewpoint(query, sentiment_model):
	news_data = fetch_news(query)
	if not news_data:
	return "뉴스 데이터를 불러오는 데 실패했습니다.", None, None

	results = []
	sentiment_counts = {"진보": 0, "보수": 0}

	for item in news_data:
	title = item["title"]
	description = item["description"]
	combined_text = f"{title}. {description}"

	# 성향 분석
	sentiment = sentiment_model(combined_text[:512])[0]
	sentiment_label = sentiment["label"]
	sentiment_score = sentiment["score"]

	# 진보적/보수적 관점 반대로 기사 생성
	if sentiment_label == "진보":
	prompt = f"다음 기사를 보수적 관점에서 작성해주세요:\n{combined_text}"
	elif sentiment_label == "보수":
	prompt = f"다음 기사를 진보적 관점에서 작성해주세요:\n{combined_text}"
	else:
	continue # 중립 기사는 제외

	generated_article = generate_article_gpt4(prompt)
	sentiment_counts[sentiment_label] += 1

	# 결과 저장
	results.append({
	"제목": title,
	"원본 기사": description,
	"성향": sentiment_label,
	"성향 점수": sentiment_score,
	"대조 관점 기사": generated_article,
	})

	return "뉴스 분석이 완료되었습니다.", results, sentiment_counts

	# Step 5: 시각화 함수
	def visualize_sentiment_distribution(sentiment_counts):
	labels = list(sentiment_counts.keys())
	values = list(sentiment_counts.values())
	fig, ax = plt.subplots()
	ax.bar(labels, values, color=['blue', 'red'])
	ax.set_title("진보 vs 보수 기사 수")
	ax.set_ylabel("기사 수")
	st.pyplot(fig)

	# Step 6: Streamlit UI
	st.title("정치적 관점 비교 분석 도구")
	st.markdown("### 뉴스 기사의 정치 성향 분석과 반대 관점 기사 생성")

	query = st.text_input("검색 키워드를 입력하세요", value="정치")
	if st.button("분석 시작"):
	with st.spinner("분석 중입니다..."):
	sentiment_model = load_sentiment_model()
	status_message, analysis_results, sentiment_counts = analyze_news_political_viewpoint(query, sentiment_model)

	# 결과 출력
	st.subheader(status_message)
	if analysis_results:
	st.write("### 성향 분포 시각화")
	visualize_sentiment_distribution(sentiment_counts)

	st.write("### 분석 결과")
	for result in analysis_results:
	st.write(f"#### 제목: {result['제목']}")
	st.write(f"- 원본 기사: {result['원본 기사']}")
	st.write(f"- 성향: {result['성향']} (점수: {result['성향 점수']:.2f})")
	st.write(f"- 대조 관점 기사: {result['대조 관점 기사']}")
	st.write("---")