OpenAI API 기반 뉴스 인사이트 얻기

Requirements

환경

- OS: MacOS or Ubuntu
- Anaconda
- Python 3.11
- 기타 Python 패키지 (requrements.txt 참조)

env 추가

.env파일 생성 후 아래 내용 및 값 추가

OPENAI_API_KEY='sk-proj-xxxx'    # OpenAI API Key
CONDA_PYTHON_PATH='/Users/~'     # Conda python Path

Description

Google News에서 크롤링한 뉴스 헤드라인에서 OpenAI API를 활용하여 인사이트 얻기
기타 자세한 설명은 아래 블로그 참고

프로그램 실행

크롤러 테스트

python test_crawler.py

news_list = list()
with GoogleNewsCrawler() as crawler:
    q_list = [
        {
            'q': 'economy',
            'time': '4h',
            'location': 'us'
        },
        {
            'q': '국내 경제',
            'time': '4h',
            'location': 'ko'
        }
    ]
    for q in q_list:
        news = crawler.crawl(q)
        news_list += news
print_log(news_list)
save_to_json(news_list)

main.py 코드 내에서 q_list 내용 변경 후 실행
크롤링 결과는 save_to_json 함수를 사용하여 json 파일로 저장
결과 샘플 파일: news_data.json

schedule기반 주기저인 크롤링 작업

python job_news_insight.py

_, time_data, _ = get_news_insight_config('news_insight_config.txt')
time_data = time_data[:-1]
time_data = int(time_data)
print_log(f'Schedule Interval: {time_data}')
job_news_insight_schedule()

for hour in range(0, 24, time_data):
    time_info = f'{hour:02d}:00'
    schedule.every().day.at(time_info).do(job_news_insight_schedule)

while True:
    schedule.run_pending()
    time.sleep(10)

schedule기반 주기적으로 크롤링 및 OpenAI API를 활용해 인사이트 얻음

streamlit 활용 웹 표시

python -m streamlit run streamlit_app.py --server.port 8503

streamlit 활용하여 웹 상에 이미지 표시

키워드, 검색 주기, 지역 수정 후 저장 시 background로 동작하는 job_news_insight.py 재실행

Background 웹 실행

nohup python -m streamlit run streamlit_app.py --server.port 8501 > streamlit.log 2>&1 &; disown;

nohup python으로 백그라운드 실행

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
crawlers		crawlers
image		image
instructions		instructions
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
job_news_insight.py		job_news_insight.py
news_data.json		news_data.json
news_insight_config.txt		news_insight_config.txt
openai_api.py		openai_api.py
requirements.txt		requirements.txt
streamlit_app.py		streamlit_app.py
test_crawler.py		test_crawler.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

OpenAI API 기반 뉴스 인사이트 얻기

Requirements

환경

env 추가

Description

프로그램 실행

크롤러 테스트

schedule기반 주기저인 크롤링 작업

streamlit 활용 웹 표시

Background 웹 실행

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

singetta/news_insight

Folders and files

Latest commit

History

Repository files navigation

OpenAI API 기반 뉴스 인사이트 얻기

Requirements

환경

env 추가

Description

프로그램 실행

크롤러 테스트

schedule기반 주기저인 크롤링 작업

streamlit 활용 웹 표시

Background 웹 실행

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages