스케쥴러를 이용한 네이버 실시간 검색어 순위 데이터수집 AWS 서버 구현결과

2019-06-17

.

스케쥴러를 이용한 네이버 실시간 검색어 순위 데이터수집 AWS 서버 구현결과

네이버 실시간 검색어 순위 데이터를 스케쥴러(크론탭)를 이용하여 정기적으로 웹크롤링, DB 저장, slack 알림을 수행하는 AWS EC2 서버구축

1. 개요

1.1. 기술스텍

1) SQL활용

2) crontab

3) 리눅스

4) AWS EC2

5) python 프로그래밍

6) slack webhooks

1.2. 프로젝트 구현 아키텍처

0

2. 시스템 구동방법

주요 시스템 구동 관련 내용은 keywords.py 참고

step 1) 아래와 같이 EC2 리눅스에서 환경변수 설정

0-1

step 2) 아래와 같이 네이버 실시간 검색어 순위 데이터 저장을 위한 SQL 데이터베이스 및 테이블 생성

1

step 3) 크론탭 설정 및 실행

1) 아래와 같이 타임존 한국시간으로 설정

1-1

2) 크론탭 스케쥴러 설정 (crontab -e)

=> 설정완료 시 매 2분 간격으로 keywords.py 실행

1-2

  • 위와 같이 설정 후 저장 시 결과

1-3

3. 시스템 구동결과

1) slack

4

2) mysql

2

3) nosql

3