본문 바로가기

데이터 수집 프로젝트

1_데이터 수집 프로젝트(웹 크롤링)

728x90

안녕하세요 강동믓재이 입니다.

 

이번엔 제가 다니고 있는 KG 에듀원 아이티 뱅크에서 저희 조원들과 진행한 프로젝트에 대해 포스팅 하겠습니다.

 

IT공부를 시작하고 간단하지만 첫 프로젝트였던 만큼 긴장이 많이 되었습니다.

 

포스팅 시작 하겠습니다.


'데이터 수집'  프로젝트


 

이번 프로젝트는 '데이터 수집' 프로젝트 입니다.

저희 팀은 '서울시 각 구의 인구들과 서울시 각 구 카페의 점포수와 유형별 분석' 이라는 주제로 

데이터 수집을 하기로 했습니다.

이 주제를 선정한 이유는 단순히 저희 조원들이 좋아하는 것을 찾다보니 접근하게 되었고

'우리 동네에 어떤카페의 수가 많지?' 라는 질문이 생겨 이 주제를 선정하게 되었습니다.

 

프로젝트의 흐름

  • 분석 주제 선정
  • 프로젝트의 흐름
  • 데이터 수집 확인
  • 데이터 분석
  • 프로젝트 결과

이렇게 프로젝트가 진행되고 있으며 차례대로 글을 써 보겠습니다.

 

분석주제 선정(데이터 수집)

먼저 분석주제 선정 입니다.

앞서 말씀드린 것 처럼 저희 조원들이 관심있는 분야에 데이터를 수집하기로 했습니다.

 

카페 파악

  • 서울에 있는 25개의 자치구에 카페의 유형을 분류한다.

인구파악

  • KOSIS(국가통계포털)의 정보를 이용해 자치구의 인구를 파악한다.

데이터 분석

  • 간단한 분석을 통해 데이터가 무엇을 나타내는지 알아보자.

 

데이터 수집을 위한 웹 사이트 선정

먼저 데이터를 수집할 웹 사이트를 선정해야 합니다.

웹 크롤링으로 데이터를 수집하려고 하기 때문에 웹사이트 선정이 중요합니다.

 

카페의 정보는 '네이버 지도 플레이스' 를 이용 할 생각입니다.

네이버의 정보가 비교적 신뢰가 있어 이 웹 사이트를 선정했습니다.

 

인구파악은 국가통계포털에서 '행정구역 시군구 별 주민등록세대수' 를 다운받아

데이터를 확보 했습니다.

 

 

 

다음 포스팅에서 계속 이어 가겠습니다.

 

728x90

'데이터 수집 프로젝트' 카테고리의 다른 글

3_데이터 확인 및 시각화  (2) 2023.12.18
2_웹 크롤링  (0) 2023.12.18