728x90
안녕하세요 강동믓재이 입니다.
이번엔 제가 다니고 있는 KG 에듀원 아이티 뱅크에서 저희 조원들과 진행한 프로젝트에 대해 포스팅 하겠습니다.
IT공부를 시작하고 간단하지만 첫 프로젝트였던 만큼 긴장이 많이 되었습니다.
포스팅 시작 하겠습니다.
'데이터 수집' 프로젝트
이번 프로젝트는 '데이터 수집' 프로젝트 입니다.
저희 팀은 '서울시 각 구의 인구들과 서울시 각 구 카페의 점포수와 유형별 분석' 이라는 주제로
데이터 수집을 하기로 했습니다.
이 주제를 선정한 이유는 단순히 저희 조원들이 좋아하는 것을 찾다보니 접근하게 되었고
'우리 동네에 어떤카페의 수가 많지?' 라는 질문이 생겨 이 주제를 선정하게 되었습니다.
프로젝트의 흐름
- 분석 주제 선정
- 프로젝트의 흐름
- 데이터 수집 확인
- 데이터 분석
- 프로젝트 결과
이렇게 프로젝트가 진행되고 있으며 차례대로 글을 써 보겠습니다.
분석주제 선정(데이터 수집)
먼저 분석주제 선정 입니다.
앞서 말씀드린 것 처럼 저희 조원들이 관심있는 분야에 데이터를 수집하기로 했습니다.
카페 파악
- 서울에 있는 25개의 자치구에 카페의 유형을 분류한다.
인구파악
- KOSIS(국가통계포털)의 정보를 이용해 자치구의 인구를 파악한다.
데이터 분석
- 간단한 분석을 통해 데이터가 무엇을 나타내는지 알아보자.
데이터 수집을 위한 웹 사이트 선정
먼저 데이터를 수집할 웹 사이트를 선정해야 합니다.
웹 크롤링으로 데이터를 수집하려고 하기 때문에 웹사이트 선정이 중요합니다.
카페의 정보는 '네이버 지도 플레이스' 를 이용 할 생각입니다.
네이버의 정보가 비교적 신뢰가 있어 이 웹 사이트를 선정했습니다.
인구파악은 국가통계포털에서 '행정구역 시군구 별 주민등록세대수' 를 다운받아
데이터를 확보 했습니다.
다음 포스팅에서 계속 이어 가겠습니다.
728x90
'데이터 수집 프로젝트' 카테고리의 다른 글
3_데이터 확인 및 시각화 (2) | 2023.12.18 |
---|---|
2_웹 크롤링 (0) | 2023.12.18 |