불친절한 블로그

[Python] 문자열 가지고 놀기 본문

Project/데이터 크롤링

[Python] 문자열 가지고 놀기

오누! 2020. 3. 31. 14:05
반응형

주소검색하는 대부분 웹페이지는 이렇게 구성되어 있다.

시.도, 시.군.구, 도로명!!

어떤 자료를 넣어볼까 고민중에 공공데이터로 학교 정보를 받아왔다.

[출처] 공공데이터 포털 https://www.data.go.kr/

공공데이터포털

국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Dataset)와 Open API로 제공하는 사이트입니다.

www.data.go.kr

주소 칼럼에 보면 XX구랑 도로명이 있다.

괄호에 있는 구주소는 버릴꺼다.


괄호('(')를 split로 잡으면 '(' 중심으로 배열로 나뉘게 된다.

여기서 0번째 애만 가져올꺼니까 address[0]으로 써야지

이제 XX구, 도로명을 나눌껀데

처음엔 '구'를 split할까? 했지만 주소중에 '구'라는 주소가 다중으로 들어갈 수 있으니

그냥 띄어쓰기로 나눠야겠다.

으.... 출력물 정렬안돼

jupyter notebook으로 출력해야겠다.

편안~~

이후 셀레니움을 활용해서 학교주소 관련된 자료를 받아오게 됐다.

반응형
Comments