불친절한 블로그
[Python] 문자열 가지고 놀기 본문
728x90
반응형
주소검색하는 대부분 웹페이지는 이렇게 구성되어 있다.
시.도, 시.군.구, 도로명!!
어떤 자료를 넣어볼까 고민중에 공공데이터로 학교 정보를 받아왔다.
[출처] 공공데이터 포털 https://www.data.go.kr/
공공데이터포털
국가에서 보유하고 있는 다양한 데이터를『공공데이터의 제공 및 이용 활성화에 관한 법률(제11956호)』에 따라 개방하여 국민들이 보다 쉽고 용이하게 공유•활용할 수 있도록 공공데이터(Dataset)와 Open API로 제공하는 사이트입니다.
www.data.go.kr
주소 칼럼에 보면 XX구랑 도로명이 있다.
괄호에 있는 구주소는 버릴꺼다.
괄호('(')를 split로 잡으면 '(' 중심으로 배열로 나뉘게 된다.
여기서 0번째 애만 가져올꺼니까 address[0]으로 써야지
이제 XX구, 도로명을 나눌껀데
처음엔 '구'를 split할까? 했지만 주소중에 '구'라는 주소가 다중으로 들어갈 수 있으니
그냥 띄어쓰기로 나눠야겠다.
으.... 출력물 정렬안돼
jupyter notebook으로 출력해야겠다.
편안~~
이후 셀레니움을 활용해서 학교주소 관련된 자료를 받아오게 됐다.
728x90
반응형
'Project > 데이터 크롤링' 카테고리의 다른 글
[Electric] 에너지마켓플레이스 전력데이터 서비스 마켓 (0) | 2021.08.30 |
---|---|
[Python] Dataframe으로 특정 문자가 들어간 문자열 찾기 (0) | 2020.12.23 |
[Error][Python] 파이썬 특정 주소 변경 시 예외사항 (2) | 2020.12.23 |
[R] 셀레니움으로 크롤링 (0) | 2020.03.31 |
[R] 환경세팅 (0) | 2020.03.31 |
Comments