본문 바로가기

beautifulsoup13

beautifulsoup alt, href 값등 가져오기 (드디어 알았다 ㅠㅠ) 와.... 진짜 이것땜에 미치는줄 알았고 여태 못찾았는데 이렇게 간단할 줄이야.. #1 개요 soup.select() => 언제나 리스트 형태이다. 태그.text => 화면에 보이는 글 부분 추출 태그['속성명'] -> 태그가 가지고 있는 속성의 값을 추출 #2 실행후 # 해당되는 alt값을 가져온다. soup.select('a.link_cp > img.thumb_g')[0]['alt'] 이것을 이용하면 href 값도 가져올 수 있다. 2022. 6. 23.
beautifulsoup 태그원리 이해 제로베이스 수업을 하며 따라하는거랑 흐름에 대한 설명도 해주시는데, 태그에 대한 설명은 두루뭉술하게 하셔서 보충이 안되는 부분이라 별도로 책이든 강의든 찾아봤다. 그 중에서 유데미에서 "따라하며 익히는 파이썬 데이터수집 마스터"를 찾았는데 완전 강추다. 진짜 유데미 세일기간 한달동안에도 몇번씩 오니깐 beautifulsoup, selenium, request 원리 이해안되시는 분들은 꼭 사서 들었으면 좋겠다. 그 중에 html 스크래핑 해올때 태그 원리에 대한 이해다. 이건 정말 미쳤다. 내기준에서. ============================================================================== # 기본 개요 soup.select('태그 조건') # soup .. 2022. 6. 23.
[제로베이스] 2달차 EDA 데이터 크롤링 주유소 정보 후기 (멸망) 아..... ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 열심히 한다곤 했는데, 진짜 어느 순간부턴 눈 한쪽이 계속 떨리고 안경을 썼는데도 글씨가 잘 안보이더라; 아.. 심각하다 싶었지만 그것이상으로 심각한건 내 지금의 상황이다. EDA 첫번째 과제때 너무 안일했다. 주제는 전국 주유소 정보 크롤링으로써 https://www.opinet.co.kr/searRgSelect.do 싼 주유소 찾기 오피넷 www.opinet.co.kr 해당 사이트를 이용해서 찾는것이였다. 완전히 답안으로 배낄 수 있는 몇몇 정보들이 있었고, 손쉽게 끝낼 수 있었다. 그게 내 실력과도 같이 느껴지기도 했다. 왜? 나는 잘 따라쳤으니깐. 근데 이번 과제주제를 받은 순간 머리가 멍했다. ㅋㅋㅋㅋㅋ 일단 페이지 접근에 정보가 있는 위치까지 .. 2022. 6. 15.
Beautifulsoup 재수강 시작 (attribute error) 아무래도 내가 구글링해서 할수도 있겠지만, 근본적으로 아직 그 영역에는 15%정도 못미친다고 생각해서 제로베이스의 강의를 다시 들으려고 했다. 시작부터 안되는게 있었다. "아니 난 분명히 잘 따라했는데 왜안되는거야" 위에서 보듯이 문명히 p 태그에 inner-texst first-item이라는 클래스면서 id값이 first인게 있었다. 근데 이게 조회가 안되는거다; .text로 붙여서 해주든, print로 감싸서 진행을 해주든 작동이 안되는거다; 하... 진짜 왜 None값으로 나오는거야... 하면서 고민에 고민을 했다. 그러다가 겨우 발견했다. 첫번째 사진을 자세히보면 "' "이렇게 되어있다. 즉, 홀따운표가 하나더 들어간 것이다; 하... 아무튼 이걸 깨닫고 지워줬다. 그리고 작동이 잘되기를 바랬는데.. 2022. 6. 7.