분류 전체보기718 beautifulsoup alt, href 값등 가져오기 (드디어 알았다 ㅠㅠ) 와.... 진짜 이것땜에 미치는줄 알았고 여태 못찾았는데 이렇게 간단할 줄이야.. #1 개요 soup.select() => 언제나 리스트 형태이다. 태그.text => 화면에 보이는 글 부분 추출 태그['속성명'] -> 태그가 가지고 있는 속성의 값을 추출 #2 실행후 # 해당되는 alt값을 가져온다. soup.select('a.link_cp > img.thumb_g')[0]['alt'] 이것을 이용하면 href 값도 가져올 수 있다. 2022. 6. 23. beautifulsoup 태그원리 이해 제로베이스 수업을 하며 따라하는거랑 흐름에 대한 설명도 해주시는데, 태그에 대한 설명은 두루뭉술하게 하셔서 보충이 안되는 부분이라 별도로 책이든 강의든 찾아봤다. 그 중에서 유데미에서 "따라하며 익히는 파이썬 데이터수집 마스터"를 찾았는데 완전 강추다. 진짜 유데미 세일기간 한달동안에도 몇번씩 오니깐 beautifulsoup, selenium, request 원리 이해안되시는 분들은 꼭 사서 들었으면 좋겠다. 그 중에 html 스크래핑 해올때 태그 원리에 대한 이해다. 이건 정말 미쳤다. 내기준에서. ============================================================================== # 기본 개요 soup.select('태그 조건') # soup .. 2022. 6. 23. [selenium] chromedriver_autoinstaller로 크롬드라이버 버전 일치화 에러해결 진짜 이거 찾는데 3일걸린것 같다. selenium으로 크롬 드라이버를 이용할때 1) 나의 크롬 버전 2) 크롬드라이버의 버전 이 세부버전까지 완전 일치화가 되지 않을 경우에는 SessionNotCreatedException deprecationwarning executable_path has been deprecated please pass in a service object등의에러가 뜬다. 내 기억으로 나는 위의 두가지를 포함하여 총 3가지 에러가 떴었다. 그리고 결국 방법은 간단했다. #1 chromedriver_autoinstaller 를 설치한다. !pip install chromedriver_autoinstaller 명령어로 설치해준다. #2 설치해준 것을 import 및 install 해준다.. 2022. 6. 22. 제로베이스 데이터사이언스 3기 3개월차 시작! (SQL 등) 어제가 3개월차의 시작이였을것이지만 오늘 3개월차 강의가 업로드 되었기에 사실상 오늘부터 3개월차의 시작이다. 1달차가 끝날때에는 파이썬 정리하는데 7일정도가 더 필요할 것같았다. 그래야 클래스등에 대해서 자유롭게 사용이 가능할 것 같았다. 2달차가 끝난 이 시점에는 솔직히 똑같이 12일정도 정리할 시간이 더 필요하다. 판다스, 셀레니움, 뷰티풀숲, 리퀘스트 이 네가지에 대한 기본원리를 더욱 파악하고, 그 이후에 크롤링에 대한 무언가 감을 깨우쳐서 원활히 다룰 수 있게하기 위해서. 왜냐하면 2달차 마지막 과제였던 동적 웹페이지 크롤링 할때, 원리적으로보면 너무 간단한것이였던것이 있었다. a태그의 href값을 가져와서, 그것을 분할해주고, 그 안의 정보들을 이용하여 내가 원하는대로 사용하는것. 사실상 이게.. 2022. 6. 21. 이전 1 ··· 120 121 122 123 124 125 126 ··· 180 다음