개발일지/임시카테고리689 beautifulsoup 태그원리 이해 제로베이스 수업을 하며 따라하는거랑 흐름에 대한 설명도 해주시는데, 태그에 대한 설명은 두루뭉술하게 하셔서 보충이 안되는 부분이라 별도로 책이든 강의든 찾아봤다. 그 중에서 유데미에서 "따라하며 익히는 파이썬 데이터수집 마스터"를 찾았는데 완전 강추다. 진짜 유데미 세일기간 한달동안에도 몇번씩 오니깐 beautifulsoup, selenium, request 원리 이해안되시는 분들은 꼭 사서 들었으면 좋겠다. 그 중에 html 스크래핑 해올때 태그 원리에 대한 이해다. 이건 정말 미쳤다. 내기준에서. ============================================================================== # 기본 개요 soup.select('태그 조건') # soup .. 2022. 6. 23. [selenium] chromedriver_autoinstaller로 크롬드라이버 버전 일치화 에러해결 진짜 이거 찾는데 3일걸린것 같다. selenium으로 크롬 드라이버를 이용할때 1) 나의 크롬 버전 2) 크롬드라이버의 버전 이 세부버전까지 완전 일치화가 되지 않을 경우에는 SessionNotCreatedException deprecationwarning executable_path has been deprecated please pass in a service object등의에러가 뜬다. 내 기억으로 나는 위의 두가지를 포함하여 총 3가지 에러가 떴었다. 그리고 결국 방법은 간단했다. #1 chromedriver_autoinstaller 를 설치한다. !pip install chromedriver_autoinstaller 명령어로 설치해준다. #2 설치해준 것을 import 및 install 해준다.. 2022. 6. 22. 제로베이스 데이터사이언스 3기 3개월차 시작! (SQL 등) 어제가 3개월차의 시작이였을것이지만 오늘 3개월차 강의가 업로드 되었기에 사실상 오늘부터 3개월차의 시작이다. 1달차가 끝날때에는 파이썬 정리하는데 7일정도가 더 필요할 것같았다. 그래야 클래스등에 대해서 자유롭게 사용이 가능할 것 같았다. 2달차가 끝난 이 시점에는 솔직히 똑같이 12일정도 정리할 시간이 더 필요하다. 판다스, 셀레니움, 뷰티풀숲, 리퀘스트 이 네가지에 대한 기본원리를 더욱 파악하고, 그 이후에 크롤링에 대한 무언가 감을 깨우쳐서 원활히 다룰 수 있게하기 위해서. 왜냐하면 2달차 마지막 과제였던 동적 웹페이지 크롤링 할때, 원리적으로보면 너무 간단한것이였던것이 있었다. a태그의 href값을 가져와서, 그것을 분할해주고, 그 안의 정보들을 이용하여 내가 원하는대로 사용하는것. 사실상 이게.. 2022. 6. 21. 판다스(pandas) KeyError billborad_long 변수에 담긴 값은 yearartisttracktimedate.enteredweekrating 320003 Doors DownLoser4:242000-10-21wk176.0 32020003 Doors DownLoser4:242000-10-21wk276.0 63720003 Doors DownLoser4:242000-10-21wk372.0 95420003 Doors DownLoser4:242000-10-21wk469.0 127120003 Doors DownLoser4:242000-10-21wk567.0 이렇게 생겼다. 그리고 이 중에서 고정된 컬럼값을 만들어주기위해서 billboard_songs = billboard_long['year', 'artist', 'track', 'time.. 2022. 6. 17. 이전 1 ··· 113 114 115 116 117 118 119 ··· 173 다음