본문 바로가기

개발일지/제로베이스_데이터사이언티스트스쿨27

새로운 맥북프로, 그리고 환경설정... 음... 아.... 기분이 썩 좋진 않다. 기존에 맥북이 있었는데, 그것을 국비지원할때 돈아낀답시고 팔아버리고 윈도우 기반으로 노트북을 새로 샀다. (맥은 온라인강의에서나 많이 쓰이지, 실제로는 윈도우 기반으로 진행하는 곳이 압도적으로 많았다) 암튼.. 윈도우 컴 산지 3달밖에 안되었고 적은 돈 들여서 산것도 아니고 사양이 후진것도 아닌데, 판다스랑 matplotlib, seaborn등을 돌리면서 자료 서치할때 유튜브 노래도 틀어놓고 했는데, 뭐 별거 튼것도 없는것같은데 이미 ram이 그득그득하게 가득 찼더라; 아니나 다를까 화면이 지직 거리면서 좀 안좋아졌었고, 셀레니움이랑 뷰티풀숲할때가 절정이였다. 공부하면서, 과제하면서 한 4번정도 지직거리면서 튕긴것같다. 솔직히 이정도 까진 ㅇㅋ다 근데, 앞으론 .. 2022. 6. 28.
SQL JOIN 후기1 그동안 SQL 강의는 쉬워도 너무 쉬웠다. 하지만 JOIN이 등장하면서 난이도가 몇단계는 업된것같다. 이해도가 70%는 넘지만 그래도 아직 부족하다. 더불어서 배우는게 참 많았다. #1 첫번째 에피소드 중 7,8,10을 지정하라고 할때 나는 episode = (7 or 8 or 10)으로 풀었다. 하지만 정답코드는 episode in (7,8,10) 이였다. 작동 여부를 떠나서 훨씬 간결하고 내가 구현하기를 원했던 것이였지만 생각이 나질 않았었다. 물론 작동이 이것때문에 안되는 결정적 요인이였다. #2 두번째 2개 이상의 테이블 값을 이용해서 값을 구할때는 두개의 컬럼 벨류가 같지만, 컬럼의 이름이 다를때 #celeb 테이블의 id 값 = 바나나, 사과, 망고 # snl_show 테이블의 host 값 =.. 2022. 6. 27.
제로베이스 3개월차 1주차 SQL을 진행하면서 먼저 말하고 싶은것은 2개월차인 판다스를 시작할때가 떠오른다. 그때의 기분은 파이썬에 대해서 80%정도 숙지는 충분하게 되었었지만, 확실히 class 활용이나 내장함수 활용에 있어서 미흡하다고 느꼈다. 그리고 그것을 보충하려면 시간이 일주일 정도는 필요할것 같다고 생각이 들었다. 그러나 시간은 나를 기다려 주지 않지. 내가 시간이 모자랐던 이유는 사실 그만큼 나태했다고 생각하고, 충분히 주어진 시간안에 숙지할 수 있었다. 객관적으로 생각해봤을때. 자, 이제 3개월차인 sql 즉, 이제부터는 데이터베이스 관리에대한 부분이 들어간다는 말인데. 그러자면 앞서 배웠던 웹스크래핑이 정말 중요한 정보라고 판단을 했고, 2개월차때 배웠던 모든 부분에 있어서 미흡하다는 생각이 들었다. 판다스는 세부적으로 어떻게 활용해.. 2022. 6. 24.
제로베이스 데이터사이언스 3기 3개월차 시작! (SQL 등) 어제가 3개월차의 시작이였을것이지만 오늘 3개월차 강의가 업로드 되었기에 사실상 오늘부터 3개월차의 시작이다. 1달차가 끝날때에는 파이썬 정리하는데 7일정도가 더 필요할 것같았다. 그래야 클래스등에 대해서 자유롭게 사용이 가능할 것 같았다. 2달차가 끝난 이 시점에는 솔직히 똑같이 12일정도 정리할 시간이 더 필요하다. 판다스, 셀레니움, 뷰티풀숲, 리퀘스트 이 네가지에 대한 기본원리를 더욱 파악하고, 그 이후에 크롤링에 대한 무언가 감을 깨우쳐서 원활히 다룰 수 있게하기 위해서. 왜냐하면 2달차 마지막 과제였던 동적 웹페이지 크롤링 할때, 원리적으로보면 너무 간단한것이였던것이 있었다. a태그의 href값을 가져와서, 그것을 분할해주고, 그 안의 정보들을 이용하여 내가 원하는대로 사용하는것. 사실상 이게.. 2022. 6. 21.