본문 바로가기

전체 글732

프로젝트 첫번째. 스타벅스, 이디야의 시각화 기본데이터 스크래핑 후 엑셀저장 휴 태블루 과제 때문에 없는 데이터 만드느라고 하루를 보냈지만 암튼 끝냈다. 새롭게 하니, 이젠 딱히 어렵진 않지만 마냥 쉽지만도 않다. 적당 난이도 느낌? 중간에 난제도 몇가지 있긴했다. 1. '입력값이 너무 많습니다'에 대한 에러 처리 - 구글링이든 어디든 그냥 알럿끄기에만 급급하지, 데이터에 구멍이 생기는걸 신경쓰는건 유튜버 한분 뿐이였다. (빅공잼 님) 2. 이디야는 위도, 경도가 듬성듬성 있었기 때문에 googlemaps 이용해서 위도 경도 따오기 이 두개 외에는 적당 난이도였다고 본다. 혹시라도 고수 분들이 코드를 보신다면 궁금한 부분이 있습니다. 1. 파이썬 정규표현식을 사용하여 혹은 어떤 방법으로든 주소 값에 (망우동) 1544-3512 라고 나올때, 스타벅스의 경우는 다행히도 같은 번호여.. 2022. 7. 20.
제로베이스 데이터사이언스 3기 4개월차 시작 드디어 4개월차가 시작되었다. 즉, 반도 안남았다는 의미다. 이때 즈음에는 전체적인 진도를 봤을때, 나에게 필요한 강의와 필요없는 강의를 어느정도 구분할 수 있게 되었다. 그도 그럴것이 링크드인, 사람인, 피플앤잡 이 3군데에서만 잡 서칭을 해보면 describsion이라든지, 요구 스킬셋 등을 보게되면 가닥이 좀 잡힌다. 물론, 어느 포지션으로 가고싶은지는 기울어진 방향은 있으되 불분명하다. 그만큼 잘 모르는데 분명한 방향 설정이 되는 것도 이상하다. 지금은 그래도 데이터 엔지니어를 가장 중점적으로 바라보고는 있다. 물론 이것도 내 자신이 불분명해서 잘 모르겠다. 동기부여 같은것도 불분명한데 목표를 정하라고 하는거 보면 참... 어처구니가 없다. 물론 반은 맞고 반은 틀리다고 생각한다. 아무튼. 나에게.. 2022. 7. 19.
pandas 판다스 틀린부분 복기3 이번 문제 자체는 짧았지만, 정말 중요한 부분이였다. 하지만 머리에 잘 남지 않아서 아쉬움이 남은 파트였다. 더 익숙해져 보도록 하자. # run the cell! import pandas as pd cars = pd.read_csv("cars.csv") cars ''' mpgcylindersdisplacementhorsepowerweightaccelerationmodel_yearoriginname 018.08307.0130.0350412.070usachevrolet chevelle malibu 115.08350.0165.0369311.570usabuick skylark 320 218.08318.0150.0343611.070usaplymouth satellite 316.08304.0150.0343312... 2022. 7. 19.
pandas 판다스 기초 11 체인인덱싱(chain indexing) 피하기, copy, 올바른 값 변경해주기 # Manipulating Values in DataFrame ## Best Practise (how you should do it) import pandas as pd titanic = pd.read_csv('titanic.csv') titanic.head() ''' survivedpclasssexagesibspparchfareembarkeddeck 003male22.0107.2500SNaN 111female38.01071.2833CC 213female26.0007.9250SNaN 311female35.01053.1000SC 403male35.0008.0500SNaN ''' ### Changing a single Value (Option 1 with loc) # inplace = True 필요없음 ti.. 2022. 7. 19.