본문 바로가기

판다스16

pandas 판다스 기초 23 replace 응용 중요 루틴 및 dropna등 데이터 클리닝 여태까지 배운것 활용 전체적으로 시험을 염두하고 강의한 섹션이였는데, 처음엔 모르다가도, 그래도 연결고리를 들으니 완전 마지막이나, 부분적으로 왜 그렇게 하는지 이해가 안간 것도 몇가지 있었으나 그 외의것은 아주 짜임새 있고 쓸모가 많다는 유용한 섹션이라는 생각이 들었다. * Step은 중간에 안쓴것도 있다. 그냥 없는대로 흘려서 보자. # Some Guidance and Hints ## Step 1: Getting Started import pandas as pd import numpy as np summer = pd.read_csv('summer.csv') wik_1996 = pd.read_csv('wik_1996.csv') wik_1976 = pd.read_csv('wik_1976.csv') summer.head() '.. 2022. 8. 19.
pandas 판다스 기초21 expand, dummies, cut, qcut 이번 섹션도 참... 알겠는듯 모르겠는 난해함들이 많았다. 정확한 표현으로는 들을땐 알겠는데, 듣는 과정에서 적용해보는 것을 이미지로 연상해보자면 반반? 아무튼 이제는 기계 주입식으로 좀 공부스타일을 바꿔볼까도 생각을 한다. # Data Preparation and Feature Creation ## Arithmetic Operations import pandas as pd import numpy as np titanic = pd.read_csv('titanic.csv') titanic.head(10) ''' survivedpclasssexagesibspparchfareembarkeddeck 003male22.0107.2500SNaN 111female38.01071.2833CC 213female26.00.. 2022. 8. 17.
프로젝트 두번째. 효율적인 여행을 위한 핀찍기 취업할 수 있는 기본적인 수준이 달성될 11월 ~ 1월 즈음에 여행을 가기로 했다. 그러던 중, '여러 지역을 전투적으로 도는게 좋을까', '한 지역, 한 지역을 제대로 조지면서 다닐까.'를 고민하게 되었다. 결국 둘다 하되, 가급적이면 한 지역을 제대로 조지는 쪽에 무게를 싣게 되었다. 프로젝트 시작 원인 1박 2일의 경우엔 크게 데이터화 할 필요도 없었지만, 4박이 넘어가니, 가야할 장소 목록이 50개 가량이 되었고, 그러다보니 땅 덩어리가 넓어서 왼쪽 갔다가 오른쪽 갔다가, 다시 왼쪽갔다가 그런짓의 비 효율적인 일이 비일비재 할 것이라고 직감했다. 왜냐하면 난 현지인도 아니고 이름도 똑같은 울산광역시이지만 울산이 상당히 넓었기 때문이다. 프로젝트 목표 돈, 시간에 있어서 효율적인 장소를 시각화하여 .. 2022. 8. 15.
pandas 판다스 기초 19 groupby, relabeling, aggregation, transform, apply, stack # Pandas GroupBy Operations ## Understanding GroupBy objects import pandas as pd titanic = pd.read_csv('titanic.csv') titanic.head() ''' survivedpclasssexagesibspparchfareembarkeddeck 003male22.0107.2500SNaN 111female38.01071.2833CC 213female26.0007.9250SNaN 311female35.01053.1000SC 403male35.0008.0500SNaN ''' titanic.info() ''' RangeIndex: 891 entries, 0 to 890 Data columns (total 9 columns): #.. 2022. 8. 12.