본문 바로가기

분류 전체보기718

pandas 판다스 기초 20, crosstab, melt, pivot_table # Reshaping DataFrames ## Transposing DataFrames import pandas as pd titanic = pd.read_csv('titanic.csv') titanic.head() ''' survivedpclasssexagesibspparchfareembarkeddeck 003male22.0107.2500SNaN 111female38.01071.2833CC 213female26.0007.9250SNaN 311female35.01053.1000SC 403male35.0008.0500SNaN ''' # 처음보는 기능이다. titanic.T # 보아하니, 행과 열의 위치를 뒤바꿔 주는 역할을 하는 것 같다. # 이거랑 T라고 하는거랑 똑같다. # T는 transpose의 약.. 2022. 8. 15.
프로젝트 두번째. 효율적인 여행을 위한 핀찍기 취업할 수 있는 기본적인 수준이 달성될 11월 ~ 1월 즈음에 여행을 가기로 했다. 그러던 중, '여러 지역을 전투적으로 도는게 좋을까', '한 지역, 한 지역을 제대로 조지면서 다닐까.'를 고민하게 되었다. 결국 둘다 하되, 가급적이면 한 지역을 제대로 조지는 쪽에 무게를 싣게 되었다. 프로젝트 시작 원인 1박 2일의 경우엔 크게 데이터화 할 필요도 없었지만, 4박이 넘어가니, 가야할 장소 목록이 50개 가량이 되었고, 그러다보니 땅 덩어리가 넓어서 왼쪽 갔다가 오른쪽 갔다가, 다시 왼쪽갔다가 그런짓의 비 효율적인 일이 비일비재 할 것이라고 직감했다. 왜냐하면 난 현지인도 아니고 이름도 똑같은 울산광역시이지만 울산이 상당히 넓었기 때문이다. 프로젝트 목표 돈, 시간에 있어서 효율적인 장소를 시각화하여 .. 2022. 8. 15.
pandas 틀린문제 9, groupby, unstack, nlargest 이번 섹션 문제도 거의 멸망에 가까운 지경이다. 하지만 성취감은 이전보다 훨씬 낮다. 그도 그럴게 아예 한개도 모르겠진 않고, 부분적으로 모르는 것들이 좀씩 나와서 못하겠더라. 모자란 부분은 다듬어 가보도록 하자. # 기초 #run the cell cars.head() ''' mpgcylindersdisplacementhorsepowerweightaccelerationmodel_yearoriginname 018.08307.0130.0350412.070usachevrolet chevelle malibu 115.08350.0165.0369311.570usabuick skylark 320 218.08318.0150.0343611.070usaplymouth satellite 316.08304.0150.03433.. 2022. 8. 12.
pandas 판다스 기초 19 groupby, relabeling, aggregation, transform, apply, stack # Pandas GroupBy Operations ## Understanding GroupBy objects import pandas as pd titanic = pd.read_csv('titanic.csv') titanic.head() ''' survivedpclasssexagesibspparchfareembarkeddeck 003male22.0107.2500SNaN 111female38.01071.2833CC 213female26.0007.9250SNaN 311female35.01053.1000SC 403male35.0008.0500SNaN ''' titanic.info() ''' RangeIndex: 891 entries, 0 to 890 Data columns (total 9 columns): #.. 2022. 8. 12.