본문 바로가기

판다스16

pandas 판다스 기초 12 Matplotlib 이번 파트는 정말정말 중요한 부분중에 하나라고 본다. # The plot() method import pandas as pd titanic = pd.read_csv('titanic.csv') titanic.info() ''' RangeIndex: 891 entries, 0 to 890 Data columns (total 9 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 survived 891 non-null int64 1 pclass 891 non-null int64 2 sex 891 non-null object 3 age 714 non-null float64 4 sibsp 891 non-null int64 5 parc.. 2022. 7. 26.
pandas 판다스 기초11 slice, upper, lower, title등 Series의 경우에 작동하는 문법 # 원하는 결과값은 전체 출력이다. # 전체출력은 원래 그냥 변수만 입력해주면 끝나지만, # 다중 인덱스를 슬라이스해서 전체출력을 해주는 것이 유의미 할것같아서 시도해보고 싶었다. # 시도 1 # titanic.loc[(slice(all), slice(all)), :] # TypeError: ' 2022. 7. 25.
pandas 판다스 기초 6 # reset_index()의 기능의 근본은 # 'index_col자리에 index 기준값이 된 것을 해제해준다.'라는 개념같다. # 즉, index_col을 설정해주기 전의 모습으로 돌아가는 것이다.​ # Pandas Index Objects ## First Steps import pandas as pd summer = pd.read_csv('summer.csv', index_col = 'Athlete') summer.tail() summer.index[0] # 'HAJOS, Alfred' # 모든 인덱스가 고유값인지 판단할 때 쓰이는 함수 (중복되지 않은 인덱스인지 확인) summer.index.is_unique # False summer.index.get_loc('DRIVAS, Dimitrios').. 2022. 7. 16.
pandas (판다스) 기초3 import pandas as pd titanic = pd.read_csv('titanic.csv') titanic # 표현에 유의 하자 age.to_frame().info() ## Analyzing Numerical Series # 결측치를 제외한 원소의 수를 세준다. age.count() # 714 # 전체길이는 891이다. age.sum(skipna = True) # 21205.17 # skipna = True 는 "결측치를 제외하고"라는 의미를 담고 있다. # 즉, 결측치를 제외한 값에 대하여 sum 을 해줘라. 가 되겠다. # 하지만 기본적으로 ()처럼 공백으로 하여도 다음과 같은 결과가 나오는 것을 보니 굳이 써줄 필요는 없을 것으로 보이기도 한다. age.sum() # 21205.17 # a.. 2022. 7. 15.