본문 바로가기

Pandas37

pandas(판다스) 기초 2 import pandas as pd summer = pd.read_csv('summer.csv', index_col='Athlete') summer # 점 표기법 summer.Medal # 대괄호 표기법 # 띄어쓰기등이 추가로 가능하다는 점이 있다. summer['Medal'] # 모든 행 값에 대하여, Year, Medal 정보를 출력해라. summer.loc[:,['Year', 'Medal']] # 추후 멀티행, 멀티컬럼등을 조작할때 문제가 발생 가능하니 loc 사용을 권장한다고 한다; # 사용법은 알았고, iloc과 loc의 쓰임새등을 더 알아보자. # 보니깐 iloc은 숫자만 사용 가능하고, loc은 문자만 사용가능한것같다. # 물론 loc의 행이나, 열의 값이 0,1,2,3 이런식으로 되어있는 .. 2022. 7. 14.
pandas 기초1 # 첫번째 열에 대한 3개의 정보를 가져오고 싶다면 summer.iloc[0, :3] # Year 1896 # City Athens # Sport Aquatics # Name: HAJOS, Alfred, dtype: object​ import pandas as pd titanic = pd.read_csv('./titanic.csv') titanic # 화면에 보여줄 수 있는 pandas의 각 실행별로 최대 rows 값 pd.options.display.max_rows # 화면에 보여줄 수 있는 pandas의 각 실행별로 최저 rows 값 pd.options.display.min_rows #10 # pd.options.display.min_rows = 20 # 이라고 해주면, pandas를 출력할때마다 2.. 2022. 7. 14.
pandas excel 가져오기 루틴 import pandas as pd percapitaGDP = pd.read_excel('../data-cleansing-main/Chapter01/data/GDPpercapita.xlsx', sheet_name = 'OECD.Stat export', # 열값 4개를 스킵한다. skiprows = 4, # 가장 아래의 열값을 1개 스킵한다. skipfooter = 1, usecols = 'A,C:T') percapitaGDP.head() # 이 결과값으로 인해서 null 값이 1열 있는것을 알게되었다. percapitaGDP.info() # 확실한 확인을 위해서 써줬다. percapitaGDP.isnull().sum() percapitaGDP.rename(columns={'Year':'metro'}, i.. 2022. 7. 8.
pandas로 데이터 가져오기 루틴 1 (csv파일 읽기) import pandas as pd pd.options.display.float_format = '{:,.2f}'.format pd.set_option('display.width', 85) pd.set_option('display.max_columns',8) landtemps = pd.read_csv('../data-cleansing-main/Chapter01/data/landtempssample.csv', # 원본파일과 대조해봤을때, 1번째 열은 짤린다 skiprows =1 에 의해서 # 하지만 stationid 는 왜 순서가 두번째일까? names = ['stationid', 'year', 'month', 'avgtemp', 'latitude', 'longitude', 'elevation', 'sta.. 2022. 7. 8.