본문 바로가기

Pandas37

pandas 판다스 기초 25 datetime 데이터 핸들링의 모든것 이번 섹션은 상당히 단조롭다. 대체로 datetime을 다루는 섹션인데 datetime이라는 주제 하나로 엄청나게 다양한 사용범위를 보여준다. # Time Series Basics ## Importing Time Series Data from csv-Files import pandas as pd temp = pd.read_csv('temp.csv') temp.head() ''' datetimeLANY 02013-01-01 00:00:0011.7-1.1 12013-01-01 01:00:0010.7-1.7 22013-01-01 02:00:009.9-2.0 32013-01-01 03:00:009.3-2.1 42013-01-01 04:00:008.8-2.3 ''' temp.info() ''' RangeIndex.. 2022. 8. 24.
pandas 판다스 기초 23 replace 응용 중요 루틴 및 dropna등 데이터 클리닝 여태까지 배운것 활용 전체적으로 시험을 염두하고 강의한 섹션이였는데, 처음엔 모르다가도, 그래도 연결고리를 들으니 완전 마지막이나, 부분적으로 왜 그렇게 하는지 이해가 안간 것도 몇가지 있었으나 그 외의것은 아주 짜임새 있고 쓸모가 많다는 유용한 섹션이라는 생각이 들었다. * Step은 중간에 안쓴것도 있다. 그냥 없는대로 흘려서 보자. # Some Guidance and Hints ## Step 1: Getting Started import pandas as pd import numpy as np summer = pd.read_csv('summer.csv') wik_1996 = pd.read_csv('wik_1996.csv') wik_1976 = pd.read_csv('wik_1976.csv') summer.head() '.. 2022. 8. 19.
pandas 판다스 기초 22 seaborn 시각화 그래프 간만에 좀 수월한 진행이였다. # Advanced / statistical plotting with seaborn ## First Steps import pandas as pd import seaborn as sns import matplotlib.pyplot as plt titanic = pd.read_csv('titanic.csv') titanic.head() ''' survivedpclasssexagesibspparchfareembarkeddeck 003male22.0107.2500SNaN 111female38.01071.2833CC 213female26.0007.9250SNaN 311female35.01053.1000SC 403male35.0008.0500SNaN ''' # 카운트 플롯 plt.f.. 2022. 8. 19.
pandas 판다스 기초21 expand, dummies, cut, qcut 이번 섹션도 참... 알겠는듯 모르겠는 난해함들이 많았다. 정확한 표현으로는 들을땐 알겠는데, 듣는 과정에서 적용해보는 것을 이미지로 연상해보자면 반반? 아무튼 이제는 기계 주입식으로 좀 공부스타일을 바꿔볼까도 생각을 한다. # Data Preparation and Feature Creation ## Arithmetic Operations import pandas as pd import numpy as np titanic = pd.read_csv('titanic.csv') titanic.head(10) ''' survivedpclasssexagesibspparchfareembarkeddeck 003male22.0107.2500SNaN 111female38.01071.2833CC 213female26.00.. 2022. 8. 17.