본문 바로가기

개발일지/Pandas50

pandas 판다스 기초 24, **매우 중요** heatmap, plot, sns, 등 순위및 종류 분석 (근데 호흡이 너무 김...) 흐음... 정말 집중력 어떻게 안되나.... 호흡이 이렇게 긴 강의를 들을때는 그냥 속수 무책이다. 통계관련 강의가 나오기도 해서 대부분은 알아듣고, 이해가 안되는 부분도 있지만 근본적으로는 흥미를 잃는 느낌이랄까 한편으로는 흥미가 만땅이지만 한편으로는 흥미가 없달까.. 거참... 내가 작성했던 코드도 있는데, 결과적으로 봤을때 그건 무의미할 정도로 호흡이 너무 길다. 따라서 내가 썼던 코드는 생략하도록 하겠다. # Explanatory Data Analysis Challenge (Olympic Games) ## Data Import and Inspection Import the Datasets Summer (__summer.csv__), Winter (__winter.csv__) and dictiona.. 2022. 8. 22.
pandas 판다스 기초 23 replace 응용 중요 루틴 및 dropna등 데이터 클리닝 여태까지 배운것 활용 전체적으로 시험을 염두하고 강의한 섹션이였는데, 처음엔 모르다가도, 그래도 연결고리를 들으니 완전 마지막이나, 부분적으로 왜 그렇게 하는지 이해가 안간 것도 몇가지 있었으나 그 외의것은 아주 짜임새 있고 쓸모가 많다는 유용한 섹션이라는 생각이 들었다. * Step은 중간에 안쓴것도 있다. 그냥 없는대로 흘려서 보자. # Some Guidance and Hints ## Step 1: Getting Started import pandas as pd import numpy as np summer = pd.read_csv('summer.csv') wik_1996 = pd.read_csv('wik_1996.csv') wik_1976 = pd.read_csv('wik_1976.csv') summer.head() '.. 2022. 8. 19.
pandas 판다스 기초 22 seaborn 시각화 그래프 간만에 좀 수월한 진행이였다. # Advanced / statistical plotting with seaborn ## First Steps import pandas as pd import seaborn as sns import matplotlib.pyplot as plt titanic = pd.read_csv('titanic.csv') titanic.head() ''' survivedpclasssexagesibspparchfareembarkeddeck 003male22.0107.2500SNaN 111female38.01071.2833CC 213female26.0007.9250SNaN 311female35.01053.1000SC 403male35.0008.0500SNaN ''' # 카운트 플롯 plt.f.. 2022. 8. 19.
pandas 판다스 틀린문제 11 비율에 따른 구간 나누기 qcut, map과 dictionary로 변경값을 새로운 컬럼에 저장 루틴 갈 수록 분명 모르는게 점점 많아지기도하고, 줄어들기도 하는 것은 사실이다. 하지만 약간은 좀 더 기계적으로 학습하려고 한다. 생각도 기계적으로 감정을 좀 더 빼고, 학습도 기계적으로. 그리고 점점 나아지고 있는 모습을 보니 참 뿌듯 하다. # 문제 1 Transform the mpg column in way that the relationship with the horsepower feature is linear/closer to linear! # Visualize before and after! # 해당문제는 이해를 못하겠다. cars ''' mpgcylindersdisplacementhorsepowerweightaccelerationmodel_yearoriginname 018.08307.0130.0.. 2022. 8. 19.