본문 바로가기

판다스16

pandas(판다스) 기초 2 import pandas as pd summer = pd.read_csv('summer.csv', index_col='Athlete') summer # 점 표기법 summer.Medal # 대괄호 표기법 # 띄어쓰기등이 추가로 가능하다는 점이 있다. summer['Medal'] # 모든 행 값에 대하여, Year, Medal 정보를 출력해라. summer.loc[:,['Year', 'Medal']] # 추후 멀티행, 멀티컬럼등을 조작할때 문제가 발생 가능하니 loc 사용을 권장한다고 한다; # 사용법은 알았고, iloc과 loc의 쓰임새등을 더 알아보자. # 보니깐 iloc은 숫자만 사용 가능하고, loc은 문자만 사용가능한것같다. # 물론 loc의 행이나, 열의 값이 0,1,2,3 이런식으로 되어있는 .. 2022. 7. 14.
pandas 기초1 # 첫번째 열에 대한 3개의 정보를 가져오고 싶다면 summer.iloc[0, :3] # Year 1896 # City Athens # Sport Aquatics # Name: HAJOS, Alfred, dtype: object​ import pandas as pd titanic = pd.read_csv('./titanic.csv') titanic # 화면에 보여줄 수 있는 pandas의 각 실행별로 최대 rows 값 pd.options.display.max_rows # 화면에 보여줄 수 있는 pandas의 각 실행별로 최저 rows 값 pd.options.display.min_rows #10 # pd.options.display.min_rows = 20 # 이라고 해주면, pandas를 출력할때마다 2.. 2022. 7. 14.
selenium 오일 데이터 스크래핑 후 시각화 1 (판다스 데이터프레임까지) 오일 정보 스크래핑은 정말 애먹었었고, 한달전쯤 봤을땐 어떻게 해야할지 감도 안오던 때가 있었다. 그래서 유데미의 selenium 강의를 추가로 들었었고, 그때 적당히 쌓인 기초에, 최근에 제로베이스 해설강의 까지 들으면서 "최소한"의 이해가 되었다. 고 판단되었다. 너무 뿌듯하다. 코드와 과정이 참 길다. 그리고 그대로 따라쓰기엔 불편한 코드도 많을테지만, 공부에 참고를 위해서 주석처리등 부분을 그대로 둔다. 답안코드에서 참고한 사항은 두가지다. 첫번째. 자꾸 index out of range 에러가 나길래 이 부분에 대해서만 배꼈고, 이 부분에 대한 이해는 아직 충분하지 않다. 좀 더 생각해봐야겠다. 두번째. 위도값, 경도값을 googlemaps 에 주소를 입력하여 얻어내는 과정을 거치는걸 모르겠어서.. 2022. 7. 6.
판다스(pandas) KeyError billborad_long 변수에 담긴 값은 yearartisttracktimedate.enteredweekrating 320003 Doors DownLoser4:242000-10-21wk176.0 32020003 Doors DownLoser4:242000-10-21wk276.0 63720003 Doors DownLoser4:242000-10-21wk372.0 95420003 Doors DownLoser4:242000-10-21wk469.0 127120003 Doors DownLoser4:242000-10-21wk567.0 이렇게 생겼다. 그리고 이 중에서 고정된 컬럼값을 만들어주기위해서 billboard_songs = billboard_long['year', 'artist', 'track', 'time.. 2022. 6. 17.