본문 바로가기

Pandas37

beautifulsoup netflex, pandas 웹스크래핑 후 엑셀 저장 # 첫번째 셀 count = 0 result = [] for section in section_list: roop_list = section.select('li.nm-content-horizontal-row-item') for i in roop_list: section_title = section.select('h2')[0].text title = i.select('span')[1].text img = i.select('img')[0]['src'] try: link =i.select('a')[0]['href'] except: link = 'empty' # 모든 자료를 리스트화 시키려고 했더니 link가 걸리는 부분이였고, 딕셔너리 안에서의 예외처리는 # 하는 방법을 못찾겠어서 강의듣고 습득했다. data.. 2022. 6. 24.
판다스(pandas) KeyError billborad_long 변수에 담긴 값은 yearartisttracktimedate.enteredweekrating 320003 Doors DownLoser4:242000-10-21wk176.0 32020003 Doors DownLoser4:242000-10-21wk276.0 63720003 Doors DownLoser4:242000-10-21wk372.0 95420003 Doors DownLoser4:242000-10-21wk469.0 127120003 Doors DownLoser4:242000-10-21wk567.0 이렇게 생겼다. 그리고 이 중에서 고정된 컬럼값을 만들어주기위해서 billboard_songs = billboard_long['year', 'artist', 'track', 'time.. 2022. 6. 17.
판다스(pandas) TypeError: 'function' object is not subscriptable print(pd.concat[df1, new_row_df]) 라고 쓰여있는듯 해서 입력했더니 TypeError: 'function' object is not subscriptable 라는 에러가 떴다; 직역하자면 입력한 기능이 없다.로 이해하면 될것같다. 기본적으로 concat은 이어붙이는 기능이고, 특별한 설정이 없는 한에서는 열(가로)기준으로 이어붙여지는걸로 알고있다. 좀 더 쉽게 말하자면 그냥 아래로 계속 concat 한 만큼 늘어가는 것이다. 위에서 내가 원하는 바를 코드를 통해서 풀어보자면 df1의 밑에다가 new_row_df를 이어붙여줘. 라는 명령어를 입력했는데 에러가 났다. print(pd.concat([df1, new_row_df])) 이에 이렇게 ()로 한번 더 감싸주니깐 작동되더라. .. 2022. 6. 16.
판다스(pandas) valueerror: shape of passed values is (4, 1), indices imply (4, 4) new_row_df = pd.DataFrame(['n1', 'n2', 'n3', 'n4'], columns=['A', 'B','C','D']) print(new_row_df) 와 같이 DataFrame에 기존에 있던 컬럼4개에 각 4개의 값을 추가해주려고 할때 ValueError: Shape of passed values is (4, 1), indices imply (4, 4) 라는 에러가 떴다. 왜그럴까? 우선 저 value error를 직역해보자면 이미 지나간 값이 4와 1인데 인덱스들(indices)이 암시(imply)하는 바는 4와 4이다. 즉, 내가 4개의 값을 4개의 열(세로)에 추가해주려고 하는데, 그러기엔 내가 입력한 값이 행(가로)로 넣어주려는 값이 4개고 지정된 열(세로)는 1개라는 것.. 2022. 6. 16.