[Python] 파이썬#8 - Pandas의 groupby, numpy, pivot table의 사용 Pandas로 만들어진 data frame을 grouping하는 다양한 방법에 대해서 얘기합니다. 또한 numpy library와 pivot table을 이용하여 데이터를 묶어서 의미있는 값을 가지는 집합으로 나타내 보겠습니다. 이글은 Phtyon 3를 기반으로 작성되었습니다. 데이터 로드 기본예제로 사용할 sample 예제를 로드해 보겠습니다. 앞서 여러번 했으므로 이번에는 한번에 하겠습니다. import pandas as pd # 엑셀파일 로드 xls = pd.ExcelFile('yelp.xlsx') # 각 sheet의 데이터 로드 df = xls.parse('yelp_data') df_cities = xls.parse('cities') df_states = xls.parse('states') # y.. 개발이야기/Python 3년 전
[Python] 파이썬#7 - Pandas를 이용한 data frame의 sum, mean, nunique, counts, 함수적용 이전까지는 데이터를 로드하여 data frame으로 만들고 read, filtering 하는 방법에 대해서 포스팅 했습니다. data frame은 DB의 table 개념과 유사하여 sql에서 지원하는 것들에 대한 기능을 하는 함수들을 제공했었습니다. 이번 포스팅에는 sql의 group함수들을 data frame에서 어떻게 이용할 수 있는지를 확인해 보겠습니다. 이글은 Phtyon 3를 기반으로 작성되었습니다. 데이터 로드 기본예제로 사용할 sample 예제를 로드해 보겠습니다. import pandas as pd xls = pd.ExcelFile('yelp.xlsx') df = xls.parse('yelp_data') df.head() Computation # count(), sum(), mean() -.. 개발이야기/Python 3년 전