[Python] 파이썬#7 - Pandas를 이용한 data frame의 sum, mean, nunique, counts, 함수적용 이전까지는 데이터를 로드하여 data frame으로 만들고 read, filtering 하는 방법에 대해서 포스팅 했습니다. data frame은 DB의 table 개념과 유사하여 sql에서 지원하는 것들에 대한 기능을 하는 함수들을 제공했었습니다. 이번 포스팅에는 sql의 group함수들을 data frame에서 어떻게 이용할 수 있는지를 확인해 보겠습니다. 이글은 Phtyon 3를 기반으로 작성되었습니다. 데이터 로드 기본예제로 사용할 sample 예제를 로드해 보겠습니다. import pandas as pd xls = pd.ExcelFile('yelp.xlsx') df = xls.parse('yelp_data') df.head() Computation # count(), sum(), mean() -.. 개발이야기/Python 3년 전
[Python] 파이썬#5 - Pandas를 이용한 Excel 파일 Load 앞서 csv.DicReader를 통해서 Dictionary 형태로 데이터를 로드했습니다만 pandas를 이용하면 엑셀의 2차원 배열을 그대로 data frame으로 가져와서 사용할수 있습니다. 마치 DB의 테이블처럼 말이죠.[1] 먼저 pandas를 이용하여 excel을 로드하는 기본적인 구문부터 보도록 하겠습니다. 이글은 Phtyon 3를 기반으로 작성되었습니다. pandas import 및 데이터 로드 import pandas as pd xls = pd.ExcelFile('yelp.xlsx') df = xls.parse('yelp_data') # yelp_data sheet를 읽는다. df2 = xls.parse('cities') # cities sheet를 읽는다. print(type(df)) ye.. 개발이야기/Python 3년 전