Data Analysis/Exploratory Data Analysis 썸네일형 리스트형 Pandas (5) Method Chaining DataFrame method chain으로 묶기 Series와 달리 DataFrame에 대한 method chaining은 각 단계에서 반환되는 객체 유형을 정확히 숙지해야 함 In [66]: movie = pd.read_csv(r'C:\Users\user\jupyterpractice\EDA\Pandas-Cookbook-master\data\movie.csv') movie.isnull().head() Out[66]: color director_name num_critic_for_reviews duration director_facebook_likes actor_3_facebook_likes actor_2_name actor_1_facebook_likes gross genres actor_1_name m.. 더보기 Pandas (4) Dataframe 연산 전체 DataFrame에 대한 연산 In [31]: pd.options.display.max_rows = 8 movie = pd.read_csv(r'C:\Users\user\jupyterpractice\EDA\Pandas-Cookbook-master\data\movie.csv') movie.shape Out[31]: (4916, 28) In [32]: movie.size Out[32]: 137648 In [33]: # numpy에서 ndim은 차원의 수를 반환함 movie.ndim Out[33]: 2 In [34]: # len은 row의 수를 반환함 len(movie) Out[34]: 4916 In [35]: # count method로 각 열의 누락값을 제외한 실제 값의 개수를 알아낸다. movie.c.. 더보기 Pandas (3) Column 네이밍 In [3]: import pandas as pd import numpy as np pd.options.display.max_columns = 40 movie = pd.read_csv(r'C:\Users\user\jupyterpractice\EDA\Pandas-Cookbook-master\data\movie.csv') 열 이름 일목요연하게 정렬하기 가이드 라인 각 열을 연속 / 불연속에 따라 분류 연속 / 불연속 내에서 공통적인 열은 그룹으로 만들기 그룹 내 가장 중요한 열이 가장 먼저 나오게 하고, 범주형 열을 연속형보다 먼저 나오게 하기 추가로 볼 논문 : Tidy Data (http://bit.ly/2v1hvH5) In [25]: movie = pd.read_csv(r'C:\Users\user\ju.. 더보기 Pandas (2) Column 조작 Chapter 2: DataFrame 필수 연산 In [3]: import pandas as pd import numpy as np pd.options.display.max_columns = 40 DataFrame에서 복수의 열 선택 방법 1. DataFrame[[사용할 컬럼들]] 방법 2. 같은 방법인데 이중 인덱스 안에 길게 표기하는 게 싫을 때.. -> 아래에 따로 추가된 사항 방법이 이거임 cols = [사용할 컬럼들] DataFrame[cols] In [4]: movie = pd.read_csv(r'C:\Users\user\jupyterpractice\EDA\Pandas-Cookbook-master\data\movie.csv') movie_actor_director = movie[['actor_.. 더보기 Pandas (1) 데이터 정보 확인 In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline In [2]: movie = pd.read_csv(r'C:\Users\user\jupyterpractice\EDA\Pandas-Cookbook-master\data\movie.csv') In [3]: movie.head(3) Out[3]: color director_name num_critic_for_reviews duration director_facebook_likes actor_3_facebook_likes actor_2_name actor_1_facebook_likes gross genres ... num_user_for_r.. 더보기 이전 1 다음