본문 바로가기

Data Analysis

plotly 연습 # 참고 데이터 import plotly.express as px data_canada = px.data.gapminder().query("country == 'Canada'") # 참고할 색상 표 colorscales: ['aggrnyl', 'agsunset', 'algae', 'amp', 'armyrose', 'balance', 'blackbody', 'bluered', 'blues', 'blugrn', 'bluyl', 'brbg', 'brwnyl', 'bugn', 'bupu', 'burg', 'burgyl', 'cividis', 'curl', 'darkmint', 'deep', 'delta', 'dense', 'earth', 'edge', 'electric', 'emrld', 'fall', 'gey.. 더보기
Pandas (5) Method Chaining DataFrame method chain으로 묶기 Series와 달리 DataFrame에 대한 method chaining은 각 단계에서 반환되는 객체 유형을 정확히 숙지해야 함 In [66]: movie = pd.read_csv(r'C:\Users\user\jupyterpractice\EDA\Pandas-Cookbook-master\data\movie.csv') movie.isnull().head() Out[66]: color director_name num_critic_for_reviews duration director_facebook_likes actor_3_facebook_likes actor_2_name actor_1_facebook_likes gross genres actor_1_name m.. 더보기
Pandas (4) Dataframe 연산 전체 DataFrame에 대한 연산 In [31]: pd.options.display.max_rows = 8 movie = pd.read_csv(r'C:\Users\user\jupyterpractice\EDA\Pandas-Cookbook-master\data\movie.csv') movie.shape Out[31]: (4916, 28) In [32]: movie.size Out[32]: 137648 In [33]: # numpy에서 ndim은 차원의 수를 반환함 movie.ndim Out[33]: 2 In [34]: # len은 row의 수를 반환함 len(movie) Out[34]: 4916 In [35]: # count method로 각 열의 누락값을 제외한 실제 값의 개수를 알아낸다. movie.c.. 더보기
Pandas (3) Column 네이밍 In [3]: import pandas as pd import numpy as np pd.options.display.max_columns = 40 movie = pd.read_csv(r'C:\Users\user\jupyterpractice\EDA\Pandas-Cookbook-master\data\movie.csv') 열 이름 일목요연하게 정렬하기 가이드 라인 각 열을 연속 / 불연속에 따라 분류 연속 / 불연속 내에서 공통적인 열은 그룹으로 만들기 그룹 내 가장 중요한 열이 가장 먼저 나오게 하고, 범주형 열을 연속형보다 먼저 나오게 하기 추가로 볼 논문 : Tidy Data (http://bit.ly/2v1hvH5) In [25]: movie = pd.read_csv(r'C:\Users\user\ju.. 더보기
Pandas (2) Column 조작 Chapter 2: DataFrame 필수 연산 In [3]: import pandas as pd import numpy as np pd.options.display.max_columns = 40 DataFrame에서 복수의 열 선택 방법 1. DataFrame[[사용할 컬럼들]] 방법 2. 같은 방법인데 이중 인덱스 안에 길게 표기하는 게 싫을 때.. -> 아래에 따로 추가된 사항 방법이 이거임 cols = [사용할 컬럼들] DataFrame[cols] In [4]: movie = pd.read_csv(r'C:\Users\user\jupyterpractice\EDA\Pandas-Cookbook-master\data\movie.csv') movie_actor_director = movie[['actor_.. 더보기
Pandas (1) 데이터 정보 확인 In [1]: import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline In [2]: movie = pd.read_csv(r'C:\Users\user\jupyterpractice\EDA\Pandas-Cookbook-master\data\movie.csv') In [3]: movie.head(3) Out[3]: color director_name num_critic_for_reviews duration director_facebook_likes actor_3_facebook_likes actor_2_name actor_1_facebook_likes gross genres ... num_user_for_r.. 더보기
Plotly-Dash Environmental Testing In [1]: import plotly.express as px from jupyter_dash import JupyterDash import dash_core_components as dcc import dash_html_components as html from dash.dependencies import Input, Output # Load Data df = px.data.tips() # Build App app = JupyterDash(__name__) app.layout = html.Div([ html.H1("JupyterDash Demo"), dcc.Graph(id='graph'), html.Label([ "colorscale", dcc.Dropdown( id='colorscale-dropdo.. 더보기