ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [Method] Data Visualization
    AI부트캠프 2021. 1. 2. 22:48

    [section1-sprint1-n114]

     

    Dataframe의 visualization

     

    1. Matplotlib

     

    matplotlib.pyplot : a collection of functions that make matplotlib work like MATLAB

     

    1) Line plot

    import matplotlib.pyplot as plt

    plt.plot('col', data=df)
    plt.xlabel(' ')
    plt.ylabel(' ')

    plt.show()

    x축은 index를 기준으로, y축은 col 이라는 이름을 가진 column을 기준으로 line plot이 생성된다.

     

    2) Bar plot

    plt.bar('col1', 'col2', data = df)
    plt.xlabel('col1')
    plt.ylabel('col2')
    plt.show()

     

    3) Scatter plot

    plt.scatter('col1', 'col2', data = df)
    plt.xlabel('col1')
    plt.ylabel('col2')
    plt.show()

    4) Pie plot

    explode = [0.05, 0.05]
    labels = df.loc[:, 'col1'].values

    plt.pie('col2', data=df, labels=labels, explode=explode)
    plt.show()

    *explode = 중심으로부터 pie 조각이 떨어진 정도

     

    2. Seaborn

     

    seaborn : a Python data visualization library based on matplotlib.

     

     1) scatter plot

    #분석하려는 data 가 Continuous data일 경우
    import seaborn as sns

    sns.relplot(x='col1', y='col2', data=df) #기본적인 scatter plot 형태
    #분석하려는 data에 Continuous data와 Categorical data가 섞여있을 경우
    sns.relplot(x='col1_conti', y='col2_conti', hue='col3_categ', data=df)
    #sns.relplot(x='col1_conti', y='col2_conti', style='col3_categ', data=df)
    #sns.relplot(x='col1_conti', y='col2_conti', size='col3_categ', data=df)

    *hue : categorical data 종류에 따라 다른 색으로 표시

    *style : categorical data 종류에 따라 다른 모양의 점으로 표시

    *size : categorical data 종류에 따라 다른 크기의 점으로 표시

     

    #분석하려는 data가 Categorical data일 경우
    sns.catplot(x='col1', y='col2', hue='col3', order=['col','col','col'], data=df)

     

    2) box plot

    sns.catplot(x='col1', y='col2', kind='box', hue='col3', data=df)

    *kind : 'bar', 'line' 등등 사용 가능

     

    3) Facet

    #Facet : 다양한 그래프를 한 화면에 표시

    g = sns.FacetGrid(data = df, col = 'col1')
    plt.gcf().set_size_inches( , )

    g.map_dataframe(
          sns.violinplot,
          x = 'col2',
          y = 'col3',
          data = df,
    )

    g.add_legend();

     

    'AI부트캠프' 카테고리의 다른 글

    [Concept] Hypothesis Test  (2) 2021.01.06
    [Method] Feature Engineering  (2) 2021.01.04
    [Method] Data manipulation  (1) 2020.12.31
    [Concept] Feature Engineering  (0) 2020.12.29
    [Concept] EDA, Pandas, Types of Data, Markdown  (0) 2020.12.28
Designed by Tistory.