-
[Method] Data VisualizationAI부트캠프 2021. 1. 2. 22:48
[section1-sprint1-n114]
Dataframe의 visualization
1. Matplotlib
matplotlib.pyplot : a collection of functions that make matplotlib work like MATLAB
1) Line plot
import matplotlib.pyplot as plt
plt.plot('col', data=df)
plt.xlabel(' ')
plt.ylabel(' ')
plt.show()x축은 index를 기준으로, y축은 col 이라는 이름을 가진 column을 기준으로 line plot이 생성된다.
2) Bar plot
plt.bar('col1', 'col2', data = df)
plt.xlabel('col1')
plt.ylabel('col2')
plt.show()3) Scatter plot
plt.scatter('col1', 'col2', data = df)
plt.xlabel('col1')
plt.ylabel('col2')
plt.show()4) Pie plot
explode = [0.05, 0.05]
labels = df.loc[:, 'col1'].values
plt.pie('col2', data=df, labels=labels, explode=explode)
plt.show()*explode = 중심으로부터 pie 조각이 떨어진 정도
2. Seaborn
seaborn : a Python data visualization library based on matplotlib.
1) scatter plot
#분석하려는 data 가 Continuous data일 경우
import seaborn as sns
sns.relplot(x='col1', y='col2', data=df) #기본적인 scatter plot 형태#분석하려는 data에 Continuous data와 Categorical data가 섞여있을 경우
sns.relplot(x='col1_conti', y='col2_conti', hue='col3_categ', data=df)
#sns.relplot(x='col1_conti', y='col2_conti', style='col3_categ', data=df)
#sns.relplot(x='col1_conti', y='col2_conti', size='col3_categ', data=df)*hue : categorical data 종류에 따라 다른 색으로 표시
*style : categorical data 종류에 따라 다른 모양의 점으로 표시
*size : categorical data 종류에 따라 다른 크기의 점으로 표시
#분석하려는 data가 Categorical data일 경우
sns.catplot(x='col1', y='col2', hue='col3', order=['col','col','col'], data=df)2) box plot
sns.catplot(x='col1', y='col2', kind='box', hue='col3', data=df)
*kind : 'bar', 'line' 등등 사용 가능
3) Facet
#Facet : 다양한 그래프를 한 화면에 표시
g = sns.FacetGrid(data = df, col = 'col1')
plt.gcf().set_size_inches( , )
g.map_dataframe(
sns.violinplot,
x = 'col2',
y = 'col3',
data = df,
)
g.add_legend();'AI부트캠프' 카테고리의 다른 글
[Concept] Hypothesis Test (2) 2021.01.06 [Method] Feature Engineering (2) 2021.01.04 [Method] Data manipulation (1) 2020.12.31 [Concept] Feature Engineering (0) 2020.12.29 [Concept] EDA, Pandas, Types of Data, Markdown (0) 2020.12.28