- correlation heatmap 그리기
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
%config InlineBackend.figure_format = 'retina'
corr_df = df[COLUMNS].corr()
plt.figure(figsize=(8, 8))
sns.heatmap(corr_df,
annot = True, # 실제 값 화면에 나타내기
cmap = 'RdYlBu_r', # Red, Yellow, Blue 색상으로 표시
vmin = -1, vmax = 1, #컬러차트 -1 ~ 1 범위로 표시
)
- T-Test : Numeric 변수 단변량 비교
from scipy.stats import chi2_contingency, chisquare
# 각 군 데이터의 nan 값 제거
tmp1 = [x for x in df1 if math.isnan(x)==False]
tmp2 = [x for x in df2 if math.isnan(x)==False]
# check P-value (Numeric)
p1 = stats.ttest_ind(tmp1, tmp2)[1]
print(f'P-value: { p1 }')
- Chi-squared test: Categorical 변수 단변량 비교
import pandas as pd
# check P-value (Categorical variables)
tmp1 = test3[feature1]
tmp2 = test3[feature2]
contingency = pd.crosstab(tmp1, tmp2)
chi, p, dof, expected = chi2_contingency(contingency)
print(p)
'Python Code' 카테고리의 다른 글
Linux 우분투 cuda 버전/GPU 사용량 확인 (0) | 2023.10.29 |
---|---|
python Image Tranforms (이미지 전처리) (0) | 2023.10.28 |
Gitlab 사용법 (0) | 2023.10.26 |
이미지 데이터 딥러닝 학습 코드 (0) | 2023.10.25 |
파일 크기 확인 코드 (Python) (1) | 2023.10.18 |