Python Code

파이썬(python) 통계분석 코드 [T test][Chi-square]

Kimhj 2023. 10. 28. 16:33
  • correlation heatmap 그리기
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
%config InlineBackend.figure_format = 'retina'

corr_df = df[COLUMNS].corr()

plt.figure(figsize=(8, 8))
sns.heatmap(corr_df, 
               annot = True,      # 실제 값 화면에 나타내기
               cmap = 'RdYlBu_r',  # Red, Yellow, Blue 색상으로 표시
               vmin = -1, vmax = 1, #컬러차트 -1 ~ 1 범위로 표시
              )

 

  • T-Test : Numeric 변수 단변량 비교
from scipy.stats import chi2_contingency, chisquare

# 각 군 데이터의 nan 값 제거
tmp1 = [x for x in df1 if math.isnan(x)==False]
tmp2 = [x for x in df2 if math.isnan(x)==False]

# check P-value (Numeric)
p1 = stats.ttest_ind(tmp1, tmp2)[1]
print(f'P-value: { p1 }')

 

  • Chi-squared test: Categorical 변수 단변량 비교
import pandas as pd

# check P-value (Categorical variables)

tmp1 = test3[feature1]
tmp2 = test3[feature2]

contingency = pd.crosstab(tmp1, tmp2)
chi, p, dof, expected = chi2_contingency(contingency)
print(p)