백분위수와 상자그림 | 도수분포표와 히스토그램 | 밀도그림과 추정¶
1단계 : 데이터 로드하기¶
In [ ]:
from google.colab import drive
drive.mount('/content/drive')
Mounted at /content/drive
2단계: 데이터 확인하기¶
In [ ]:
AIRPORT_DELAYS_CSV = '/content/drive/MyDrive/통계공부/PSDS/data/dfw_airline.csv'
In [ ]:
import pandas as pd
dfw = pd.read_csv(AIRPORT_DELAYS_CSV)
print(100 * dfw / dfw.values.sum())
Carrier ATC Weather Security Inbound 0 23.022989 30.400781 4.025214 0.122937 42.428079
3단계: 계산하기¶
In [ ]:
#막대도표
ax = dfw.transpose().plot.bar(figsize=(4,4),legend=False)
ax.set_xlabel('Cause of delay')
ax.set_ylabel('Count')
Out[ ]:
Text(0, 0.5, 'Count')
'수학 및 통계 > PSDS' 카테고리의 다른 글
| [PSDS] 상관관계 실습 (0) | 2023.09.26 |
|---|---|
| [PSDS] 상관관계 (0) | 2023.09.25 |
| [PSDS] 이진 데이터와 범주 데이터 탐색하기 (0) | 2023.09.23 |
| [PSDS] 데이터 분포 탐색하기 실습 (0) | 2023.09.22 |
| [PSDS] 데이터 분포 탐색하기 (0) | 2023.09.21 |