데이터 분석에서 사용되는 객체의 형태 => 테이블 데이터(행[각 레코드] + 열[피쳐])
비정형데이터는 테이블 데이터의 피처 형태로 표현
관계형 데이터 베이스에 있는 데이터를 불러올 때 하나의 테이블 형태로 변환
데이터를 활용하는 목적에 따라 지표변수가 결과변수로 쓰일 수 있음.
데이터 프레임과 인덱스
데이터베이스에서 하나 혹은 그 이상의 열을 인덱스로 지정
Pandas -> DataFrame(순차적으로 정수인 값을 붙여 인덱스 사용)
-> 다중/계층적 인덱스 설정
테이블 형식이 아닌 데이터 구조
(1) 시계열 데이터
동일한 변수 안에 연속적인 측정값
(2) 공간 데이터
지도 제작과 위치 정보 분석에 사용
객체 = 객체와 그 공간좌표
필드 = 공간을 나타내는 작은 단위들과 적당한 측정 기준값
(3) 그래프 데이터
다소 추상적인 관계들을 표현하기 위해 사용
네트워크 최적화나 추천 시스템 문제에 유용
'수학 및 통계 > PSDS' 카테고리의 다른 글
| [PSDS] 데이터 분포 탐색하기 (0) | 2023.09.21 |
|---|---|
| [PSDS] 예제:인구에 따른 살인 비율의 위치 추정 (0) | 2023.09.18 |
| [PSDS] 위치 추정 (0) | 2023.09.17 |
| [PSDS] 정형화된 데이터의 요소 (0) | 2023.09.15 |
| [PSDS] CHAPTER 1 탐색적 데이터 분석 (0) | 2023.09.14 |