
- Variance : 데이터가 얼마나 퍼져있는가 측정하는 방법

data.a.var(ddof=1)
- Standard Deviation : 분산은 스케일이 커지기 때문에 제곱근으로 적당히 줄인 값
data.a.std(ddof=1)
- Covariance : 변수 1개가 변할 때 다른 변수는 어떤 변화가 생기는지 측정

(a) cov(x, y) > 0 : x가 증가하면 y도 증가
(b) cov(x, y) < 0 : x가 증가하면 y는 감소
(c) cov(x, y) = 0 : x와 y의 관련이 없음(독립)
- Correlation Coefficient : 공분산은 x, y 단위 크기에 영향을 받는 문제가 있어 상관계수의 개념이 나타남(데이터가 많으면 연관성이 없어도 공분산이 크게 나타남)

(a) cor(x, y) > 0 & cor(x, y) < 1
(b) cor(x, y) < 0 & cor(x, y) > -1
(c) cor(x, y) = 0
- 벡터의 orthogonality : 벡터가 서로 수직 상태인 것. 한 벡터의 수직인 벡터는 서로 독립니다.
- Unit vectors : 방향만 가지고 있는 길이가 1인 백터. 모든 백터(매트릭스)는 단위 백터의 선형 조합으로 표기됨. 벡터들이 단위 길이(0~1)를 가지면 벡터 연산과 관련된 계산 시간이 최소화 된다. -> 주어진 백터를 단위백터의 선형 조합으로 표기할 수 있다.

- Span : 주어진 벡터의 수에 따라 공간을 만들 수 있다. 벡터 두개가 주어지면 두 벡터의 조합으로 만들 수 있는 모든 가능한 벡터의 집합이다.
- 두 벡터가 같은 선상에 있으면(종속 관계) 하나의 직선만 만들어지고 선 외부의 새로운 벡터는 생성할 수 없음
- Basis : span에 반대되는 개념으로 매트릭스의 열을 이루고 있는 백터들로 만들 수 있는 공간의 차원


'AI > Data Analysis, Statistics' 카테고리의 다른 글
Sprint3_선형대수(Screeplot, clustering) (0) | 2021.01.19 |
---|---|
Sprint3_선형대수(dimension reduction) (0) | 2021.01.14 |
Sprint3_선형대수(백터, 스칼라) (2) | 2021.01.12 |
Section2_Sprint challenge (0) | 2021.01.12 |
Section_Confidence Interval (0) | 2021.01.07 |