본문 바로가기

AI/Data Analysis, Statistics

Sprint3_선형대수(Linear combinations, span, and basis vectors)

 

 

  • Variance : 데이터가 얼마나 퍼져있는가 측정하는 방법

data.a.var(ddof=1)

 

  • Standard Deviation : 분산은 스케일이 커지기 때문에 제곱근으로 적당히 줄인 값
data.a.std(ddof=1)

 

  • Covariance : 변수 1개가 변할 때 다른 변수는 어떤 변화가 생기는지 측정

https://destrudo.tistory.com/15

(a) cov(x, y) > 0 : x가 증가하면 y도 증가

(b) cov(x, y) < 0 : x가 증가하면 y는 감소

(c) cov(x, y) = 0 : xy의 관련이 없음(독립)

 

  • Correlation Coefficient : 공분산은 x, y 단위 크기에 영향을 받는 문제가 있어 상관계수의 개념이 나타남(데이터가 많으면 연관성이 없어도 공분산이 크게 나타남)

(a) cor(x, y) > 0 & cor(x, y) < 1

(b) cor(x, y) < 0 & cor(x, y) > -1

(c) cor(x, y) = 0

 

 

 

 

  • 벡터의 orthogonality : 벡터가 서로 수직 상태인 것. 한 벡터의 수직인 벡터는 서로 독립니다.
  • Unit vectors : 방향만 가지고 있는 길이가 1 백터. 모든 백터(매트릭스) 단위 백터의 선형 조합으로 표기됨. 벡터들이 단위 길이(0~1) 가지면 벡터 연산과 관련된 계산 시간이 최소화 된다. -> 주어진 백터를 단위백터의 선형 조합으로 표기할  있다.

2차원의 단위 벡터

 

  • Span : 주어진 벡터의 수에 따라 공간을 만들 수 있다. 벡터 두개가 주어지면 두 벡터의 조합으로 만들 수 있는 모든 가능한 벡터의 집합이다.
    • 두 벡터가 같은 선상에 있으면(종속 관계) 하나의 직선만 만들어지고 선 외부의 새로운 벡터는 생성할 수 없음
  • Basis : span에 반대되는 개념으로 매트릭스의 열을 이루고 있는 백터들로 만들 수 있는 공간의 차원

https://losskatsu.github.io/linear-algebra/basis/#2-%EC%A2%8C%ED%91%9C%ED%8F%89%EB%A9%B4%EC%97%90%EC%84%9C%EC%9D%98-%EA%B8%B0%EC%A0%80