均值能否作为协方差阵的特征值?

2024-05-18 08:00

1. 均值能否作为协方差阵的特征值?

x的均值与x独立。
x1和x的均值独立。E(x1,x)=(EX1,EX),协方差阵是2*2矩阵,对角线上是各自方差,非对角线是协方差。用A表“样本均值”E(AXi)是否等于E(A)E(Xi)E(AXi)=(1/n)E(X1Xi+X2Xi+Xi平方+XnXi)由于,E(Xi平方)=方差+均值平方,显然不满足“必要条件”。

平均数
是统计中的一个重要概念。小学数学里所讲的平均数一般是指算术平均数,也就是一组数据的和除以这组数据的个数所得的商。在统计中算术平均数常用于表示统计对象的一般水平,它是描述数据集中位置的一个统计量。既可以用它来反映一组数据的一般情况、和平均水平,也可以用它进行不同组数据的比较,以看出组与组之间的差别。

均值能否作为协方差阵的特征值?

2. 求协方差矩阵

如图所示

3. 协方差矩阵

a的协方差矩阵就是E(aa')。其中E代表数学期望,a'代表a的转置。我这里默认你这个a是写成列向量的形式的。
所以a/||a||的协方差矩阵就是E(aa')/||a||^2,就是把a的协方差矩阵里的每个元素都除以||a||^2。
当a的协方差矩阵是单位阵时,a的任意一个元素(都是随机变量)的方差都是1,而且任意两个元素不相关(不相关不代表独立)。

协方差矩阵

4. 协方差矩阵

用matlab算:
a=[-1.54    -5.93    -258.1    -3.5    2.26    0.13];
cov(a)

ans =
1.0963e+004
或者:
a=[-1.54    -5.93    -258.1  ;  -3.5    2.26    0.13];
 cov(a)

ans =
  1.0e+004 *
    0.0002   -0.0008   -0.0253
   -0.0008    0.0034    0.1057
   -0.0253    0.1057    3.3341
或者:
 a=[-1.54    -5.93  ;  -258.1    -3.5 ;   2.26    0.13]
 cov(a)

ans =
  1.0e+004 *
    2.2271    0.0057
    0.0057    0.0009

5. 协方差的矩阵

分别为m与n个标量元素的列向量随机变量X与Y,这两个变量之间的协方差定义为m×n矩阵.其中X包含变量X1.X2......Xm,Y包含变量Y1.Y2......Yn,假设X1的期望值为μ1,Y2的期望值为v2,那么在协方差矩阵中(1,2)的元素就是X1和Y2的协方差。两个向量变量的协方差Cov(X,Y)与Cov(Y,X)互为转置矩阵。协方差有时也称为是两个随机

协方差的矩阵

6. 协方差矩阵

 在统计学上,协方差用来刻画两个随机变量之间的相关性,反映的是变量之间的二阶统计特性,两个随机变量Xi和Yj的协方差定义为
                                           所以
                                           是一个矩阵,其  i ,  j  位置的元素是第  i  个与第  j  个随机向量(即随机变量构成的向量)之间的协方差。   设X1,X2,...,Xn为一组随机变量,记X=(X1,X2,...,Xn)T为由这n个随机变量构成的随机向量,假设每个随机变量有m个样本,将所有的样本拼接在一起可以得到如下的 样本矩阵 
                                           协方差矩阵是计算不同维度间的协方差,要时刻牢记这一点。因此样本矩阵的每行是一个样本,每列为一个维度,所以我们要按列计算均值。 但是 peghoty 博客中用的是矩阵第i行元素表示第i个随机变量Xi的m个样本 ,所以以下分析暂时用的peghoty的方案。
   引入向量αi和βi
                                           αi是样本矩阵的行向量,βi是样本矩阵的列向量,所以样本矩阵表示为
                                           对于n维的随机变量X=(X1,X2,…,Xn)T的协方差矩阵定义为
   
                                           
    协方差矩阵中的对角线元素表示方差,非对角线元素表示随机向量X的不同随机量之间的协方差 ,因此协方差矩阵可以作为 刻画不同分量之间相关性的一个评判量 ,不同分量之间的相关性越小,则C的非对角线元素的值就越小,特别地,如果不同分量彼此不相关,那么C就变成一个 对角阵 。    注意:我们并不能得到协方差矩阵C的真实性,只能根据所提供的X的样本数据,对其进行近似估计,因此,这样计算得到的协方差矩阵是依赖于样本数据的,通常提供的样本数目越多(m越大),样本在总体中的覆盖面就越广,所得协方差矩阵就越可靠。 
   **协方差公式推导

7. 协方差和协方差矩阵

 均值:        方差:        均值、方差和标准差可用于描述数据的集中趋势和离散程度。
   方差一般用来描述一维数据,而实际上我们接触的数据集大多是多维的。
   此时可以用协方差来度量两个随机变量之间的关系。
   参照方差的定义:        度量两个随机变量关系的协方差可以这样定义:        两个随机变量越线性相关,协方差越大,完全线性无关,协方差为零。
   由于随机变量的取值范围不同,两个协方差不具备可比性。
   如  是三个不同的随机变量,想要比较  与  的线性相关程度强还是  与  的线性相关程度强,通过  和  是无法比较得知的。
   我们可以定义一个相关系数  :     
   通过对协方差  归一化,得到相关系数  ,取值范围为[-1,1]。1表示完全线性正相关,-1表示完全线性负相关,0表示线性无关。
   对于多维数据,往往需要计算各维度两两之间的协方差,这样各协方差组成了一个n x n的矩阵,称为协方差矩阵。协方差矩阵是个 对称矩阵 , 对角线上的元素是各维度上随机变量的方差 。
   定义协方差矩阵为  :     
    StatQuest-Covariance and Correlation(视频)     协方差与协方差矩阵     均值,方差和协方差矩阵 

协方差和协方差矩阵

8. 已知协方差矩阵求相关矩阵

D(X)=4,D(Y)=5,COV(X,Y)=3
  D(X+3Y)=4+9×5+6×3=67,D(2X-Y)=16-12+5=9
  COV【(X+3Y),(2X-Y)】=8+15-15=8
  随机向量(X+3Y,2X-Y)的协方差矩阵(67,8,8,9)
  相关系数矩阵(1,8/3根号(67),8/3根号(67),1)