概率机器人的技术核心是由传感器数据来估计状态。

状态估计是用来解决“某些变量(状态值)不能直接观测,但是可以从传感器的数据中估计” 这个问题。

概率的基本概念

1.随机变量:XX 变量取值为xx的概率:

p(X=x)p(X=x)

有时简写为p(x)p(x)

2.PDF(Probability Density Function):概率密度函数

正态分布: $$\mathcal{N}(x;\mu, \sigma^2)$$

一维:

p(x)=1σ2πe(xμ)22σ2p(x) = \frac{1}{\sigma \sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}}

多维:

p(x)=1(2π)kΣexp(12(xμ)Σ1(xμ))p(x) = \frac{1}{\sqrt{(2\pi)^k |\boldsymbol{\Sigma}|}} \exp\left( -\frac{1}{2} (\mathbf{x} - \boldsymbol{\mu})^\top \boldsymbol{\Sigma}^{-1} (\mathbf{x} - \boldsymbol{\mu}) \right)

参数说明:

  • xRk\mathbf{x} \in \mathbb{R}^kkk维随机向量观测值
  • μRk\boldsymbol{\mu} \in \mathbb{R}^k:均值向量(决定分布中心)
  • ΣRk×k\boldsymbol{\Sigma} \in \mathbb{R}^{k \times k}:协方差矩阵(决定分布形状)

关键性质:

  1. 非退化条件:协方差矩阵必须正定(Σ\boldsymbol{\Sigma} 的特征值全为正)
  2. 线性变换不变性:若 XN(μ,Σ)\mathbf{X} \sim N(\boldsymbol{\mu}, \boldsymbol{\Sigma}),则 AX+bN(Aμ+b,AΣA)A\mathbf{X} + \mathbf{b} \sim N(A\boldsymbol{\mu}+\mathbf{b}, A\boldsymbol{\Sigma}A^\top),其中 AA 为任意 m×km \times k 矩阵
  3. 边缘分布:任意子集维度构成的分布仍为正态分布
  4. 条件分布:给定部分维度的观测值,剩余维度的条件分布仍为正态分布

协方差矩阵结构解析:

Σ=(σ12ρσ1σ2ρσ1σkρσ2σ1σ22ρσ2σkρσkσ1ρσkσ2σk2)\boldsymbol{\Sigma} = \begin{pmatrix} \sigma_1^2 & \rho\sigma_1\sigma_2 & \cdots & \rho\sigma_1\sigma_k \\ \rho\sigma_2\sigma_1 & \sigma_2^2 & \cdots & \rho\sigma_2\sigma_k \\ \vdots & \vdots & \ddots & \vdots \\ \rho\sigma_k\sigma_1 & \rho\sigma_k\sigma_2 & \cdots & \sigma_k^2 \end{pmatrix}

  • 对角线元素 σi2\sigma_i^2:第 ii 个变量的方差
  • 非对角线元素 ρσiσj\rho\sigma_i\sigma_j:变量 iijj 的协方差(ρ\rho 为相关系数)

特殊形式:

  • 球对称分布:当协方差矩阵为 σ2I\sigma^2 \mathbf{I} 时,各维度独立同分布
  • 独立性条件:当 Σ\boldsymbol{\Sigma} 为对角矩阵时,各维度相互独立3,4

3.贝叶斯公式

要求p(y)>0p(y)\gt 0

离散情况:

p(xy)=p(yx)p(x)p(y)=p(yx)p(x)xp(yx)p(x)p(x|y) = \frac{p(y|x)p(x)}{p(y)}=\frac{p(y|x)p(x)}{\sum_{x^\prime}p(y|x^\prime)p(x^\prime)}

连续情况:

p(xy)=p(yx)p(x)p(y)=p(yx)p(x)p(yx)p(x)dxp(x|y) = \frac{p(y|x)p(x)}{p(y)}=\frac{p(y|x)p(x)}{\int p(y|x^\prime)p(x^\prime)dx}

(xx是机器人的状态,yy是传感器数据)

另外p(y)p(y)是不会依赖于x的,所以经常使用

p(xy)p(yx)p(x)p(x|y)\propto p(y|x)p(x)

得到“先验”和“似然”后通常会 需要乘以归一化因子。