概率机器人的技术核心是由传感器数据来估计状态。
状态估计是用来解决“某些变量(状态值)不能直接观测,但是可以从传感器的数据中估计” 这个问题。
概率的基本概念
1.随机变量:X 变量取值为x的概率:
p(X=x)
有时简写为p(x)
2.PDF(Probability Density Function):概率密度函数
正态分布: $$\mathcal{N}(x;\mu, \sigma^2)$$
一维:
p(x)=σ2π1e−2σ2(x−μ)2
多维:
p(x)=(2π)k∣Σ∣1exp(−21(x−μ)⊤Σ−1(x−μ))
参数说明:
- x∈Rk:k维随机向量观测值
- μ∈Rk:均值向量(决定分布中心)
- Σ∈Rk×k:协方差矩阵(决定分布形状)
关键性质:
- 非退化条件:协方差矩阵必须正定(Σ 的特征值全为正)
- 线性变换不变性:若 X∼N(μ,Σ),则 AX+b∼N(Aμ+b,AΣA⊤),其中 A 为任意 m×k 矩阵
- 边缘分布:任意子集维度构成的分布仍为正态分布
- 条件分布:给定部分维度的观测值,剩余维度的条件分布仍为正态分布
协方差矩阵结构解析:
Σ=σ12ρσ2σ1⋮ρσkσ1ρσ1σ2σ22⋮ρσkσ2⋯⋯⋱⋯ρσ1σkρσ2σk⋮σk2
- 对角线元素 σi2:第 i 个变量的方差
- 非对角线元素 ρσiσj:变量 i 和 j 的协方差(ρ 为相关系数)
特殊形式:
- 球对称分布:当协方差矩阵为 σ2I 时,各维度独立同分布
- 独立性条件:当 Σ 为对角矩阵时,各维度相互独立3,4
3.贝叶斯公式
要求p(y)>0
离散情况:
p(x∣y)=p(y)p(y∣x)p(x)=∑x′p(y∣x′)p(x′)p(y∣x)p(x)
连续情况:
p(x∣y)=p(y)p(y∣x)p(x)=∫p(y∣x′)p(x′)dxp(y∣x)p(x)
(x是机器人的状态,y是传感器数据)
另外p(y)是不会依赖于x的,所以经常使用
p(x∣y)∝p(y∣x)p(x)
得到“先验”和“似然”后通常会 需要乘以归一化因子。