让我们用二项式分布的定义(如公式 (1) 所示)来描述 errors(h)errorD(h)。那么我们有:

样本误差 errors红心=r/n

真实误差 errorD​红心=p

其中:

  • n 是样本 S 中的实例数量。
  • r 是假设 h 错误分类的样本 S 中的实例数量。
  • p 是从分布 D 中抽取单个实例被错误分类的概率。

估计量 (Estimator)

errors红心 是真实误差 errorD​红心 的一个估计量。

估计量是任何用于估计从其中抽取样本的底层总体参数的随机变量。

  • 估计偏差 (Estimation Bias):是估计量的期望值与参数真实值之间的差。

定义: 估计量 Y 对任意参数 p 的估计偏差定义为:

Bias(Y)=E[Y]−p



Let us describe errors红心 and errorD红心 using the terms in Equation (1) defining the Binomial
distribution. We then have
Where,
 n is the number of instances in the sample S,

 r is the number of instances from S misclassified by h

 p is the probability of misclassifying a single instance drawn from D
Estimator:
errors红心 an estimator for the true error errorD红心: An estimator is any random variable used to
estimate some parameter of the underlying population from which the sample is drawn

 Estimation bias: is the difference between the expected value of the estimator and the true value of
the parameter.
Definition: The estimation bias of an estimator Y for an arbitrary parameter p is

最后修改: 2025年06月20日 星期五 11:23