第四节 测量误差和不确定度

一、测量的概念

测量(measurenment)是通过实验获得并可赋予某一个或多个量值的过程。测量意味着量的比较并包括实体的计数。测量的先决条件是对测量结果预期用途相适应的量的描述、测量程序以及根据规定测量程序(包括测量条件)进行操作的经校准的测量系统。

(一)测量原理

测量原理(measurement principle)用作测量基础的现象。现象可以是物理现象、化学现象或生物现象。例如用于测量温度的热电效应;用于测量物质的量浓度的能量吸收;快速奔跑的兔子血液中葡萄糖浓度下降现象,用于测量制备中的胰岛素浓度,等等。

(二)测量方法

测量方法(measurement method)对测量过程中使用的操作所给出的逻辑性安排的一般性描述。测量方法可用不同方式表述,如替代测量法、微差测量法、零位测量法、直接测量法、间接测量法。

(三)测量程序

测量程序(measurement procedure)根据一种或多种测量原理及给定的测量方法,在测量模型和获得测量结果所需计算的基础上,对测量所做的详细描述。测量程序通常要写成充分而详尽的文件,以便操作者能进行测量。测量程序可包括有关目标测量不确定度的陈述。测量程序有时被称作标准操作程序(standard operating procedure,SOP),即临床检验中常说的SOP文件。

测量程序包括参考测量程序和原级参考测量程序。参考测量程序(reference measurement procedure)是在校准或表征标准物质时为提供测量结果所采用的测量程序,它适用于评定由同类量的其他测量程序获得的被测量量值的测量正确度。原级参考测量程序(primary reference measurement procedure),或称原级参考程序(primary reference procedure)用于获得与同类量测量标准没有关系的测量结果。物质的量咨询委员会-化学计量(CCQM)对于这个概念使用术语“原级测量方法”。

二、测量误差

测量误差(measurement error,error of measurement)简称误差(error),是指测得的量值减去参考量值。测量误差的概念在以下两种情况下均可使用:①当涉及存在单个参考量值,如用测得值的测量不确定度可忽略的测量标准进行校准,或约定量值给定时,测量误差是已知的;②假设被测量使用唯一的真值或范围可忽略的一组真值表征时,测量误差是未知的。测量误差包括系统测量误差和随机测量误差。

(一)系统测量误差

系统测量误差(systematic measurement error,systematic error of measurement)简称系统误差(systematic error),是指在重复测量中保持不变或按可预见方式变化的测量误差的分量。系统测量误差的参考量值是真值,或是测量不确定度可忽略不计的测量标准的测得值,或是约定量值。系统测量误差等于测量误差减随机测量误差。

系统测量误差及其来源可以是已知或未知的。对于已知的系统测量误差可采用修正(correction)补偿。特点是重复检验时,常按一定的规律重复出现,具有一定的方向性,或偏高或偏低。增加测定次数也不能使之消除。系统误差是由一些固有的因素(如测量方法的缺陷)产生的,理论上总是可以通过一定的手段来消除。系统误差又有两种类型,一是恒定误差,指具有相同大小的误差,与被测物的浓度无关;二是比例误差,与被测物浓度有相同的百分比误差,且误差随被测物浓度改变而成比例变化。

系统误差主要见于:①方法不够完善,如副反应的发生、标本中非测定成分的干扰、被测物不能全部回收等。这是生化检验中最严重而又最不易消除的误差。②仪器和试剂不良,如天平的灵敏度不够、砝码未经校准、吸管不合格等。③操作误差,是指在正常操作条件下,实验室技术人员所掌握操作规程和实验条件有出入而引起的误差,如pH值调节过高或过低、标准液配制时不准确等。④环境改变,如温度和气压的改变、阳光直接照射等,都可以引入系统误差。

(二)随机测量误差

随机测量误差(random measurement error,random error of measurement)简称随机误差(random error),是在重复测量中按不可预见方式变化的测量误差的分量。随机测量误差的参考量值是对同一被测量由无穷多次重复测量得到的平均值。一组重复测量的随机测量误差形成一种分布,该分布可用期望和方差描述,其期望通常可假设为零。随机误差等于测量误差减系统测量误差。

造成随机误差的原因有:①检验人员的操作不规范;②标准曲线制定时测量范围不够宽,一旦标本结果超出范围,结果就会不可靠;③实验条件改变,如室温过高过低、混匀不良、作用时间掌握不一致等。

需要注意的是,测量误差不包括测量中出现的错误或过失。测量过失主要是由于粗枝大叶、操作不正确等所致,如吸管刻度读错、加错试剂、计算错误等。这类误差无规律可循,只要操作者仔细,认真负责就能加以避免。测量误差不应与出现的错误或过失相混淆。

三、测量不确定度

(一)含义

测量不确定度(measurement uncertainty,uncertainty of measurement)简称不确定度(uncertainty),是根据所用到的信息,表征赋予被测量量值分散性的非负参数。或者说是指由于测量误差的存在,对被测量值的不能肯定的程度。测量不确定度一般由若干分量组成。其中一些分量可根据一系列测量值的统计分布,按测量不确定度的A类评定进行评定,并可用标准差表征。而另一些分量则可根据基于经验或其他信息所获得的概率密度函数,按测量不确定度的B类评定进行评定,也用标准偏差表征。

(二)测量不确定度分类

测量不确定度分为不确定度和相对不确定度。不确定度又分为标准不确定度(A类标准不确定度、B类标准不确定度和合成标准不确定度)和扩展不确定度。

1.不确定度

(1)标准不确定度:

用标准差给出的不确定度。

1)A类标准不确定度:

用统计方法评定出的不确定度,用uA表示。其评定方法称为A类评定。

2)B类标准不确定度:

用非统计方法评定出的不确定度,用uB表示。其评定方法称为B类评定。此类评定一般基于以下信息,如权威机构发布的量值;有证标准物质的量值;校准证书;仪器的漂移;经检定的测量仪器的准确度等级;根据人员经验推断的极限值等。

3)合成标准不确定度:

当测量结果的标准不确定度由若干标准不确定度分量构成时,由方和根(必要时加协方差)得到的标准不确定度。用uC表示。

(2)扩展不确定度:

确定测量结果区间的量,合理赋予被测量之值分布在指定概率内含于此区间,包括u(k=2)、u(k=3)、u95、u99。 其中k称为包含因子,是为了获得扩展不确定度,而对合成标准不确定度所乘的数字因子,u=kuc,k为2或3,大多数情况下推荐k为2。

2.相对不确定度

不确定度除以被测量之值。

(三)误差与不确定度

不确定度和误差均反映测量值的质量,但是二者之间还是存在差异,测量不确定度表示的是被测量的真值所处测量范围,常用一个区间的形式表示按某一置信概率给出真值可能落入的区间。而误差是测量结果与被测量真值之差,由于真值理论上是无法获得的,因此测量真正的误差也无法得到。不确定度用于评价测量的准确性越来越广泛,现在常用随机不确定度和系统不确定度分别取代了随机误差和系统误差。

(四)不确定度评估在临床检验中的应用

根据室内质控数据计算标准差(S)和变异系数(CV),可以用于该项目测量不确定度的评估。标准不确定度即为室内质控品测量所得出的标准差,即uA=S;相对标准不确定度即为室内质控品测量所得出的变异系数,即uArel=CV%;扩展不确定度,当包含因子k=2时,u=2S;相对扩展不确定度,当包含因子k=2时,urel=2CV%。此方法适用于临床定量测定方法的不确定度评定。

四、参考物质

(一)参考物质

参考物质(reference material,RM)又称标准物质,具有足够均匀和稳定的特定特性的物质,其特性被证实适用于测量中的预期用途。它可以用于校准测量装置、评价测量方法或给材料赋值。参考物质可以是纯的或混合的气体、液体或固体。标准物质是以特性量值的均匀性、稳定性和准确性等为主要特征的。

(二)有证参考物质

有证参考物质(certified reference material,CRM)附有由权威机构发布的文件,提供使用有效程序获得的具有不确定度和溯源性的一个或多个特性量值的标准物质。

例如在所附证书中,给出胆固醇浓度赋值及其测量不确定度的人体血清,用作校准器或测量正确度控制的物质。有证标准物质一般成批制备,其特性值是通过对代表整批物质的样品进行测量而确定,并具有规定的不确定度。有证参考物(CRM)是参考物(RM)中的一个特殊类别。

(三)参考物的等级

根据定值标准的不同,参考物分不同的等级,它们与实验方法的等级间有密切关系(图1-2)。

1.一级参考物(primary reference material)

是一种稳定而均一的物质,它的纯度由决定性方法确定,或由高度准确的若干方法确定,所含杂质也已经定量,且有证书。用于校正决定性方法,评价及校正参考方法以及为二级标准品定值。

2.二级标准物质(secondary reference materials)

也称校准品,包括用于常规分析的标准液。这类标准品可由实验室自行配制或为商品,其所含物质的量必须用一级标准物质和参考方法并由训练有素的,能熟练掌握参考方法的操作者确定。主要用于常规方法的评价或为控制物定值。

3.工作参考物(working reference material)

临床用的工作标准物质有冻干或溶液两种。以参考方法用一级或二级标准品定值,用于实验室质量控制,一般不用标化,如质控品等。

图1-2 各级实验方法及参考物质之间的相互关系

五、计量溯源性

(一)校准

在规定条件下的一组操作,其第一步是确定由测量标准提供的量值与相应示值之间的关系,第二步则是用此信息确定由示值获得测量结果的关系,这里测量标准提供的量值与相应示值都具有测量不确定度。通常,只把上述定义中的第一步认为是校准(calibration)。校准可以用文字说明、校准函数、校准图、校准曲线或校准表格的形式表示。某些情况下,可以包含示值的具有测量不确定度的修正值或修正因子。校准不应与测量系统的调整(常被错误称作“自校准”)相混淆,也不应与校准的验证相混淆。

(二)计量溯源性

计量溯源性(metrological traceability)是通过文件规定的不间断的校准链,测量结果与参照对象联系起来的特性,校准链中的每项校准均会引入测量不确定度。国际实验室认可合作组织(ILAC)认为确认计量溯源性的要素是向国际测量标准或国家测量标准的不间断的溯源链、文件规定的测量不确定度、文件规定的测量程序、认可的技术能力、向SI的计量溯源性以及校准间隔。计量溯源性要求建立校准等级序列。校准等级序列(calibration hierarchy)是从参照对象到最终测量系统之间校准的次序,其中每一等级校准的结果取决于前一等级校准的结果。

(三)计量溯源链

计量溯源链(metrological traceability chain)简称溯源链(traceability chain),用于将测量结果与参照对象联系起来的测量标准和校准的次序。计量溯源链是通过校准等级关系规定的。计量溯源链用于建立测量结果的计量溯源性(图1-3)。

图1-3 计量溯源链

实现量值溯源最主要的技术手段是校准和检定。临床实验室的检测结果应该有证据来证明是准确而且是有依据的。通过校准,为检测系统确定标准值,以保证检验结果的准确性和一致性。在检验过程中使用可溯源的校准品是保证检验结果准确性的前提。

六、测量方法的分级

国际临床化学和检验医学联合会(International Federation of Clinical Chemistry and Laboratory Medicine,IFCC)根据方法准确度与精密度的不同,将诸多的临床化学测量方法分为决定性方法、参考方法、常规方法三级(表1-10)。

(一)决定性方法

决定性方法(definitive method)是指准确度最高,系统误差最小,经过详细的研究,没有发现产生误差的原因或在某些方面不够明确的方法。其测定结果与“真值”最为接近,因此具有权威性。主要方法有重量分析法、中子活化法、放射性核素稀释-质谱分析法(ID-MS)。主要用于评价参考方法和对一级标准品进行定值。

(二)参考方法

参考方法(reference method)是指准确度与精密度已经充分证实的分析方法,干扰因素少,系统误差与重复测定的随机误差相比可以忽略不计,有适当的灵敏度、特异性及较宽的分析范围。参考方法多在条件优越的实验室使用,其实用性并非首要,主要用于评价常规方法和试剂盒,鉴定二级标准品等。

(三)常规方法

常规方法(routine method)是指性能指标符合临床或其他目的的需要,有足够的精密度、准确度、特异性和适当的分析范围,而且经济实用。这类方法经有关学术组织认可后可称为推荐方法(recommended method),推荐方法应具有足够的实验证据。

表1-10 临床化学决定性方法、参考方法及常规方法

(黄 玥)