作者简介

崔伟群,中国计量科学研究院计量科学数据与能源计量中心数字计量室主任,副研究员,主要研究方向为数字计量。在国内重要期刊发表论文50余篇,出版《数字计量学导论》等专著4部。



引言


人类的发展史是一部认识自然、改造自然的历史。在古代,人类通过观测春夏秋冬四季变化的数据掌握了农作物的生长规律,推动了第一次农业革命的诞生,生产方式由狩猎采摘向土地种植改变;18世纪,瓦特通过观察蒸汽的数据,发明了蒸汽机,引发了第一次科技革命;19世纪初,奥斯特通过观察发现了电流磁效应,安培研究相关数据,提出了电动力学这一理论,引发了第二次科技革命;20世纪后半期,通过对人类遗传物质的研究和数据积累,推动了克隆技术的发展,引发了第三次科技革命。


在这一过程中,人类通过持续改进技术手段,不断修正和补充对自然的认识。由于各民族、地域、宗教以及成长环境的差异,不同民族或个体对同一事物或现象会产生不同的认知和实践;或在不同阶段或条件下,同一个民族或个体对相同事物或现象会产生不同的认知和实践。为了尽可能统一这种认知上的差异,人类需要在一定程度上统一单位和量值的表述形式和规则。


基于这种统一的单位和量值表述,人类社会的每一次重大革命都对观测到的数据进行收集、分析和挖掘,从而形成当时人类对自然世界的认识,同时也支撑了人类思维大厦的构建。我国古人通过对河图、洛书中数字的分析,发展了以1到10为万物根基的自然和社会哲学;古希腊的毕达哥拉斯通过对1到10的研究,提出了“万物皆可数”的观点,这些人类思维大厦的构建,对人类组织社会、改造社会具有深远的意义。


数字计量的兴起


从传统计量的角度来看,数据可以分为量化数据和非量化数据两类。量化数据最核心的概念是“量”,在JJF1001-2011《通用计量术语及定义》中将其定义为“现象、物体或物质的特性,其大小可用一个数和一个参照对象表示”,其内在的哲学是主观赋予客观的,依据规则对客观进行度量的一种主观概念。一旦这种概念被承认,这一概念就与客观相统一,但是也只在下定义的时刻相统一。主要原因在于实物参照对象随时空变化的特性,使得参照对象自身也会发生变化。当这种变化超出一定范围之后,量的定义就不再能够支撑后续的科学研究。换言之,当前数据的准确性与历史数据的准确性发生巨大偏差,而这种偏差的存在,必然影响人类对世界的认识结论,有时甚至导致经济、政治或军事上的损失。


从计量技术角度讲,上述问题存在三种修正方法。一种是不断修补定义,使得定义具有物理可实现性。例如,“安培”在1946年国际计量委员会上被批准定义为“真空中相距1米的两根无限长且圆截面可忽略的平行直导线内通过一恒定电流,当两导线每米长度之间产生的力等于2×10-7牛顿时,则规定导线中通过的电流为1安培”,显然这个定义是物理不可实现的,人类无法找到无限长的导线。于是在2018年11月16日,国际计量大会通过决议,1安培定义为“1s内通过导体某一横截面的1/1.602176634×1019个电荷移动所产生的电流强度”,新定义比老定义具有更强的可实现性;第二种是不断提升设备的性能,用准确度高的设备代替准确度低的设备。但是这种提升具有很大的现实局限性,具体体现在成本和设备性能的客观有限性上;第三种是发现新的原理和方法。数字计量就是在这一背景下诞生的新领域。


数字计量


实现单位统一、量值准确可靠是数字计量的目标,其核心是对数据和算法的计量,是对信息技术中二进制数字的形式、内容、结构、语义、二进制数字对主观或客观世界的反映——数据和算法,以及承载二进制的物理设备、系统性能中计量问题的研究。包括两个方面:一方面为计量数字化,是传统计量采用信息化手段实现网络化、自动化、远程化的计量工作,包括计量电子证书和数字证书、测量不确定度在线云评定、远程计量和在线计量、计量数字化图谱、计量软件测评、智慧计量机器人、人工智能计量师、计量数据可视化等15个领域;另一方面为数字的计量化,是数字世界中引出的计量工作,包括算法溯源、数字图像、音频和视频计量、网络点击量和转发量计量、数字资产等15个领域。


1.数据采集阶段存在的数字计量问题


数据是数字计量的基础,在数据采集中,采集到的事实或统计内容与客体本身会有较大的差异,这种差异体现在定义的缺陷上和采集的有限性上。例如关于长度的定义是建立在抽象概念点之上,然而抽象的点在现实生活中并不存在,因而在现实中也就无法测量抽象的点之间的距离。同样由于采集设备的物理有限性,一般不能无限采集在空间和时间上有延绵特性的客体或现象,常常采用离散的方式采集,这就必须遵循奈奎斯特采样定律,使获得的数据在一定程度上能够满足质量要求。


人工采集的数据一般以非量化数据为主,例如人口信息统计、选举投票、各类调查问卷、主观评价等。这类采集数据质量往往与样本、人员水平、人员态度、方式紧密相关。为了获得良好的数据,一般人工采集方案采用专业和数理的方法进行评估。但是由于各专业的局限性,对于数据采集目的最终实现,应引入计量基标准建立的技术方法开展,比如采用测量不确定度的评定方法对方案本身进行定量评估。


设备采集相对于人工采集而言,数据质量相对较高。但是就同一设备而言,存在随着时空改变而导致采集质量下降的情况,例如电能表在使用一段时间后就需要更换,或是在运行一段时间后才能达到精准;同时也存在不同设备在同一时空下采集质量不同的情况。设备一般分为三类:第一类设备为非量化数据采集设备,例如家用照相机、摄像机或者录音机等;第二类设备为非计量类量化数据采集设备,例如家用体重秤;第三类设备为计量设备,例如电能表、水表、燃气表等。


在这三类中,计量设备采集的数据质量最高,这是因为计量设备依据法律法规进行周期性检定/校准,从而较为有效地保证了计量设备的稳定性、可靠性和量值的溯源性;在第二类中,设备采集的数据质量较计量设备略差,这是因为这类设备所采集的数据只具有参考性意义,一般不宜用于科学研究;在第一类中,设备采集的数据主要用于定性判断。随着对数据质量要求的不断提升,第二类和第一类设备数据采用数字计量理论进行全方位研究成为计量学研究的重要内容。


2.数据计算存在的数字计量问题


数据的计算分为两个阶段:数据采集时的计算和数据采集后的计算。


当数据采集时,一般是从连续的无限中提取有限可表示信息,这就会导致数据的损失。数据采样频率越高和数据表示的准确度越高,对客体或现象的刻画就越精准,通常用采样率、字长和测量不确定度来表述。为了获得较高的数据质量,一般都采用预处理的方式进行,比如在电子计价秤中为了获得稳定的零点数据,采用了去噪、零点漂移的算法进行补偿。由于这类算法对数据采集有很大影响,应该在投入使用前进行计量。


在数据采集后,需要进行分析,计算机内所使用的加减乘除都是有限字长,因此还会带来数据上的损失,如两个变量的除法运算,当分母为0时,计算机会报错。为了避免这一问题,程序员往往会加一个自定义的微小量,在计算结果中引入不确定度。因此这类算法对数据分析有很大影响,也应该在投入前进行计量。


随着深度学习等人工智能技术的发展,科学家和应用工程师采用各种算法从大数据中提取有用结论,但是算法结论的科学性、准确性和可靠性却需要采用技术手段进行评估,为此,需要开展算法溯源的数字计量研究。



数字计量中的算法溯源技术


随着信息技术的深入发展,我国软件产业发展迅猛,不仅在产值上超过了传统产业规模,也为国民经济发展和产品质量提升提供了必要的技术支撑。尤其是近几年,随着人工智能技术的发展,由软件控制的计量器具的占比已经迅速超越95%,与信息技术紧密结合的新型设备不断涌现,推动着科学技术不断创新。


作为人类思维的拓展,软件具有低成本、智能化、功能复杂和易替代等优点,但从计量角度而言,也存在着欺骗性使用、Bug不易发现、算法的正确性以及稳定性较差、法律法规依从性较差等问题。因此随着对计量器具软件产品质量要求的不断提高和软件工程技术的发展,软件测评成为计量器具软件生产和使用中的重要环节。


根据JJF1182-2018《计量器具软件测评指南》,在计量器具软件的计量特性功能测评中,是利用测试用例,将被验证算法的计算结果与可供参考的期望值进行比较,通过判断是否在最大允许误差范围内,给出算法是否正确的验证结果。从计量上讲,该验证方法属于定性判断,很少涉及定量,即使涉及定量,也没有对量值进行溯源,不能完全满足计量保障量值准确可靠的要求。


为了解决这一问题,需要以算法对应的软件为被测对象,软件的输出量为被测量,测量不确定度评定为评价手段,提出一种将算法软件输出量溯源至现有计量基标准、标准参考数据或算法标准的算法溯源的方法,从而基于计量技术对算法软件输出量的准确可靠性进行精准刻画。


算法溯源是通过一条具有规定不确定度的不间断的比较链,使算法软件的输出量能够与规定的参考标准(计量基标准、标准参考数据或算法标准)联系起来。


算法溯源中的被测对象为基于算法形成的软件,包括计量数字化过程中计量器具检定/校准中所涉及的一些算法软件和未来数字计量化过程中有溯源需求的算法软件。


算法溯源中的被测量为算法软件的输出量,该输出量一般分为三类,分别为:计量量值(如手机测距软件中的长度、数字指示秤软件中的质量、化学分析软件中的浓度等);基于计量量值的定性判断(如基于深度学习算法判断临床质控数据是否合格等);未来数字计量化过程中将纳入计量范畴的输出量(如人脸识别算法的输出量、行人重识别算法的输出量)。上述的输出量,可以溯源至计量基标准或由计量标准形成的标准参考数据或基于上述标准参考数据模型生成的理论标准参考数据或算法标准。


在算法溯源中,相同的算法可能对应不同的软件;相同的输出量可能由不同的算法实现,因此会对算法软件的输出量的准确性和可靠性有影响。例如,在多点平均中,采用3点平均、5点平均、100点平均是属于3种不同的算法,显然这3种算法的准确性和可靠性是不相同的。


基于上述软件特有的原因,需要引入测量不确定度评定方法,对算法软件输出量的量值进行测量不确定度评定。


数字计量展望


在经济全球化的国际大背景下,数字计量已成为全球计量领域研究的热点。2018年,国际计量委员会(CIPM)制定了2030+战略并成立Digital-SI任务组,把计量数字化转型作为重点任务进行全球研究与合作;BIPM/CIPM-OIML/CIML联合任务组一致认为要与质量基础设施领域的所有利益相关方密切合作,积极开展工业计量、法制计量和科学计量活动和流程的数字化转型工作,使用数字化国际单位制和FAIR数据准则来促进全球计量数字化转型进程;欧洲计量合作组织(EURAMENT)和美洲计量组织(SIM)分别成立了M4D和M4DT计量数字化转型工作组,致力于实验室流程自动化、计量云和数字校准证书(DCC)的研究。目前,德国联邦物理技术研究院(PTB)和英国国家物理实验室(NPL)已经开发了DCC,正在收集有关校准的标准化元数据和数据。美国国家标准与技术研究院(NIST)正在着手NIST计量云的开发。


2021年3月,《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》提出“加快数字化发展、建设数字中国”的目标;2021年12月,国务院发布的《“十四五”数字经济发展规划》提出“形成统一公平、竞争有序、成熟完备的数字经济现代市场体系”的目标;2022年1月,市场监管总局联合各部门共同研究制定的《关于加强国家现代先进测量体系建设的指导意见》提出“到2035年,测量对我国经济社会高质量发展的贡献水平显著提高”的目标,都为我国数字计量发展指明方向。


无论国内还是国外,在贸易、零售、医疗、教育、交通、金融和政务等多个领域中,生产、消费和管理等方面必将基于数字深度融合。由智能设备或大数据、物联网、区块链、人工智能、数字孪生等技术生成的大量信息丰富的数据和算法,将成为驱动经济增长的关键生产要素,用于经济社会众多领域的洞见、分析、决策和行动。这些生产要素使用的同时,也面临着诸如数字鸿沟、数字安全、数据产权、算法正确性、算法共谋等方面涉及的计量法律法规滞后的挑战,包括计量术语不清晰、计量技术规范缺失、数据可信度较低,算法正确性和结果的客观公正性无法保证等问题。因此,为了解决新一代信息技术变革而催生的新型计量问题,保障数字经济时代测量的准确性、一致性和可信度,支持我国在数字时代建设数字中国、提升数字质量,保障数字经济的健康发展,大力开展数字计量研究具有重要的意义。


作者:中国计量科学研究院 崔伟群

文章来源网络,由中测校准平台总结发布,供业内读者参考交流,如有侵权,请联系删除