首页 - 焦点新闻 - 正文

师之灼见 | 巫景飞、倪中新:什么是开放公共卫生数据的正确姿势?

创建时间:  2020/02/19  叶琼贤   浏览次数:   

本文目录

一、问题提出

二、研究方法与局限

三、关于中美疾控中心的介绍

四、两个机构网站所展示的数据资源与能力比较

1、数据资源丰富度

2、数据质量

3、数据管理能力

五、结论与建议


一、问题提出

2020年年初,一场突如其来的疫情从武汉席卷全国。引起这场疫情的新型冠状病毒(2019-nCoV)是一种以前从未在人类中发现的冠状病毒,从目前看传染性极强。截至2月17日15时,现有确诊病例70639例,累计死亡1772例,累计治愈出院11039例,现有疑似病例7264例。全球其他国家和地区也有695病例出现。确诊病例大大超过2003年非典,虽说从死亡率来看较低,但是疫情所带来的社会恐慌巨大,可以说已经引发了一场全国性的公共卫生危机。


危机当前,如何应对?不同领域的专家有不同的视角。我们不懂医学,不懂病毒,但作为常年从事数据分析、对数据产品有设计经验、数据产业有投资经验的实践者,我们打算从数据的角度来看看,为什么说面对这次疫情,有些政府部门其实可以做的更好。


对于随时可能到来的危机,西方有句俗话:Prepare, don’t predict。意思是说我们无法预测危机何时到来,但是我们应该提前做好应对准备。应对就要有投入,以此形成一定的资源和能力。在当今这样一个大数据与AI时代,人人几乎都理解数据的价值,我们相信,没有人会反对政府有关部门形成必要的数据能力以更好地应对公共卫生事件。那么作为国家公共卫生服务尤其是传染病防控的核心部门——中国疾病控制中心是否具备必要的数据资源、能力?相对其他发达国家(如美国)水准如何?为了更好应对疫情危机,哪些方面可以借鉴、优化提升?这是撰写本篇文章的根本目的。


二、研究方法与局限

开始之前,首先说明下研究方法与局限。我们以中美两国疾病控制中心(CDC)的公开网站为研究对象,通过直接体验,站在用户(User)的视角去评价分析两家机构所具备的数据资源和能力。之所以这么做,首先,因为两国疾控中心的功能定位几乎是一样的,这就避免了因为功能定位的差异导致对数据资源和能力需求的差异,使得二者之间有可比性。其次,疾控中心承担的是公共卫生服务职责,虽然两国法律体制不同,但是都具有开放数据之职责(虽然开放数据的范围、权限有所不同),这一点使得我们能看到并使用相应的数据资源,这使得我们的研究方法——实地体验(类似田野研究法,Field Study)成为可能。


显然,这种“解剖麻雀”的个案分析方法是有局限的。


一来,个案不具有代表性。对此,我们没有奢望一个案例具有普遍性,仅仅希望就事论事。目前很多人根本没了解实际情况,大而化之谈疫情应对方案,其实不仅这些意见绝大部分没有可操作性,甚至部分建议会引起误解还会带来负面影响。无证据,不说话。


二来,因为只是通过公开网站的信息,看到的未必是全部和真实的。完全存在一种可能,很多数据资源和能力并没有从网站展示出来。对此,我们完全认可。本研究仅站在一个普通的公共卫生数据需求者角度来判断感知研究对象的资源与能力,而绝非真实能力评估。如果研究对象有资源有能力,且应该展示而未展示,那恰恰说明了它们对公众社会数据开放度不足,这就是未来可以改进的工作方向。


三、关于中美疾控中心

让我们先了解下中国疾病控制中心和美国疾病控制中心。


— 中国疾病预防控制中心 —


中国疾病预防控制中心(简称中国疾控中心,英文Chinese Center for Disease Control and Prevention,缩写CCDC)是由政府举办的实施国家级疾病预防控制与公共卫生技术管理和服务的公益事业单位。


1983年12月23日,卫生部报请国务院批准,成立中国预防医学中心。1986年1月19日,中国预防医学中心更名为中国预防医学科学院。2002年1月23日,在中国预防医学科学院、卫生部工业卫生实验所、中国健康教育研究所、中国农村改水技术中心的基础上,组建成立中国疾病预防控制中心。


中国疾控中心是根据《中央编办关于国家卫生健康委所属事业单位机构编制的批复》(中央编办复字〔2018〕90号),为国家卫生健康委直属事业单位。


中国疾病预防控制中心组织机构包括中心机关、中心直属单位、挂靠单位和相关协会,其中中心直属单位包括传染病预防控制所、病毒病预防控制所、寄生虫病预防控制所、性病艾滋病预防控制中心、慢性非传染性疾病预防控制中心、营养与健康所、环境与健康相关产品安全所、职业卫生与中毒控制所、辐射防护与核安全医学所、农村改水技术指导中心和妇幼保健中心。


中国疾控中心以“一流的疾控依赖一流的科研,一流的科研推动一流的疾控。”为工作目标,努力推动科学研究与疾控工作协同发展。2002 年成立以来,共获准科研课题近千项,年度获准课题数从60 余项增加到156 多项,共获科研经费28.58 亿元。获得各类奖项168 项,其中,国家科技奖 4 项,省部级奖164 项。共发表论文 14892 篇,其中中文11502 篇,英文文章3390 篇。目前,中国疾控中心有国家重点实验室 1个,国家卫生计生委重点实验室 3 个,中心重点实验室 3 个。


中国疾控中心的主要工作职责如下:


1.开展疾病预防控制、突发公共卫生事件应急、环境与职业健康、营养健康、老龄健康、妇幼健康、放射卫生和学校卫生等工作,为国家制定公共卫生法律法规、政策、规划、项目等提供技术支撑和咨询建议。


2.组织制定国家公共卫生技术方案和指南,承担公共卫生相关卫生标准综合管理工作;承担实验室生物安全指导和爱国卫生运动技术支撑工作;承担《烟草控制框架公约》履约技术支撑工作;开展健康教育、健康科普和健康促进工作。


3.开展传染病、慢性病、职业病、地方病、突发公共卫生事件和疑似预防接种异常反应监测及国民健康状况监测与评价,开展重大公共卫生问题的调查与危害风险评估;研究制定重大公共卫生问题的干预措施和国家免疫规划并组织实施。承担疾控信息系统建设、管理及大数据应用服务技术支持。


4.参与国家公共卫生应急准备和应对,组织制定食品安全事故流行病学调查和卫生处理相关技术规范。指导地方突发公共卫生事件调查、处置和应急能力建设以及食品安全事故流行病学调查。承担新涉水产品、新消毒产品的技术评审工作。


5.开展疾病预防控制、突发公共卫生事件应急、公众健康关键科学研究和技术开发,推广疾病预防控制新理论、新技术、新方法,推进公共卫生科技创新发展。


6.开展公共卫生专业领域的研究生教育、继续教育和相关专业技术培训。


7.指导地方实施国家疾病预防控制规划和项目,开展对地方疾病预防控制机构的业务指导,参与专业技术考核和评价相关工作。


8.开展全球公共卫生活动和公共卫生领域的国际交流与合作,执行有关国际援助任务。


9.承办国家卫生健康委交办的其他事项。


— 美国疾病控制与预防中心 —


美国疾病控制与预防中心(Center for Disease Control and Prevention, CDC)是美国卫生及公共服务部所属的一个政府机构。


1946年7月1日,美国公共卫生部(U.S. Public Health Service)约瑟夫·孟汀在佐治亚州亚特兰大正式成立美国传染病中心(Communicable Disease Center,简称CDC)。1951年,传播疾病中心建立了流行病信息服务部(Epidemic Intelligence Service,简称EIS)机构更名为美国疾病控制中心(U.S. Disease Control Centers)。2000年,CDC已有11个中心和办公室,包括国家传染病中心(National Center for Infectious Diseases,简称NCID)。目前,美国CDC的工作人员已达8000多人。


美国疾病预防与控制中心是美国联邦政府机构,隶属于美国卫生和人类服务部,是美国疾病预防控制体系的主干。美国CDC的高层组织机构包括主任办公室、全国职业安全和健康研究所以及六个协调中心(办公室),分别是环境卫生和伤害预防协调中心、卫生信息服务协调中心、健康促进协调中心、传染病协调中心、全球健康协调办公室、恐怖主义防备和应急协调办公室。


美国疾病控制及预防中心使命是“预防及控制疾病、损伤及残障,促进健康及提高生活质素”。预防及控制传染病仍是该中心的主要工作。CDC的职责自从其创始以来就不曾改变。它最早的职责只是研究对美国某个地区的一种单一疾病的控制方法,渐渐地,其管辖范围不断扩大,除传染性疾病以外,还负责很多慢性病、职业性身体失调及诸如暴力和事故等社会疾病。


美国疾病控制预防中心主要工作职责如下:

1.发现和应对新出现的健康威胁

2.解决使美国人死亡和残疾的最大健康问题

3.运用科学技术和先进技术预防疾病

4.促进健康和安全的行为,社区和环境

5.培养领导者并培训公共卫生人员,包括疾病侦探

6.把握美国健康脉搏


四、两个机构网站所展示的数据资源和能力比较

本研究借鉴心理学评价中心(Assessment Center)技术,由经统一培训后的多名专家,根据同一个评价量表和评价标准,来对被测进行深度评价,并依据某种算法,最终形成集体评价意见。该方法尽最大可能避免个人主观评价偏差,形成科学评价意见。本研究的具体技术路线如下:


首先,我们经过与多位熟悉数据技术和分析的专家反复讨论形成如何评价一个机构的数据资源和能力的评价量表,然后由团队4位成员内部交流后,对各项标准达成基本共识;其次,团队成员深度体验(每个网站累计不少于3个小时)两家机构(含公共卫生数据服务中心和Wonder)的网站。在此之前,我们特别说明需要对自己的“观点”要注重留有证据,如网站上哪些功能说明了哪些能力,为什么?再次,我们集中讨论,大家分别表达观点和展示各自的证据;最后,4位团队成员再独立给出自己的评价,汇总各位评价后形成最终结论。最终的评价结果如下表1

表1 中美疾控中心数据资源与能力对比

资料来源:公开资料,自行评价


具体展开论述如下。

1、数据资源丰富度比较

数据资源丰富是指可否在线找到类别丰富、样本量大、覆盖时间长的数据资源。中国疾控中心及公共数据服务平台的数据资源远低于美国。原因很简单,中国疾控中心自己的官网几乎没有数据资源,尤其是研究者喜欢的结构化的数据(集)。


中国疾控中心官网设置了机构信息、健康主题、科学研究、教育培训和党群工作五个栏目,由此开展传染病、慢性病、职业病、地方病、突发公共卫生事件和疑似预防接种异常反应监测及国民健康状况监测与评价。但并没专门的栏目对应数据或统计栏目。唯一与数据相关的就是,首页有统计数据、信息服务两个入口,前者是链接到其他部委网站,后者则可链接到公共卫生数据服务平台(http://www.phsciencedata.cn/)。(参看下图1)

图1 中国CDC与公共卫生数据服务平台主页


而美国疾控中心在首页栏目More(更多)分类下子栏目Data & Statistics(https://data.cdc.gov/)中可以发现大量的数据资源,通过Data Catalog栏目进入后可以看到一个数据搜索引擎,其中包含了主题为行政、生物监测、流感预防、儿童预防等22类,包括数据集、文件、图表等10种格式类型合计862个数据资源(参看下图)。

图2 美国疾控中心数据入口

表2 美国疾控中心网站数据资源明细


再来看两家疾控中心下属数据平台的数据资源的比较。美国也是相对更有优势。


中国公共卫生科学数据中心是中华人民共和国科技部于 2004 年启动的国家科学数据共享工程项目,全称为中国公共卫生科学数据管理与共享服务中心,由中国疾病预防控制中心承担。


图3 中国公共卫生科学数据中心


美国CDC也有一个数据服务平台,叫CDC WONDER(http://wonder.cdc.gov/)。全称为Wide-ranging ONline Data for Epidemiologic Research。它是CDC的综合数据库,提供利用CDC各下属机构各种报告和公共卫生数据的链接点,内容丰富,涵盖大量有价值的信息与文件。覆盖了CDC网站数据与统计信息服务的全部内容,通过该系统,用户可检索发病率死亡率周报(MMWR)及包括科研数据、调查监督数据、卫生统计数据和实验室信息等各类公共卫生数据。

图4 美国Wonder数据库主页


表3  中美国公共卫生数据平台资源明细对比


具体而言,美国CDC Wonder数据中心目录页共设三种分类模式,分别是Systems、topics和A–Z index。其中Systems分类下设环境、死亡、人口等较宏观因素详细分类,同时包含NNDSS年度表、NNDSS每周表及122个城市的每周死亡率(存档)等统计分析更新数据的快读入口,大幅提升大数据分析统计便捷程度。


Topics分类下,按照慢性病、传染病、环境卫生、健康实践与预防、预防伤害、国家监控数据、职业健康及相关参考资料链接进行详细划分。下设各类疾病的详细信息与各类疾病的统计分析,将疾病与季节、气温、雨水、环境等细节因素进行关联分析。


A–Z index分类按照首字母A–Z的顺序对所有子项目进行排序分类,子项目十分全面详细,包括前两种分类模式下所有链接,且数据来源不仅限于CDC,还包括美国国家安全局、国家健康科学中心、国家知识产权中心等外部网站。并对数据来源进行标注展示,信息可溯源,真实性具有极高保障。


从类别与数量上美国CDC Wonder肯定高于中国,但是最重要的问题是,我国公共卫生数据服务平台对于数据的理解仅仅局限在“数据指标”,检索出来的数据常常就是某个加总计算后的数据指标(Indictor),而非研究者常常使用的数据集(Datasets)。数据集通常是指包含了大量样本信息的数据集合,而指标仅仅是这个数据集的一个特征变量。由数据集可以算出各类指标,反过来则不可能。


以肺结核数据为例(参看下图),美国CDC关键词搜索“肺结核”有23条搜索结果,最新的数据集更新日期为2020年2月7日,详细给出每周各个地区肺结核发病情况,包括经纬度等信息,支持以csv、json、XML等多种形式一键下载,同时也支持API接口调用、在线可视化制作等功能。对比我国数据服务平台,最新数据更新时间为2017年,频率为月频,需要提交申请材料经过人工审核通过才可获取数据。

图5 中美CDC关键词“肺结核”搜索结果对比


此外、CDC Wonder数据大多数每年更新一次;有些数据(文件)每月或每周更新一次。我国公共卫生数据服务平台的数据绝大部分截至2016年左右,感觉几乎没有更新。


或许正因为这些原因,我国公共卫生数据服务平台数据下载量几乎全部为零,这与美国也形成了鲜明的对比。

图6 中美数据平台浏览与下载量对比


2、数据质量比较


数据质量主要是指数据能否很容易理解并满足使用的标准。我们发现中国疾控中心的数据颗粒度很粗,实时性也较差,很难用于深入研究。而且很多数据指标也缺乏清晰的说明,让用户很难理解数据内涵,不敢使用。


以最常见的肺结核数据为例。美国CDC的肺结核数据是美国各州周频更新的肺结核数据,包括患病数、经纬度等信息;中国数据平台主要是月频和年频、以地区分类加总的数据。

图7 中美肺结核数据颗粒度对比


美国CDC最新更新日期为2020年2月7日,中国数据平台肺结核数据最新截止日期为2017年12月。美国以周频更新,中国以月频更新,更新不及时,近三年几乎没有数据更新。

图8 中美肺结核数据更新截止日期对比

图9 美国CDC指标说明


3.数据管理能力比较

数据管理能力是一套综合能力体系,至少包括数据采集清洗、加工分析、开放检索、可视化等维度。我们认为,美国疾控中心在各项能力维度上都大幅超过中国疾控中心。


美国CDC数据细化到周频更新,详细披露发病人数、发病经纬度等信息,可以满足不同人群的使用需求;资料库和Wonder数据库共计有超过千条的资料和数据集,覆盖行政、环境、预防、疾病等各个方面,大部分更新频率达到周频,细化到经纬度等信息,数据发现问题会及时更新;建立了较完善的国家应报疾病监测系统(NNDSS),完善数据采集上报、收集、检查、发布、更新等全流程,实现了疾病数据的高效收集、快速披露的机制,有较强的数据质量管理能力和管理经验。


中国数据主要以年频和月频更新,缺少近三年数据,只披露发病数、死亡率、发病率等指标,使用场景受限;仅一两百个数据集,缺少近三年数据,缺少原始数据,未见更新说明;数据质量管理仍处于初级阶段,数据更新慢,发布不及时,缺少检查更新机制,数据质量管理能力薄弱。


美国CDC和Wonder数据库都有搜索引擎,数据提供指标字段解释,搜索结果导向一致,不存在不同页面搜索框搜索同样关键词出现结果矛盾的现象;CDC和Wonder提供数据所属类别、数据元素类型(图、表、数据表)、标签等分类方式,也可以按照首字母索引检索,反馈结果可以根据最新更新日期、最多下载人数等进行排序,能最快检索到所需信息;中国数据平台无数据字段解释,不同地方搜索相同关键词会导向不同结果;数据平台分类标签分散,没有统一管理,各个分类标签导向不同,没有提供排序检索功能,无法快速找到所需信息。


美国CDC有一整套免费的可视化插件,支持扇形图、趋势图、柱状图、散点图、地图等自由绘制,同时数据和可视化报告均可快速导出;中国仅新冠肺炎提供了一个固定模板的可视化展示,无法自由对数据进行操作,完成可视化作品的自主创建。


图10 中美CDC数据可视化对比


美国CDC数据支持CSV、XML、JSON等多种格式导出,支持API接口调用批量导出;中国疾病数据需要提交申请经过人工审核通过后下载,主要是CSV文件。关于数据安全未做专业评测,美国CDC可以解析网页直接获取数据,由于提供APIi接口所以爬虫的意义不大,中国数据需要经过人工申请,爬虫获取的资料有限。


关于数据分析能力,美国CDC首页搜索“肺结核”的反馈结果中,第一条会跳转到一个子栏目,详细讨论了该疾病的基本情况、护理措施、病理检验、学术研究、分布情况等问题,在大量数据分析、实验科学基础上提供专业建议,解决实际问题。

图11 美国CDC搜索肺结核相关信息


中国CDC关键词所搜“肺结核”主要是会议纪要,中国数据服务平台所搜“肺结核”主要是17年及以前的数据集。

图12 中国疾控中心搜索肺结核相关信息


综合上述,我们认为,美国疾控中心和其数据中心所拥有的数据资源丰富而且质量较高。它能够站在用户的角度开展数据架构设计,同时数据满足不同目标人群需求,有较强的数据普适性,符合公共数据的基本要求;元数据管理和数据目录等基础工作扎实,能够为用户检索数据提供强大支持;数据开放度高,提供给客户多种方式查询、下载数据的方式;数据集有对应的人员管理负责,能够及时更新数据;有专业技术团队保证了网站功能的更新迭代。整体页面布局美观、功能强大,具有较强的专业水平。综合评价为4星。


相对而言,中国疾控中心和其数据中心则在线数据资源较少,质量较差。很多数据需要人工申请,系统对用户不友好,开放度不足;缺乏元数据管理,数据资源混乱;没有质量保证的体系;不提供可视化和分析工具;未见有技术团队对数据和网站及时更新迭代。整体页面布局不够美观、功能较弱,布局不合理,专业水平较差。综合评价为1星。



五、结论与建议

通过深度体验公开网站,我们发现中国疾控中心相比美国疾控中心,无论在数据资源或是数据能力方面都存在较大的差距。至于原因,限于条件,我们暂时无法深入分析。初步推断如下:


首先,我国疾控中心运行时间短,经验能力不足。可以看出中国疾控中心尤其是公共数据服务中心成立时间都很短,重点在科研、教学和疾控上,对数据需求的理解不够深入,管理、开放公共卫生数据的经验不足。


其次,我国疾控中心经费投入不足。美国疾控中心连续3年的预算经费为70亿美金左右,员工共有8000多人。我们从中国疾控中心网站上可以看到截至2016年底,中心共有正式在编职工2120人,其中专业技术人员1876人(占89%),管理人员133人(占6%)。(http://www.chinacdc.cn/jgxx/zzjgt/zxzncs/200505/t20050528_8244.html)。相关经费无法查到,但是可以推测与美国相比还是有巨大差距的。中国人口远比美国多,千万级城市数量也远超美国,公共卫生问题尤其显得重要,经费不足势必会影响与数据相关的工作投入。


最后,体制机制差异,两者之间的地位和影响力不同。美国CDC是政府部门,而且各地分支机构垂直管理。但中国疾控中心作为国家卫健委下属的事业单位,能否统筹调动相关部门和地方疾控中心值得怀疑。如果缺乏这种能力,自然很难实现跨部门数据的融合和汇集。


当然这些只是推测,不是本次研究重点。我们更加关心的是,如何通过与美国CDC和Wonder数据中心的对标比较,来帮助国家疾控中心和公共卫生事件服务中心更好的开展公共卫生数据的开放共享工作。对此,基于上述比较分析,我们有如下建议:


1、广泛而认真调查公共卫生数据使用者的需求,搞好数据架构的顶层设计。数据并非客观而是人造的,是人类根据应用场景按照一定规则创设的对客观世界的描述与刻画。数据的采集、存储、分析、展现完全受制于数据架构的顶层设计,如果采集和分析的数据本身都是垃圾数据,就会存在Garbage in,Garbage out的情况,那么看上去豪华的大数据系统其实价值并不高,会带来巨大的资源浪费。


我们认为,作为一家公共卫生服务机构,中国CDC要高度重视各类“客户”需求,在开展任何数据采集前都需要更广泛征集公众需求、专家意见,在此基础上搞好数据架构的顶层设计,并定期接受社会反馈,动态优化。只有这样大数据才不会成为大垃圾,才能真正为社会创造价值。


2、认真梳理现有数据资源,重构元数据(Meta Data)和数据目录(Data Catalog),提升数据资源的掌控和盘查能力,推动数据资源向数据资产的转换。随着信息技术的应用,任何一家机构内部所积累数据资源将逐渐增大。但是如何能让花费巨额成本的数据资源成为创造价值的数据资产就需要对现有数据资源进行科学分类、人性贴标签,并建立关于数据的数据——元数据,进而形成能够方便用户快速、便捷检索的数据目录。这一点是对数据资源进行管理的重要基础。


从之前的分析可以看出,与美国CDC相比,中国疾控中心的数据检索系统非常不方便,各个数据库之间彼此割裂,元数据管理粗糙,不仅无法让用户快速理解现有数据资源的如颗粒度、指标内涵、时间范围、使用权限等相关信息,也对自己内部开展数据管理带来不便。我们建议,中国疾控中心应向美国疾控中心学习,尽快认真梳理现有数据资源,按照统一的技术规范,重构元数据和数据目录,提升数据资源的掌控和盘查能力,并向社会全面


公开数据目录。从一定程度上,让社会知道疾控中心有什么数据资源,比让社会知道某些具体数据是多少还要重要,这样可以更好吸引社会力量共同参与科研,充分发挥公共卫生数据的价值。


3、加强内部数据资产管理系统(DMS)的建设,提升数据更新频率,保证数据及时性。随着大数据AI技术的不断提升,数据实时采集、传输和分析能力不断增强,但是从目前公共卫生数据中心网站上可以查到的数据大部分是2016年以前的,数据更新频率很低,及时性差。从公开信息可以看到,我国已于2017年就建成全球最大的传染病疫情和突发公共卫生事件网络直报系统,突发公共卫生事件信息平均报告时间从原来的5天缩短到4小时内,并具备了在72小时内检测300余种病原体的能力。据此我们推测,专项目的的数据采集与分析能力中国疾控中心应该已经具备,但是如何将来自多个数据源的数据校验、融合、关联、入库这就需要专业的数据资产管理系统来发挥作用。我们建议,中国疾控中心及公共卫生数据服务中心可以借鉴互联网科技公司内部数据管理体系和技术框架,尽快打造智能化的数据资产管理系统(DMS)的建设,提升数据处理效率,提高数据更新频率,保证数据及时性。


4、组建跨专业的团队,适度借助外部力量,持续积累数据资源与管理能力。数据工作看上去是技术部门的事情,但实际上需要业务人员的深度参与,也需要来自数据科学家、产品经理等多种复合人才的共同努力。从美国CDC Wonder网站上可以看到,前后参与数据工作人员非常多(https://wonder.cdc.gov/wonder/help/main.html),数据中心的建设是一个持续不懈的过程,绝非一个有期限的“项目”。而且开放数据是由一家专门从事政府数据开放的公司Socrata(https://dev.socrata.com/,该公司已被Tyler Technologies收购)提供技术支持的。我们建议中国疾控中心尽快组建来自公共卫生、数据科学、信息技术、产品开发等多方跨专业的团队,与国内一线互联网科技公司合作交流,不断提升数据资源及其管理能力。


5、尊重参与数据工作的员工,设法激发员工对建设国家公共卫生数据的使命感和荣誉感。数据工作非常琐碎、枯燥,大部分数据工作者都是幕后英雄,就像伟大建筑作品背后的默默无闻的建筑工人,但是他们的作用是巨大的。如何激励这些人的工作,让他们工作有热情,是保障数据中心质量的重要因素。


从中国公共卫生数据服务中心网站上我们完全看不到参与这个项目的任何“人”的因素,好像只有冷冰冰的数字。但是反观Wonder,他们在致谢中,专门列示了现已离开,但曾经对CDC Wonder有贡献的人员名单。如果说搞科研发文章,有个人或团队署名的激励,那么作为数据中心这样一个“科研公共品”常常会存在公共的悲剧。我们建议中国疾控中心应该高度重视公共卫生数据中心的建设,像尊重科研工作者那样尊重参与数据工作的员工,除了物质激励之外,也要设法激发员工对建设国家公共卫生数据的使命感和荣誉感。

图13  Wonder致谢贡献者名单


6、加强数据可视化分析工具的提供,方便用户更加灵活生成各类精美图表。中国疾控中心的数据可视化除了在首页疫情监测有一张可视化图之外,其他地方都没有相应图表,更没有可视化插件,无法让用户自行创设各种生动精美的图表。但是美国疾控中心网站这类功能随处可见。


我们认为作为公共卫生服务机构,一个最大的功能是影响公众,利用先进的可视化工具可以让社会上各类相关人员(尤其是媒体)生成各种生动直观的图表,有利于传播正确的信息和观念。我们建议,中国疾控中心后续要提升在线数据可视化工具能力,方便用户(尤其是媒体)更加灵活生成精美生动图表,逐步提升社会影响力。


7、加强公共宣传,提升信息披露,让公众更加了解疾控中心,避免由于误解带来的信任缺失。对比美国疾控中心,中国疾控中心和公共卫生数据中心的网站设计不美观,使用也不方便,带来的一个重要后果就是浏览量很低、很多数据的下载量几乎为零。一家公共服务机构如果不能为公众所了解其扮演的角色和存在的价值,就失去了存在的意义。


这次新冠状病毒让社会大众对中国疾控中心有了认识,虽然这种认识目前看是负面居多,但是公共卫生的重要性已经深入人心。我们认为,中国疾控中心应该把握这个机会,后续通过加强公共宣传,塑造全新形象,进一步提升其对我国公众卫生意识的公信力和影响力!


当然要做到这一点,我们认为,更重要的是一定要强化自身信息尤其是财务信息披露,让公众感知工作价值的同时也了解经费投入和使用状况。中国疾控中心应该尽快借鉴美国疾控中心的做法(具体可参见https://www.cdc.gov/funding/),向公众详细披露历年决算和未来预算,以此消除公众误解,重塑公众信任。这不仅是现行《中华人民共和国政府信息公开条例》的规定要求,也是人民内心的呼声。


最后,我们想说的是大数据AI技术的出现,给社会提供了充分的算力保障,但是真正要进入智能时代,绝对离不开高质量的数据资源。提供公共服务的政府部门绝不能仅仅停留在展示炫酷的数据可视化图表,以满足现场汇报带来视觉冲击力为目标。而是要不忘初心,紧密围绕公共服务之初心,踏踏实实设计、采集、清洗、加工、分析、积累和开放共享数据,才能让数据发挥为人民服务的最大价值。



相关网站:

http://www.chinacdc.cn/

http://www.phsciencedata.cn/Share/index.jsp

https://www.cdc.gov/

https://www.cdc.gov/DataStatistics/

https://wonder.cdc.gov/

https://data.cdc.gov/










上一条:焦点新闻 | 疫情下企业的生存,求变与创新——『上大MBA云课堂』首次开播!

下一条:师之灼见 | 高峻峻:智能决策系统如何让企业特殊时期绝处逢生