基于扫描统计的甲型H1N1流感聚集性分析

姚欣,夏天琦,翁敏

(武汉大学资源与环境科学学院,湖北武汉430079)

摘要:扫描统计已被广泛应用于地域性疾病的聚集性检测,且可检测这种聚集的差异显著性。文中使用扫描统计的方法,通过对2009~2012年全国各省的甲型H1N1流感数据进行时空扫描以及逐年的空间扫描,生成高发病率地区和低发病率地区聚类,并通过叠置分析反映各个地区归入聚类的频次。利用专题地图和统计表分析甲型流感在2009~2012年中的爆发情况和趋势,并对结果进行客观的分析。

关键词:扫描统计;甲型H1N1流感;发病率;聚集性;叠置分析

中图分类号:P208

收稿日期:2014-06-12

基金项目:国家自然科学基金资助项目(41001307;41371369)家自然科学基金资助项目(41001307;41371369)

作者简介:姚欣(1993-),男,本科生.

AnalysisoftheclusteringofinfluenzaA(H1N1)basedonscanstatistics

YAOXin,XIATian-qi,WENGMin

(SchoolofResourceandEnvironmentalSciences,WuhanUniversity,Wuhan430079,China)

Abstract:Scan statistics have been broadly applied to the detection of the regional disease clustering as well as its significance of difference.Based on the method of scan statistics,this paper makes a study on the clustering of high and low disease incidence about influenza A (H1N1) by analyzing the cases on a national scale from 2009 to 2012 in the space-time scan model and the spatial scan model.An overlap analysis is also conducted to represent the frequency of each province classified to those aggregations.It is aimed at making retrospection about the trends and outbreaks of influenza A (H1N1) from 2009 to 2012 in the form of thematic maps,statistical diagrams as well as detailed analyses.

Keywords:scanstatistics;influenzaA(H1N1);diseaseincidence;clustering;overlapanalysis

甲型H1N1流感是一种由新型的甲型H1N1流感病毒引起的急性呼吸道传染病,2009年3月18日墨西哥发现首例甲型H1N1流感,随后疫情在全球范围内大规模流行。据公共卫生科学数据中心统计,仅2009年我国甲型H1N1流感发病人数达到147 337人。

疾病的时空聚集性是指疾病的发生在时间、空间或时—空表现出的聚集倾向或趋势[1]。统计分析是通过某种统计方法对数据表示、分类、分析和处理,揭示数据所反映的自然规律,进而获得解决问题的方法[2]。扫描统计能够判断疾病的分布是否存在聚集性,还可以确定疾病聚集的时间、位置和范围。本文使用扫描统计的方法,使用SaTScan软件对我国2009~2012年甲型H1N1流感进行时间和空间分布特征及聚集性分析,并利用ArcGIS对分析结果进行可视化表达。

1数据来源

2009~2012年全国甲型H1N1传染病统计数据(包括35个监测站点2009~2012年H1N1发病数、死亡数、发病率、死亡率数据),来自公共卫生科学数据中心;2009~2012年各省人口数据来自国家统计局;地理信息数据来自国家基础地理信息中心。

2基本原理

扫描统计量方法是探测事件在时间和空间上发生的聚集,并检验这种聚集是不是由于随机变异造成的[3]。空间扫描采用二维的扫描方法,利用一个变化的空间窗口在研究区域内进行移动,从而探测出集聚存在的空间区域[4]。其具体扫描方式为:在二维地理空间平面上设定一个扫描窗口,选定研究区域某一点为扫描窗口的中心,扫描的半径从0开始以一定的距离逐次递增,直至达到最大扫描上限。使用这种方法对所有的研究点进行扫描,生成一系列的扫描圆。对于时空扫描,采用三维的扫描方法,扫描窗口是一个柱形,在时间维度和空间维度上都可以变化,分别对应于柱形半径和高度的变化,扫描过程和空间扫描类似。

对每一个扫描窗口,根据窗口内外的发病情况计算检验统计量对数似然比(LLR),LLR最大的窗口便是最有可能聚集的窗口。

本文使用扫描统计模型为泊松模型(PoissonModel)。就圆形扫描窗口而言,泊松模型对每一位置和大小的空间扫描窗口,无效假设为疾病空间分布是完全随机的;备择假设为扫描窗口内的发病率相对窗口外增加,对数似然比函数为

式中:c为窗口内的发病数;C为总发病数;E[c]为基于无效假设由协变量校正过的窗口内预期发病数;I () 为指示函数,当窗口内实际发病数高于预期发病数时,I () = 1,否则 I () = 0。

各聚集发生的相对风险(relativerisk,RR)为

式中各字母意义同前所述。通过RR值,可确切评估各聚集性的风险大小[5]。

随后,需要对集聚的区域进行置信度分析,即使用蒙特卡罗假设检验方法计算p值(p-Value)。将由此方法产生的N个随机分布数据集以及计算得到的相应的最大LLR,与病例数据集的LLR合并且递减排序,若病例数据集的LLR排在第R位,则

次序越靠前,R越小,则P值越小,说明聚集为随机的概率越小。

3结果与分析

3.1 扫描统计分析

本研究使用SatScan软件进行时空扫描统计,对结果数据进行可视化处理,获得甲型H1N1流感发病风险和聚集区分布专题地图(见图1),图中各省市的相对风险使用分级统计图法来表示,颜色越深表示相对风险越高;此外,还得到3个高发病率聚集区和一个低发病率聚集区,分别用实心圆和空心圆来表示。其中北京市也为高发病率聚集区,由于聚集只限于北京市范围,聚集半径为0,因而未能在图中表示出来。

根据扫描结果文件,高发病率聚集的时间均为2009年,也正是疫情爆发并迅速蔓延的一年,发病人数较多。位于东南部的聚集区以福建为中心,范围涉及江西、浙江、上海、江苏、湖南等省市;位于西部的聚集区以西藏为中心,范围涉及四川、云南、青海、甘肃、重庆、贵州、新疆、宁夏、山西等省市;位于华北地区的聚集区即北京市。而低发病率聚集则集中于2011~2012年,此时疫情已经得到控制,发病人数大幅下降,其聚集范围以河南为中心,涉及山西、山东、河北等省。可以看出,我国甲型H1N1流感发病的空间和时间分布非随机化,存在高发聚集区和低发聚集区。

图1 2009~2012年全国甲型H1N1流感发病风险和聚集区分布

表1 扫描统计结果

3.2 聚集区时空叠置分析

为更直观地描述各省市在2009~2012年中甲型流感的发病情况,本研究对每一年的数据进行单独的空间扫描统计,获得各年的聚集区位置,并统计每一年聚集区域中所包括的省份(以聚类区域是否覆盖其省会城市为判断标准)。然后在ArcGIS中使用叠置分析方法统计每个省份落入聚集区域的频次,并使用分级统计图法来表示该频次,得到高/低发病率聚集区的专题地图,如图2、图3所示,图中各地区的频数以颜色来区分,颜色越深表示该区域落入聚集区域的频次越高。

图2 高发病率聚集区频次分级统计图

图3 低发病率聚集区频次分级统计图

利用GIS的空间分析方法,使用专题地图分级统计图作为工具,能够把甲型H1N1流感的时间分布变化规律在二维地图上清晰的表现出来。在研究时间范围内,我国甲型H1N1流感爆发频率较低的地区主要集中在西南、华中、华北(北京除外)及东北地区,其中以华北地区(豫、鲁、冀)爆发频率最低,在四年内均处于低发病率聚集区;而西北以及南部、东部部分省市(京、浙、桂、琼)爆发频率较高。

4结束语

本研究考虑到数据获取等各方面原因,研究的空间精度定为省级单元,而时间精度设为年。这样的做法计算量较小,数据获取较为容易,但所得到的数据只能反映分省情况,而不能反映各个省内部的发病率高低情况;此外,和国内大范围内的扫描统计相同,本次研究中每个省(直辖市、自治区)的坐标取该地区行政中心的坐标,将整个区域看成是一个点,这对聚类的划分会产生一定的影响。在聚类区域规模的设置方面,研究中选取了不同的最大聚类半径参数,发现在最大聚类区域包含50%的全国患者时,其聚类面积过大,覆盖的省份超过半数,聚类范围内的差异无法分析;而最大聚类区域包含25%的全国患者时,其聚类面积大小适中,易于和非聚类区域进行对比分析。

空间扫描统计被广泛地用于数据计数,以此来探测具有高发病率或低发病率的疾病的地理聚集性,并评估其统计学意义[6]。扫描统计量方法在分析之前对聚集性的大小位置规模没有进行任何设定,避免了选择偏倚的出现;作为探索性分析,可以最大限度地进行数据信息的挖掘,发现空间聚集性的存在[7]。而且通过空间扫描统计与GIS空间分析和可视化表达方法结合起来,可以很直观的反映疾病在空间上的分布和变化特征,这对疾病的检测与防治具有重要意义。

参考文献:

[1]陈峰.疾病时空聚集性的统计方法研究[J].南通医学院学报,1999,13(9):237-240.

[2]熊金华,曹亚妮,程越.基于统计分析方法的地理要素显示重要性确定研究[J].测绘工程,2012,21(3):26-30.

[3]郭鹏飞,何红燕,张韬,等.扫描统计量模型在地方病流行病学中的应用初探[J].现代预防医学,2011,38(2):215-218.

[4]王占红.基于扫描统计方法的上海犯罪时空热点分析[D].上海:华东师范大学,2013.

[5]唐咸艳,周红霞.扫描统计及其在流行病学中的应用[J].中国卫生统计,2011,28(3):332-337.

[6]JUNGI,KULLDORFFM,KLASSENA.Aspatialscanstatisticforordinaldata[J],STATISTICSINMEDICINE,2007,26(7):1594-1067.

[7]张文增,李长青,冀国强,等.空间扫描统计量在手足口病空间聚集性研究中的应用[J].中国卫生统计,2012,29(4):507-509,513.峰.疾病时空聚集性的统计方法研究[J].南通医学院学报,1999,13(9):237-240.

[2]熊金华,曹亚妮,程越.基于统计分析方法的地理要素显示重要性确定研究[J].测绘工程,2012,21(3):26-30.

[3]郭鹏飞,何红燕,张韬,等.扫描统计量模型在地方病流行病学中的应用初探[J].现代预防医学,2011,38(2):215-218.

[4]王占红.基于扫描统计方法的上海犯罪时空热点分析[D].上海:华东师范大学,2013.

[5]唐咸艳,周红霞.扫描统计及其在流行病学中的应用[J].中国卫生统计,2011,28(3):332-337.

[6]JUNGI,KULLDORFFM,KLASSENA.Aspatialscanstatisticforordinaldata[J],STATISTICSINMEDICINE,2007,26(7):1594-1067.

[7]张文增,李长青,冀国强,等.空间扫描统计量在手足口病空间聚集性研究中的应用[J].中国卫生统计,2012,29(4):507-509,513.

[责任编辑:张德福]