□ 文 吴 甜

作者:百度集团副总裁、深度学习技术及应用国家工程实验室副主任

新技术的使命是要为人类服务的,抗疫过程中,大数据和人工智能技术发挥了很大的作用。

人工智能是第四次工业革命核心驱动力量,已经在各行各业广泛地应用起来。新技术的使命是要为人类服务的,在抗击新冠病毒带来的这场疫情过程中,大数据和人工智能技术发挥了很多作用。在抗疫一线,人工智能和大数据带来的新产品和解决方案起到了重要作用。

疫情分析——大数据技术在疫情分析管理中起到重要作用

通过数据分析的能力,能够了解到整个疫情的发展态势,追踪人群流动情况,能够为有关机构从大数据分析角度给予辅助决策的帮助。在很多大规模重复性有接触风险的场景下,筛查工作是必不可少的。AI测温可以提供免接触的测温能力,在人群密集的情况下,能够追踪人群当中是否有体温超过了安全线的人;智能语音对话系统也可代替社区人员进行大量的寻访和随访工作,大幅提升了在排查工作中的效率;医学科研方面,AI也在为病毒检测、药物研发等领域提供新的工具,带来效率的提升。接下来围绕这三方面展开论述。

首先,大数据技术在支持疫情科学防控方面的作用。从群体分析的角度来说,传统的流行病分析预测当中,会采用很多的病例数据来进行分析,比如说确诊者、疑似者,或者是密切接触者,人群流动和接触是带来疫情变化非常重要的因素。通过百度地图上的时空大数据,分析和预测疫区人员的流动趋势,能够识别出重点城市和区域。通过应用人群的整体性流动分析技术,能够知道人群走势,比如在武汉和湖北,在春节前向外流出的人群走势,流向了哪些重点城市和区域,进而向相关机构提供决策的帮助,能够去分析未来一段时间内疫情的发展态势,能够开展相应的管控措施,以及储备相应的医疗物资。

对于个体来说,在这次整个抗疫过程中,风险人员的识别是非常重要的。因为这次病情传播力非常强,潜伏期非常长,在传统方法当中,会进行面对面地访谈去了解人员的流动情况,而实际上这样的方法有三个缺点;首先,它非常耗费时间和人力。第二,这种访谈不一定完全真实可靠。第三,很多潜伏期人员和密切接触者可能都不一定知道自己到底在什幺时候和患者有过接触,有可能是在同一个超市买了菜,或者一起乘坐了一辆公交车,或者在一个餐馆吃了饭。像这些数据,通过大数据的分析,能够尽可能追踪到每一个人的亲密接触人员。通过这样的分析之后,得到了亲密接触人员的流向和数据,也能够为整个疫情的管控和治理提供非常有力的支持帮助。在地域迁徙上,百度地图推出的迁徙画像,能够看出全国的人员流动情况,以及高速路网实时监控,能看到整个宏观的交通情况,在春运这样一个特殊时间段内,能够看到人员的流动变化。今天,很多企业已经进入到复工复产的状态,也能够提供给企业复工复产相应的信息和决策的帮助。

偏向于群体和宏观的之外,对于个人防控来说,其实每一个人也会需要有贴心的防疫功能。举两个例子,一个是疫情小区地图,一个是发热门诊地图。这些都是在百度地图上开放给用户使用的,基于地图上的大数据进行了智能预测。智能预测确诊人员所在小区周围,有哪些地方是有可能产生人员聚集的高危地区,提供给用户之后,能够提高民众的联防联控意识,避免民众再进入到高危地区当中,能够使得整个抗疫过程深入到基层开展。

百度的时空大数据技术,从技术逻辑上来说,最底层是有大量的基础数据,对人类社会、信息空间、物理世界进行了三元描述。在进行了大量时空模型的建模,通过算法组建支撑到上面的应用,百度的大数据应该说是积累了超过10年的时间,拥有非常广泛的、大量的数据,而这些数据本身具有非常强的移动互联网属性及高精度属性。一方面是时空大数据所提供的更宏观的分析和支持,另一方面也可以通过互联网产品上的用户需求对民众的关注点进行分析,举个例子:首先可以通过对大数据的分析,去时刻追踪大家所关心的科普话题都有哪些。比如说,从穿戴防护的科普问题当中可以看到,排在第一位的是口罩多久更换一次,还有像消毒防护的科普问题、传播方式科普问题,以及症状判别的科普问题,我们将这样一系列的数据分析结果提供给中国疾控中心,可以针对大众所关注的疫情问题给予权威的科普素材跟进,使得民众可以在自己最关心的话题上得到解答。

复工复产阶段,通过大数据对疫情所产生的产业影响关注分析,也可以看到在不同地区,疫情对不同行业所造成的影响。不同地区的人们关注度是不一样的,通过地域将人群划分之后可以看到:珠三角地区疫情对制造业的影响关注度非常高;长三角、京津冀地区疫情对房企的影响关注度很高;京津冀地区对在线教育的关注度都很高。这些地区,大家普遍的反映是疫情对餐饮业的影响是非常

AI

AI可替代大规模、重复性、有接触风险的筛查工作一致的。另外,对疫情期间复工的人们关注度分析也能看得到,返程复工,感染肺炎是否算工伤,以及疫情对失业的影响,其实都是民众关注非常高的话题。在不同地区也有不同表现。所有的分析当中发现,苏州对几乎所有的复工复产相关话题关注度都非常高,所以在整个复工复产当中,可以对苏州给予更多的关注和支持。以上是大数据技术在疫情分析方面的应用和作用。

筛查管理——AI可替代大规模、重复性、有接触风险的筛查工作

在筛查管理方面,在很多人流密集的地方,比如说像机场、地铁、火车站等等,随着返程复工高峰的到来,相信有越来越多的人在公共场合不断出现。在公共场合上,我们配备了一些测温的措施,但是传统额温枪慢,特别容易造成人群密集的地方产生更多人的等待,容易产生更多交叉感染的可能性。百度推出的多人体温快速检测解决方案,是希望在这样的场合,在一定的区域范围类有一台AI测温仪,能够通过远程识别对这个区域进行监控。它的工作方法是通过红外测温传感器监测一片区域,可以去识别出来有体温可能超过了标准的人。下一步会经过人脸检测找到和跟踪相应人员,这时工作人员就可以去进行下一步的确认和识别。

在这套方案当中,其实可以做到识别的精度,最佳精度是1至2米,可以达到免接触的测试,识别准确率整体有90%以上,每分钟最大通行人数达到了200以上。看一看AI测温背后的技术,除了红外的分析,还有人脸识别技术。这里需要对人脸的关键点进行精准定位,包括到脸颊、眉、眼、口、鼻等人体五官及轮廓的150个关键点。在这样一个特殊时候,很多行人都是佩戴着口罩,我们也刚刚开发了口罩识别的模型法,可以在佩戴口罩情况下,依然可以对人脸有非常精准的检测能力。同时,通过的模型小型化的技术,使得模型在离线环境下,能够在嵌入式设备上有10倍以上的速度提升,并且是无损的。所以,整套方案在公共场合里能够免接触进行快速地、准确地测温工作。这套方案已经在北京地铁站布下了19个检测点。

除了人群密集环境下的筛查,在整个抗疫过程中,一线社区工作人员也投入大量精力在不断进行寻访和随访。百度的应用对话技术服务,推出了智能外呼系统,能够支持社区疫情快速筛查和摸底。它包含有流动人员的排查、本地居民的排查和回访,以及特定人群通知三项功能。它可以像社区工作人员一样,去不断地给相应人员通过电话方式,进行排查和确认,并且可以把所有信息都能去智能地自动化、结构化下来,快速进行因袭的录入。这样一套系统,在日拨打数量上是大幅超出了人工排查能力;工作状态上可以无任何影响因素标准化地执行任务;能够在信息收集上高效率、高质量、直接地进行自动的记录。这样一套平台已经在北京海淀上地街道办、陕西西安、延安、上海宝山、浙江抚州瑞安市等十几个地区投入使用了。外呼的总量已经超过百万次,这样一套系统大幅地提升了随访效率。背后的人工智能技术是有语音识别能力,自然语音理解能力及构建知识图谱能力。

这样的技术系统,不单单是可以提供给社区作为外呼系统使用,在百度的语言与理解交互技术平台UNIT上,上线了疫情小助手技能,既可以通过防疫知识的知识图谱构建,形成防疫知识的随问随答,对疫情信息也进行了官方权威数据的接入,还可以实时地查询,通过口语化的问询能够使普通的使用者也可以用非常方便的方式,快速获取到疫情相关的信息。

在这个助手上,也可以帮助进行大量人群的每日重复收集汇总。在疫情当中,有很多每日重复不断的信息汇总收集过程,通过人工智能技术,可以使这样的工作效率大幅提升减少重复工作。从核心技术角度看,我们需要知识的建设和管理,能够把相应的知识图谱建设起来,尤其是在疫情的特定场景话题下,关于疫情的所有知识体系要构建起来。还要有形成对话管理的能力、自然语言的理解能力,以及智能问答的能力。一套语音的交互系统,还需要语音语义的一体化集成框架,在这样一套技术平台上,我们可以快速搭建并通过对话方式提升效率系统。

疫情期间,有温度的智能机器人非常多。机器人本身的专注度非常高,它的工作状态非常稳定,更关键的是它不需要和病患进行隔离,所以很多机器人在整个疫情期间,为大家提供服务和帮助。相信随着人工智能技术的发展,机器人的技术也会越来越成熟,未来会有越来越多的机器人能在关键时刻提供给我们更多的帮助。

相信随着人工智能技术的发展,机器人的技术也会越来越成熟,未来会有越来越多的机器人能在关键时刻提供给我们更多的帮助。

医学科研——AI可以为病毒检测、药物研发等领域提供高效工具

医药的研发、疫苗的研发等有没有可能更快速地产生出来,帮助我们渡过疫情?举一个例子:这是百度推出的一个算法,应用于医学科研,加速疫苗和病毒分析的RNA的二级结构分析算法。这一次引起肺炎疫情的冠状病毒其实是和当年的非典病毒一样是RNA病毒。RNA是一个单链结构,单链结构就会有更强的不稳定性,更强的变异性,以及在疫苗研发上会有更多的困难。RNA序列结构分析在病毒研究当中非常重要,在2019年7月份百度提出并实现的Bioinfor的算法,可以将病毒的全基因组的RNA二级结构分析从55分钟缩短到半分钟以内,是在这一次冠状病毒数据上得到的速度。这意味着,全基因组结构的分析会变得更快速实现出来,能够有助于病毒的一系列分析工作,也有助于新型疫苗的研制过程,希望能够对疫苗的研制带来快速的帮助。

AI测温仪,就是有红外的技术和AI的技术结合,而智能外呼系统本身就是语音理解及知识图谱多个技术一系列的融合。

挑战与发展空间

除了这些,其实还有很多AI技术在这次抗疫中起的作用,像机器翻译技术。在这次抗疫中,我们需要有快速能够获取大量不同语种素材和不同语种的研究报告。有一些国家也不断输出新的研究成果,百度的机器翻译快速开发了面向医疗领域的定制能力,支持了抗疫支援者团队大量文献翻译工作。当然这是一系列AI技术所带来的帮助,对于AI技术来说,未来也依然存在着发展空间和挑战。

从这次抗疫中也能够看得到,在基础数据平台建设上还有很多工作需要开展。大数据分析技术在整个疫情治理当中起到了一系列关键性作用,未来基础数据的平台需要进一步加强和夯实,并且做到大量数据之间的融汇贯通及合理使用。可以看到一系列工作落地到真实应用场景当中,大型的工程系统支撑是非常重要的,以及人工智能技术之间跨技术融合解决场景问题,都是非常关键。AI测温仪,就是有红外的技术和AI的技术结合,而智能外呼系统本身就是语音理解及知识图谱多个技术一系列的融合。

在这个过程当中,百度的技术落地了多处,产生了大量的产品和解决方案。百度的人工智能技术从基础层到感知层到认知层到平台层,有一个全面的布局。它有多项AI技术,同时有AI安全保驾护航。这一系列技术,基础是搭建在开源深度学习平台飞桨上的。飞桨平台是在框架层支持了开发、训练、预测全方位的能力,并且开放有大量的多种模型库,还有支持多个工具组件以及服务平台。整个能力可以支撑我们在上面去开发很多的AI应用,在飞桨平台上已经服务了有150多万位开发者,超过了6.5万家企业,在定制化训练平台上已经发布了16.9万个模型。在这一系列平台开放基础上,过去一段时间,很多开发者也在进行着抗疫的产品和项目开发。百度大脑也为此制定了“AI开发者战役守护计划”,提供给开发者免费的资源配置,专项领域服务和深度技术支持,希望开发者能基于百度大脑开发平台去开发更多的产品、去支持疫情的治理。在飞桨平台上也提供了一系列的算力和代码功能升级的支持,以及专家定向帮助,并且配套了免费的线上课程,从入门到实践的全阶段课程。

目前,通过一线医护工作人员的努力、社区工作人员的努力,这次疫情已经有非常好的控制状态。从科技工作者角度来说,希望我们的工作能够助力防控,能够去为抗疫提供更多的帮助,同心共渡难关。■