郑 阳

(南京市第二医院信息中心,江苏 南京 210003)

人工智能(artificial intelligence,AI)是建立在计算机科学之上,利用模型算法对人的智能进行模拟和应用的一种多学科交叉的前沿科技,其目的是为机器赋予人类思维和行为,以帮助人们计算、识别、分析、预测等工作。随着科技的进步,AI 的发展和应用已逐渐渗入到人们生活工作各个领域之中。其中,AI 技术在医疗领域的应用是近年来研究的热门领域之一,将AI 技术结合其他新兴科技,融入医疗服务、临床诊疗、影像识别、药物研发、精准医学研究等领域[1,2],创新医疗服务内容、模式和场景,能够提升医疗机构的工作效率和诊疗质量,为大众医疗健康提供更优质的服务,同时,还能给医疗科研领域提供新的技术途径以更深入、更广泛的探索新维度。为此,本文对AI 在医疗领域的应用进行分析,总结其技术优势与不足,旨在为医疗人工智能技术的发展提供帮助。

1 医疗人工智能关键技术

1.1 机器学习 机器学习是医疗AI 的重点核心技术,从不同的学科角度,如统计学、概率论、近似理论等设计不同的理论模型,用于计算机模拟人类思维或行为,使机器具备一定的学习、分析、分类、识别等能力,并通过累积经验不断的自我完善,提高性能和泛化能力。在医疗领域,机器学习是进行疾病诊断预测、预后评估、健康管理、精准医疗、图像诊断等智能化应用的关键基础技术。根据模型学习方式的不同,可分为监督学习、非监督学习、半监督学习和强化学习[3]。

1.1.1 监督学习 在监督学习中,数据样本集分为训练库和测试库,其中训练库是有描述样本属性标记的集合,样本的属性一般是人为标注。构造学习模型,建立输入与输出的关系,以推断预测测试库中未知数据集的目标属性值,并通过调整参数使模型最优化。其目标是对大批量未知数据进行离散值分类或连续值回归。通过对某一疾病对应的相关体征数据进行学习,获得可预测该疾病的模型,然后通过分析获取的检查数据,预测病人患有该种疾病的概率,以方便临床决策。常用算法如下:最近邻节点算法(KNN):以预先设定的分类节点为初始值,计算未知节点到各类之间的抽象距离,判定其所属类别;决策树算法:根据测试库训练得到决策树模型,由属性分类节点和分支构成,可以对未知数据按照各层次节点属性逐级判别分支走向,近而获得最终类别;朴素贝叶斯分类器是一种基于概率论的典型的生成学习方法,给定先验概率,从训练集数据学习中获得联合概率分布,计算未知数据后验概率分布;人工神经网络(ANNs)是通过激活函数传递激活响应来模拟大脑神经突触传递处理信息的一种模型,由输入层、隐藏层、输出层组成,隐藏层包含一系列的线性方程,可以通过层次反馈自我调整模型参数,学习能力、鲁棒性强,应用范围广。

1.1.2 非监督学习 非监督学习算法能够通过挖掘数据潜在的规律,将无标记的数据集按照各自特性进行自学习的聚类。迭代计算样本间和类间的距离,使类内差距最小化、类间差距最大化,通常用于缺乏先验知识,缺少标签的情况[3]。典型算法有K-均值聚类(K-means):先假定类簇数量并选择类中心,对杂乱无章的数据计算到中心的距离,归类并更新簇类中心,依次迭代自动聚类;主成分分析法(PCA):通过正交变换,可以将大量有关联变量降维成非相关主成分变量,来代替原始数据进行下一步处理,降低复杂度的同时保留了数据的基本特征。最大期望算法(EM):假定初始分布参数,计算每个数据元组隐藏变量的期望,即对其归类,根据归类结果计算分布参数的最大似然估计,然后再反向计算数据元组隐藏变量期望,迭代往复最终得到稳定的估计值;高斯混合模型(GMM):利用高斯概率密度函数将类量化为若干基于高斯概率密度函数的模型,目标是找到合适参数的高斯分布使得产生已知样本的可能性最大,则说明该样本属于该类。实际中,根据具体情况选择合适的模型算法。

1.1.3 半监督学习 半监督学习方式针对已对部分数据集做标记的情况,利用部分标记学习引导全局,提高准确性的同时能够尽可能少的要求人为参与,符合大多数的实际情况。通常是对监督和非监督学习算法的融合,综合利用有标记的样本集和无标记的样本集,可以增强分类准确性。如基于概率论的生成模型可以融合高斯混合模型或贝叶斯模型等;基于图论的推理算法建立已标记和未标记样本之间的关联,并通过相似性度量构造聚类图;半监督支持向量机在存在无标签数据的前提下能够构造最优分类超平面。

1.1.4 强化学习 强化学习是将输入的数据再作为反馈输入模型中,而非对输入固定数据集完全信赖,模型按照反馈多步修正,不断提高分类精度。不同于监督学习中有训练数据的输出值,强化学习中有“奖励值”作为强化信号,用于延后评价智能体与外界交互的状态,智能体根据反馈的奖励值和状态选择下一动作,依次迭代获得最大奖赏,以此来增强优化学习效果。常见算法有基于值算法的Q-Learning、基于策略算法的Actor-Critic 框架,时间差分学习算法等,可以和深度学习结合形成主流的深度强化学习。

1.2 医疗大数据处理技术 大数据技术能够帮助从海量的医疗数据中获取有价值的信息,作为机器学习或其他数据挖掘方式的处理对象,构造数据模型,进而应用于临床诊断或医学研究。主要包括数据的采集、预处理、存储和管理、分析和挖掘四个关键技术[4]。

1.2.1 数据采集 医疗大数据采集的任务是从单一或多个医疗机构中获取诊疗、影像、检验、病理等业务数据,包括结构化、半结构化、非结构化等多种形式。可通过传感、监控、接入数据库等技术直接获取,通过区域、省、国家级数据监管平台以接口传输方式采集辖域内所有机构的医疗数据,进行统一组织、整合形成原始医疗大数据资源。

1.2.2 数据预处理 数据预处理是对采集的原始数据通过辨析、抽取、清洗等一系列操作。先将杂乱、复杂的多种数据结构和类型转化为单一或便于处理的构型,然后对数据“去噪”处理,最后提取出有效的医疗大数据。

1.2.3 大数据存储和管理 建立合理数据库存储医疗大数据,高效的对各种构型数据进行管理和调用,是数据存储的目标。需要结合数据建模、去冗余、异构数据融合、大数据索引以及可视化等技术实现。实施大数据安全技术,严格控制过程中数据的访问、加解密、审计、隐私保护、完整性验证等操作,这是安全利用医疗大数据的保障。

1.2.4 大数据分析和挖掘 数据分析和挖掘是大数据技术的核心,对获取的医疗大数据进行统计学分析,通过机器学习、网络、图、特异群等数据挖掘技术,提取出隐含在数据内部有用的信息或知识,用于分类、预测、异常或趋势发现等。

1.3 计算机视觉 诸如影像、病理、超声等医学图像在医疗领域的辅助诊疗中有重要决策性作用,利用计算机视觉技术,模拟人眼观察、定位和感知图像的过程,从而提取出感兴趣的知识。涉及图像处理、模式识别、语义理解等关键性技术,这里的图像可以扩展应用于视频,因为视频是一组连续的图像序列[5]。

1.3.1 图像处理 图像处理是将成像设备获取的并转换的数字图像进行操作运算,以满足对图像质量或特定场景的需求。例如基于像素级的增强、锐化、去噪、融合、分割,基于频率域的图像变换、解压缩,基于数学形态学的膨胀腐蚀、填充,基于水平集的分割、跟踪等。

1.3.2 模式识别 图像识别技术是模式识别领域的一大重要分支,是在图像处理基础之上抽取图像的特征与信息,作为机器学习模型的数据集进行训练,从而对图像内容进行特定目标的认知。常针对图像中的某些部分,如分割区域的分类或识别,涉及图像检测、分类、检索、匹配等技术。

1.3.3 图像语义理解 图像理解是对图像内容更深一步的高层次语义认知,基于上下文特征信息,研究图像中的目标、目标之间的联系以及场景等。为了缩小图像表达和语义之间的鸿沟,建立图像与语义标签之间的对应关系,包括语义分析生成、叛别和句法描述等处理策略。

2 人工智能在医疗领域中的应用现状

2.1 以数据为驱动的应用

2.1.1 辅助诊疗 以历史检查、检验、诊断等大数据为样本集,利用机器学习技术,训练构造针对某一疾病预测模型。根据病人当前检查客观值,结合公有知识库、专业文献,预测出患有某种疾病的概率,如已有的心血管病、阿尔兹海默症等,将被动诊治的过程转换成主动防御,将治疗过程前移,能够早预防、早治疗,提高治疗的有效性。针对疾病,以历史用药、开立检查作为样本集,在医生的诊治过程中给予相应用药、检查推荐提醒,或为医生提供查询、鉴别、合理用药等服务,以防人为疏漏和错误,辅助临床决策,间接提高诊治水平[3]。在智能问诊、导诊方向的应用也较为广泛。

2.1.2 健康评估与管理 随着社会的发展,人们对自身的健康日益重视,国内针对个人或家庭的健康管理技术和产业尚处于起步阶段。利用传感器、传输、物联网等数据采集技术获取人的各项生命体征,建立个人电子健康档案,利用AI 结合云服务技术,对个人的健康状态进行计算、评估,预测潜在风险并给出有针对性的预防和改善策略。通过应用载体和软件,能够对生命周期内的各项体征实时、动态、持续采集、监控和分析处理,全方位多维度评估健康状况。对于慢病、亚健康、老年病、母婴等人群的健康管理尤为重要[2]。

2.1.3 精准医疗 作为新一代诊疗技术,精准医疗借助人类基因测序技术,以个体蛋白质组、基因组为对象,以大数据技术为基础研究其与特定疾病之间的关联,精确定位某些疾病的原始基因性起因,从而确定精准治疗靶点,预测重大缺陷性疾病。相对于传统的治疗方式,精准医疗不止精确而且便捷高效,减少甚至避免对病人的创伤,对于已病和未病的治疗和防御均有重要的临床价值。目前在遗传病、肿瘤、妇科等领域具有广泛深入的应用。

2.1.4 药物挖掘 传统药物研发效率低、周期长、成本高,将人工智能技术融入药物挖掘流程的各个阶段,为科研人员开创了新的思维,有效缩短研发时间,合理控制成本。在临床前能够提高化合物的筛选效率、选择合适剂量,临床中结合医疗大数据迅速找到符合条件的病人进行临床试验,对治疗和配伍效果进行预测和评估、控制不良反应。借助深度学习,已有企业在心血管药物、抗肿瘤药物、常见传染病治疗药等领域取得突破性进展。

2.2 以图像为驱动的应用

2.2.1 医学图像分析诊断 随着医疗成像设备的发展,医学图像的呈现方式愈加多样化,如X 线、CT、核磁MRI、超声、内窥镜、病理等。借助图像处理与分析技术,对获取的医学图像进行基础的预处理,将图像根据特定需求提取特征、定位勾画、增强或分割;再进行基于机器学习的图像高级语义识别、标注、分类等操作,根据局部病灶区域特征,智能定量检测分析、筛查并预测可能的疾病或潜在风险,不仅可以提高医生的读片诊断效率,还提升准确率,降低人为疏忽造成的遗漏。例如,目前在肺部、脑部、心脏、眼部等组织器官的图像病变识别中均有较为深入的研究[5]。

2.2.2 三维图像建模技术 以二维图像为基础,利用三维AI 可视化技术,对人体目标进行全方位立体识别分析,并进行三维建模,直观形象的构造虚拟解剖组织结构,模拟病灶与周围结构的几何位置关系。医生以人机交互的方式对病灶区域旋转、平移或模拟剖开手术等,帮助医生精确快速诊断并制定可行、科学的治疗或手术方案。不仅能提高治疗或手术的有效性,还减少病人不必要的创伤。在肿瘤、头颅、血管、妇产科、骨骼牙齿修复等领域的诊断观察和手术操作中,三维重建技术都有重要的应用。

2.3 综合新技术应用

2.3.1 医疗机器人 医疗机器人是服务于医疗机构各项业务的机器,由特定的程序控制其动作行为,并可融入AI 使其具有对自身或环境的意识。其中,运送机器人可以代替人工配送药品、三餐,回收垃圾或运送病人,减少人的重复劳动,在传染病隔离病房中降低接触感染几率;护理机器人可协助护士确认病人身份,测量体温等生命体征,并准确为其配药,缓解繁琐的护理工作;手术机器人协助外科医生手术操作,弥补人医生体能、耐力和精度的不足,融入智能的手术机器人,借助全方位的影像系统,能够自主分析病灶并提供合适的方案,实现微创、数字、智能的手术模式。

2.3.2 远程医疗 5G 网络的发展对推动问诊、会诊等基础远程诊疗的发展,将AI 融入远程诊疗,辅助医生线上影像的分析、诊断决策、用药和检查推荐等,提高远程诊疗质量。医生和病人摆脱了地域的限制,拓展应用场景。通过医疗可穿戴设备采集生命体征,实现远程智能监护;医生甚至可以通过5G 远程手术技术控制机械臂,对异地患者进行精准的手术,可以实现共享优质医疗服务和资源。

3 医疗人工智能意义及问题

3.1 医疗人工智能意义 人工智能给医疗行业带来了前所未有的发展机遇,贯穿于医疗诊治全过程,在疾病预防、预测、诊疗、预后评估等阶段均有重要的辅助甚至主导作用,拓展了医疗服务场景和领域[6]。对于临床医务人员,能够帮助提高诊治效率和质量,在一定程度上弥补技术、人力、及时性、准确性上的不足;对于患者,能够享受传统医疗基础之上的新型服务模式,尤其在个人健康防御、管理和监测方面具有优于传统方式的用户体验;对于管理者,借助AI工具能够轻松获取科学、准确的分析评估和预测,以便合理调配资源,做出相应决策;对于医疗机构,提升了自身的医疗服务能力和质量,缓解医患矛盾,有利于扩大公众影响力;对于科研人员,开拓了实际应用前景,为医疗行业打开发展新局面。

3.2 医疗人工智能面临的挑战 医疗AI 在研究和实施过程中存在很多问题和挑战,需要在探索发展中不断完善。首先,医疗大数据分散、复杂、多样,数据融合和共享存在一些技术和非技术的客观困难;数据来源的准确性和完整性关系到后续研究的精确性和有效性,对数据的安全性保护是整个研究过程的保障性前提。其次,医疗AI 需要计算机和医学学科综合双面人才,这种专业性双面人才培养较为缺失,一定程度上阻碍了医疗AI 的研究进展。最后,受现有技术制约,AI 系统学习时间长,医务人员使用需要长期磨合;AI 器械安装调试复杂,维护和处置难度大、成本高,给AI 的实施推广增加困难[6]。另外,医疗AI 服务于患者,缺乏配套的监管和法律问责机制,存在一定的风险和隐患,需要在实施中不断健全相关政策规则。

4 总结

医疗人工智能不仅是一种新兴技术手段,更是一个融合多门专业学科的重要学术和应用领域。以机器学习、大数据分析处理、计算机视觉等关键性技术为基础,在辅助诊断、精准医疗、医学图像分析、医疗机器人等领域已形成初具规模的应用,拥有广阔的发展前景。医疗AI 为患者、医生、医疗机构提供了高科技的服务和帮助,从各方面助力提高诊疗质量和效率、创新服务场景,变革了传统的诊疗模式。同时,在实际研究和应用中,医疗AI 存在技术、安全、人才、法律权责等诸多方面的障碍和挑战,需要多方协作应对,共同推动医疗事业的进步和发展。