姜杰 吴菊英 韩青 李艺

[摘   要] 汉字书写评价与指导的信息化需求,促进了书写质量智能评价技术方案的研究以及付诸教学实践。既有“关键笔画+逐步蔓延”方案经历了三年的书写教学实验后,研究站在汉字历史、文化以及日常书写识读立场上,确立了新的书写正确性综合判定思想以及书写细节纠错的评价目标。研究优化先前正确性评价指标体系,采取笔画类型、空间关系等构字要素逻辑地位等同评价策略,设计了基于综合特征匹配的汉字书写正确性评价方案。针对该综合匹配方案,根据实效进行了笔画形态、相对位置等正确性评价指标特征权重的调整。为验证面向教学应用的效果,设计了“恶意书写场景”下的新旧方案的对比测试,结果表明,综合方案对错字的判定率相较于旧方案的93%进一步提高到97.5%,并在错误细节发现上有质的突破,达到89.9%;设计了“数据真实”情境下的一般性测试,结果表明,综合方案在汉字书写教学实践数据抽样样本的正确性评判与人工评判的一致性上达到98.22%,可以更好地支持新一阶段汉字书写教学信息化实践的应用需求。

[关键词] 汉字书写; 综合特征匹配; 正确性评价; 效果测试

[中图分类号] G434            [文献标志码] A

[作者简介] 姜杰(1977—),男,江苏扬州人。讲师,博士,主要从事教育信息化、文字计算研究。E-mail:jiangjie @foxmail.com。

一、引   言

我国政府非常重视汉字书写教育,相关部委近年来发布的《国家中长期语言文字事业改革和发展规划纲要》《教育部关于在中小学加强写字教学的若干意见》等多项文件[1-2]中,皆反复强调汉字书写教育的重要性,甚至提出增设相应课程的要求,其中就包括硬笔汉字书写部分。而与之相对应,实践过程中书法师资缺乏等因素使得汉字书写教育一直处于困境之中,无法获得较高效率的发展。在这一需求的刺激下,既有研究者围绕汉字结构与计算提出种种非常有建构意义的模型,推动了技术的进步;也有部分企业开展了智能汉字书写评价产品的研发与市场化,旨在为学生汉字书写提供智能化指导,借此缓解师资力量不足的矛盾。考察所有这些技术或产品,硬笔汉字书写正确性的评价,是书写质量评价技术的基础与核心。在所有这些研发主体群落中,本团队在手写硬笔汉字正确性评价方面的工作最有实效,也最有代表性。

二、相关研究基础和进展情况

(一)其他团队相关研究

在针对文字(汉字)结构计算的相关领域中,有一些研究在CDL(字符描述语言)、SCML(结构化字符描述语言)基础上,开始对构字元素与规则进行标识与计算,如设计了汉字结构码对传统书法规则进行量化[3]等,用数学领域中的拓扑学理论对汉字的拓扑结构进行分析[4]等,该类型的研究在文字表征基础上对构字元素的识别与测量,与本研究仅在对文字表征的基础研究层面有相似相通之处。

指向汉字书写质量评价的相关研究方案中,部分以笔画匹配为手段对汉字书写笔顺进行识别、判断与展示,研究主要指向笔顺特征的评判[5];部分限定了正确笔顺前提[6],或正确笔画起落点空间位置前提[7],或有限书写格式前提[8],抑或同时限定诸如形体结构及笔画等多个前提,方能准确判定汉字书写正误,其研究成果实现的限制条件过多;部分研究将正确与美观整合在一起进行字体结构的综合评分[9],或对对称性、紧凑性和匀称性等结构规范性方面开展评价[10],其“正确”概念界定不明;亦有研究提出了与本研究目标相近的笔画书写、笔画顺序以及笔画关系正误判断,但其笔画空间关系细化中缺乏相交相接概念,且方案中以节点及边替换的方法,对于较为复杂且书写自由度较大的汉字来说,判断准确度很差,远不能谈及实用[11]。

从技术方法上考察,上述相关研究大都用到笔画类型特征识别与判别、笔画空间拓扑关系判别、特征向量距离计算、关系矩阵计算、模板匹配等其中的某种方法或多种技术方法的组合来实现特定目标。同时,研究方案和技术方法的最终验证大都采用实验数据来测试检验,较少见到应用服务(产品)形态的检验,更罕见一定时间跨度和实践规模下面向应用问题驱动的迭代更新研究。

(二)本团队的既有解决方案

借鉴并突破国内外的相关研究,本研究团队完成了汉字书写描述语言(WDL)设计[12]、GB2312楷体书写字库构建等相关基础研究工作,确立了基于正确性和工整性评价两层体系的书写质量评价方案。其中正确性评价的目标,是对用户书写样本字给出严格意义上的整体判定;其技术实现,是基于“关键笔画+逐步蔓延”思路的模板匹配方案,即在统一建立的汉字笔画元素与结构描述标准的基础上,采集用户手写字信息并将其与标准模板相匹配完成正确性判断的方案[13]。该方案以自动化分析、提取标准模板字笔画、部件、整字三层构字特征为基础,辅助以半人工方式对模板字中诸如唯一类型笔画、特殊复杂笔画等关键性判别笔画进行标注,完成基于标准模板字的正确性特征标记集。对用户样本字的正确性评价的过程,即以对应模板字的正确性特征标记集为查找、配对标准,首先匹配确认关键性笔画(或笔画集),再进一步查找匹配与之具有严格交关系特征以及具有明确位置关系特征的笔画元素;后续不断以确认完成的笔画元素为基础,配合笔画类型与笔画间拓扑关系等特征蔓延匹配剩余的待匹配笔画,直至完成样本字与标准模板字所有笔画的匹配,在此基础上,完成手写汉字的正确性判断。

三、综合匹配正确性评价方案构思

(一)正确性评价技术思想讨论

原“关键笔画+逐步蔓延”的正确性评价方案(下文简称:“原方案”)投入实验后,参加实验的学生及教师普遍反映该方案在正确性评价方面是有效的[14-15],就是说,基本上步入了“可用”的范围。但是,由于实际汉字书写学习中需要指出在笔画及部件层次的各种错误细节,如一个短撇写成短横、横折写成了横折钩、不该交的位置写成了交等,针对这些情况,该方案很容易陷入判断困境,只好要求用户再次书写。总体上说,针对真实的应用需求,原方案在正确性评价精准程度方面依然有一定的局限性。

研究团队一方面在继续优化原方案,另一方面开始了对原方案合理性的质疑,试图寻找关于手写汉字正确性计算的更加合理的理解和解释。考察汉字的发明及历史上的演进,我们发现,“笔画形态”“关键笔画”及个别“重要特征”在构成汉字上并不具有逻辑在先的地位,相反,笔画相对位置有时却可以被认为有更高的“权重”,如图1所示。

在这些汉字的演化过程中,笔画层次的部分特征虽然得以保留,但演化过程更忠诚于其相对位置关系。至少可以认识到,所有汉字构成特征中的各个“分项”,包括笔画形态、笔画交接关系、笔画相对位置等,并没有任何一个是“逻辑在先”的,只能是权重上的差异。再进一步考察当代汉字应用场景,如诸多变形的美术字以及创意类字体,其笔画乃至部件的形态发生了异化与变形后,但只要其相对位置关系正确,并不会产生太多识读层面上的歧义。

总结原有正确性评价方案目标与方案思想的局限,研究团队对新阶段正确性评价方案有了更新的认识与定位。首先,在正确性的评判思想上,站在汉字历史、文化和应用的立场上进行评判,亦即在尊重书法艺术对文字笔画形体和结构适度创作性表达基础上,在适应汉字书写与识读的实际应用场景的基础之上,采取允许适度“意达形变”的评判规则;其次,功能目标上,超越原有整体通过与否的简单判定,站在精确定位错误对象、精准判断错误类型的书写指导需求服务之上,在正确性评判的同时开展细节纠错型评价。

与新阶段正确性评价方案思想、目标相适应,突破既往的“笔画类型逻辑在先,其余诸如空间拓扑等笔画间关系逻辑在后辅助判断”的技术方案,研究团队采用了笔画类型、空间关系等要素逻辑地位等同,并根据实效进行特征权重调整的综合匹配正确性评价技术方案(下文简称:综合方案)。

(二)综合方案的指标体系框架

原方案从书写入手,以书写所得字的形态结构以及书写过程的运笔笔顺两方面构建正确性指标体系。首先由书写径迹得其笔画形态,再通过笔画间关系构成部件,最终由部件通过部件关系(亦或构成更复杂形态的部件)完成整字构建。笔画间关系是指笔画方位关系、笔画组合关系(交接邻)及笔画长短关系,部件间关系以方位关系特征指标为主[16],其指标体系框架见表1。

综合方案指标体系,立足于既有指标体系,依据方案思想与目标,作了体系框架和内容的调整,见表2。在体系框架上,取消构字中间层的部件指标体系,究其原因,其一,部件本身是基于笔画形态和笔画间关系而形成的笔画关系组合体,从识别角度考察是用户书写笔画所得之组合的整体表征,从计算方法考察是正确笔画匹配映射之后基于模板字部件关系标注的加工结果,部件本身不存在超越笔画及组合关系的正确性判断需求。其二,多个部件之间以方位为主的拓扑关系的计算与正确性评判,其可以通过部件间的笔画关系计算得来;同理,原来整字层面一些特征的正确性判定,亦可通过笔画特征及组合关系计算判断。其三,构字元素的计算方法上,扁平单一的笔画元素与关系层面的计算相较于多层结构元素与关系的计算在效率、复杂度、可靠度方面均有较大的优势。在体系内容归属上,笔画数量特征、笔顺特征调整到整字特征指标体系之下,因这两类特征虽可直接关联到具体笔画,但只有从全体笔画层面考察与评判才有意义。

四、综合方案的实现与性能优化实验

(一)正确性判定实现流程与特征权重分配实验设计

综合匹配方案的正误判定,以用户样本字与模板字各指标项特征相似度加权来综合评判。方案实现的主要步骤是:首先,对笔画走向特征、笔画长度比特征、笔画绝对位置特征、相对位置特征,以及交关系等多个指标项分别求解特征相似度矩阵;而后,在此基础上进行各特征相似度矩阵的权重加权求和计算与匹配判定。通常情况下,样本字与模板字相对应的笔画能以高于匹配度阈值或明显高于其他笔画匹配度数值的方式显现,从而实现笔画匹配;对于仍然无法匹配的易混淆笔画(或笔画集),则须进行附加的两两之间笔画邻方位关系的匹配运算,达到最终正确与否的判定,其主要流程如图2所示。

综合方案中,各指标项权重比例分配通过权重实验检验优化,并可在后期教学实践中微调,权重实验设置与效果检验,主要考虑下面几方面因素:其一,评价方案思想对不同指标项宽容程度,即正确性认识与理解的差异,赋予不同指标项特征的正确与否判定权设置;其二,评价方案的实施目标性质,即考试考级目标的整体评判,亦或指导教学目标的细节纠错等;其三,正确性评价所施教对象的汉字书写水平与需求,此项主要以汉字是否为第一母语文字为依据,区分笔画形态、书写过程等特征项严判程度。

权重分配实验是对综合方案的优化测试。实验设计的测试样本字集的选择考虑了以下几个方面:其一,字集基础要求应该是包含各种典型笔画及结构,以使实验对各种情况有较好的覆盖;其二,测试字集的信度要求,字集应该有一定的数量,以获得有信度的统计结果,所谓数量的考量不仅仅是总体数量,亦应该考虑关于笔画及结构的每个类的数量;其三,必须是真实对象的手写字,这样才对将来的手写字判断应用有直接的针对性,团队在此方面有丰富的积累,即来自若干年基于原方案的教学实验所积累的学生手写字;其四,由于此时进行的是针对系统基础性优化,所选手写字应该相对较为“工整”,所谓“工整”的基础条件是,关于该字是否正确应该有明确的判断而不至于无法分辨;其五,所选例字中应该有一定比例的错字,可以初步顺便检验系统对错字的检出率以及可否发现错误细节,而实际上,团队前期实验中所积累的用户手写字中,恰好有一定比例的错字,可以用于支持本基础性测试。

根据上述权重分配与测试字集设计需求,由研究团队中负责书写教学实施、跟踪的研究者(非开发者)从实验积累用户字中筛选1000个字组成测试样本字集。实验对各指标项特征相似矩阵进行多轮次、不同权重配比方案下的综合正误判定结果进行统计,并与专家人工的判定作一致性对比。实验对比结果显示,笔画形态特征、笔画长度比特征、笔画绝对位置特征、笔画相对位置特征、笔画交关系特征,这些指标项权重按1:1:0:7:1配比时,可获得最高62%的专家人工判定一致性,以此权重配比为基础,对混淆未能匹配的剩余笔画集进行邻关系特征附加判定,可实现最高98%的总体判断正确率。