李亚玲,李 飞

(1.深圳技术大学,广东 深圳 518118;2.通化师范学院,吉林 通化 134002)

0 引 言

如今,人们的生活节奏逐渐加快,使得大学生面临学业、就业和生活的压力越来越大,导致心理问题凸显。相关统计结果显示,心理健康疾病是造成抑郁等问题的重要原因,对学生的健康发展和学校的稳定运行都会造成一定的影响[1]。为此,大学生心理健康问题引起社会各界重点关注,及早发现大学生是否有心理健康问题,有助于及时提出治疗或辅助预防方案,帮助学生健康发展,促进学校稳定运行,同时也具有重要的社会意义[2⁃3]。

传统心理健康测评方法多是采用量表或调查问卷的形式开展,在调查对象、调查结果准确率方面均会存在一定的限制。伴随互联网技术的兴起,将网络技术应用于心理健康测评已成为新的趋势,调查对象能够在隐秘性较好的环境下自我测评,可减小其心理压力。目前,盛行的互联网软件,包括QQ、微信、微博和在线论坛等均会不同程度的记录用户状态,这些软件数据也能够辅助专家判断用户心理健康。由此可见,互联网测评系统是一种应用性较强的大学生心理健康测评方式[4]。

刘德喜等人提出一种在线论坛用户心理健康自动评估方法,设计评估框架,对反映用户心理康健状况的数据分层次分析,采用不同方式融合用户心理数据,获取较为全面的测评方法,但系统耗时较长[5]。王慧基于Web设计大学生心理健康咨询服务系统,对用户需求仔细分析,并且将系统分为不同的功能类别,构建完成整个心理健康咨询服务系统,帮助用户更好地进行心理服务,但召回率不高[6]。潘芳选取的研究对象为老年人,针对这一群体采用不同理论模式进行心理健康测试,评估不同模式优势与不足,综合各种理论模式的优势提出一种心理健康评估方法,但准确率有待提高[7]。杨倩等人研究对象同样为老年人,对其分析了系统需求,设计了总体心理健康评估框架并逐一分析,但该系统在运行效率上有待改进[8]。

为进一步提高当前心理健康测评系统性能,本文设计了一种基于多特征融合的大学生心理健康智能评测系统。通过实验结果显示,所设计系统具有很好的应用性能。

1 系统功能架构设计

本文设计大学生心理健康测评系统,需要具备用户管理、测评内容、数据分析、结果查询等功能,根据系统设计需求,构建大学生心理健康智能测评系统架构,如图1所示。

从图1的架构中可以看出,本文设计的测评系统包含了大学生用户信息管理、测试、特征分析、心理健康评测和信息查询与存储共五大模块,其中,大学生用户信息管理模块主要负责完成用户注册、登录、密码设置与修改。登录完成后,在测试模块通过量表进行心理测试,采集用户心理数据,同时同步采集用户QQ、微信等软件发布信息,将采集到的数据输入特征分析模块进行特征提取与分类。再采用测评模块融合不同特征数据,获取用户心理健康状况,通过信息查询模块输出,并同步存储在系统内,作为下一次该用户心理分析的辅助信息,也可用作学生心理档案,帮助学校和老师深入了解学生心理状况,及时发现问题,尽早给予心理辅导[9⁃10]。

图1 大学生心理健康智能测评系统功能架构

2 系统关键技术分析

在大学生心理健康智能测评系统设计过程中,重点需要设计量表参数,以便更为准确地采集用户信息。此外,心理健康特征分析及测评也非常重要,该过程需要提取大学生用户心理健康状况数据,并采用多特征融合的方式深入研究特征数据,完成心理健康智能测评[11⁃12]。

2.1 量表测评分析

测评模块采用量表测试和社交软件数据分析相结合的方式进行研究,量表测试结果包括测试题目、测试内容、测试时间、用户信息等内容。测评量表字段设置如表1所示。

表1 测评量表字段设置

测评量表内容管理由管理员负责录入,仅有管理员具有内容修改、问题属性设置、答案选项管理、量表是否开放等权限,只有当量表在开放状态时,才可以进行量表数据采集。

2.2 心理健康特征提取

大学生心理健康特征主要包括行为特征、属性特征、内容特征和社会关系特征,其中行为特征是指用户在社交网络上的行为表现,包括点赞、评论、在线浏览痕迹等。属性特征是指用户个体信息,包括姓名、年龄、性别、职业、爱好等。内容特征包括用户在社交软件上的聊天内容以及发布帖子等[13⁃14]。社会关系特征是指在整个社交网络中,用户之间的相互联系,表现为相互关注数、粉丝数等。

首先推断所采集的数据信息是否有效,若为有效的数据信息,则将采集到的数据信息转换为系统直接处理的数据形态,这需要引入时间窗口的概念进行大学生心理健康特征提取。批量转换量表数据以及用户社交网络数据,划分不同样本,一个样本对应一个窗口,使用该时间窗口内的数据完成特征提取,并将特征提取结果分类标记。此处选取的时间窗口为24 h,以获取更为全面的大学生用户心理健康数据信息。

2.3 多特征融合

为进一步挖掘大学生心理健康状态,获取更准确的用户心理特征,对大学生心理健康数据进行多特征融合分析。将多渠道获取的心理健康数据作为整体进行数据分析,为智能测评提供依据。神经网络是一种有效的非线性数据融合方法,能将输入空间转换到隐层空间,在隐层空间中分析数据更为便捷。因此,神经网络具有较强的数据处理能力,且满足大规模数据处理需求,适用于多特征融合分析[15]。

假设神经网络中隐层使用的变换函数为高斯函数,那么第i个单元所输出的径向基函数为:

式中:xi表示第i个单元的心理健康特征输入量;si表示隐层中第i个单元的特征变换量;β表示第i个单元的控制参量。输入提取得到的大学生心理健康特征数据,依据上式计算得出径向基函数,即可实现多特征融合,完成大学生心理健康智能测评。系统实现流程如图2所示。

图2 测评系统实现流程图

3 实验分析

为验证本文设计系统的性能,在Matlab软件下搭建模拟环境测试系统。实验环境参数如表2所示。

表2 实验环境参数

在上述实验环境参数条件下,进行用户操作界面设计,如图3所示。

图3 用户操作界面

本实验选取Student⁃Life和Reach Out在线论坛帖子数据作为数据源。Student⁃Life数据集是达特茅斯学院研究得出的数据集,共记录49个学生连续10周的心理感知数据,包括学业数据、在线心理测试数据、问卷调查数据等。Reach Out在线论坛帖子包含用户发帖信息、发帖时间、被点赞数以及浏览数等。分别从2个数据集中各选取500万数据,共计数据集1 000万。将数据集均分为10等份,其中6份用于神经网络模型训练,4份用于实验测试。

选取以下实验指标进行验证分析:

1)特征融合精确率:特征融合精确率直接关系到系统测评结果的准确性,因此选取该指标分析。

2)系统召回率:召回率一般指查全率,是指从系统查询得出的信息与系统信息总量的比值,测试系统召回率,验证本文系统性能。

3)运行耗时:耗时通常是衡量系统性能的重要指标,将本文系统与文献[6]、文献[7]、文献[8]进行对比。

特征融合精确率对比结果如图4所示。根据图4不同系统的特征融合精确率对比曲线可以看出,本文系统的精确率始终最高,平均值在90%左右,在其他三种文献结果中,文献[6]具有较高的特征融合精确率,最高能达到80%,文献[7]和文献[8]的精确率较低。可见本文基于神经网络进行多特征融合,充分利用了神经网络并行处理数据能力,获取了准确率较高的特征融合效果。

图4 特征融合精确率对比

系统召回率越高,表明查全率越高,系统性能更为优越。本文系统与文献[6]、文献[7]、文献[8]系统的召回率对比结果如表3所示。

表3 召回率对比结果 %

分析表3数据能够发现,本文系统具有较高的数据召回率,在不同测试数据量条件下,召回率均较高,且远远高于其他文献结果,可见本文系统具有一定的优势。

系统运行耗时统计结果如图5所示。

图5 系统运行耗时对比

图5中,本文系统运行耗时在实验次数达到200次时,耗时升高,达到30 s左右,但文献[6]、文献[7]、文献[8]系统的运行耗时远远高于本文系统。可见本文设计的智能测评系统具有较强的实际应用性,这是因为本文系统设计中采用神经网络融合特征数据,运行速率快,提高了系统运行速度。

4 结 论

本文基于多特征融合方法进行大学生心理健康智能评测系统设计,通过引入多特征融合方式处理心理数据,提高了测评系统准确率,且借助于神经网络快速处理数据的优势进行特征融合分析,提高了系统运行效率。在实验中采用两个数据集进行系统测试,结果显示,所设计系统整体性能较好。