吴烨

前言

半个世纪以来,我国债券行业发展迅速,从二十世纪八十年代初启动国债和企业债的发行,2005年第一批短期融资债券发行,再到2015年证监会出台《公司债券发行与交易管理方法》,证明我国证券市场正在不断发展壮大。由百度百科最新数据显示:2001年我国债券净供应只有不到4000亿人民币,但到2012年就已超过3.9万亿人民币;2001年时唯有五个企业发行净融资48亿人名币的信用债,到如今仅仅单月信用债净供给就逼近4000亿人名币。截止到2018年12月,国际清算银行统计显示中国债券市场余额达8380000亿人民币,在亚洲排名第二、全球排名第三,此中公司信用类债券余额排在亚洲首位、全球排名第二。俨然已经发展为世界中颇具规模且占有相当地位的债券交易市场。

一、债券及债券风险

(一)债券相关定义

债券是政府、银行、企业等向社会筹集资金时,按法定程序向投资者刊行并应诺依照必需的利率支付息金于指定日清偿还本金的有价证券。债券按照发行人来归类,首先可先考虑发行的主体:国家、中央银行、政策性银行、金融或非金融企业,其发行的债券分别是国债、中央银行票据、政策性金融债券和企业债券。其中因为国债、央行票据和政策性金融债券发行的主体,它们的信用风险基本不被投资者考虑,也常被人称为“利率债券”。除此,近年来发展迅速的企业债,由于其发行企业可能存在的违约性和不确定性,投资者在投资时必须考虑其信用风险,因此常有人把企业发行的债券称之为“信用债券”。

(二)债券信用风险概述

按照驱动因素,将投资债券带来的风险分为信用风险、市场风险、流动性风险、操作风险。此中信用风险在风险领域中常被人认为是年代最久远的一种金融风险,它是指受信人因为自身的一些原因未依照签订契约上的规定履行相应的义务,给授信人带来的风险。在债券领域里多发生于信用债券操作中,多年来世界范围内由于信用问题导致的违约事件层出不穷,因此,信用风险也是近现代金融风险之中最需要引起人们重视的一种风险,它在各种金融风险之中总是位列首位。本文将着重围绕债券风险中公司企业的信用风险来开展内容。

二、研究意义

虽然我国对债券信用风险评估有建立相对完备的信用评估体系,通过选用相应的模型、选用指定指标计算可能的违约率,但在评估过程中对其中众多信息所产生数据的管理确十分不到位,很多时候会导致效率不高,预测不够准确。对此,新兴的机器学习算法或许可以在一定程度上缓解这个问题,提高风险评估模型的准确性和效率。通过使用大量数据对机器进行“训练“,使其建立一种模式,对下一次是否会发生债券违约进行更加准确的判断。另外,机器学习方法在个人信用评级和其他平台的借贷违约预测上得到越来越多的研究,但在债券市场违约风险预测评估这一方面,并没有很多详细说明结合预测的文章,本文希望结合近年来发展颇快且回报颇高的机器学习算法来预测债券市场风险,以此也丰富了债券信用风险预测的框架。

三、机器学习在债券风险评估中研究

(一)模型的选择

主要运用机器学习来对个人信用风险做出评估预测。以机器学习为工具,选用多项式Logistic回归、决策树、神经网络、随机森林这四种各异的算法来建立模型,以此来对个人信用风险进行评估。最后对得出的结果数据进行比较,从而观察哪一种机器学习方法更有优势,并对最后的结果做出原因分析,对于模型存在的不足之处给出相应的意见。选用的多项式Logistic回归、决策树、神经网络、随机森林机器学习方法在目前已经比较成熟,国内外的学者都已经做过种机器学习方法的相关研究,已有人把这些算法运用到信用评级上去。且每种方法都有对应的软件可以进行操作,无需担心算法过于复杂而无法得到结果。

(二)操作流程

对与机器学习在个人风险评估的过程中,首先选取内容符合且数量相对合适的数据。其次选用多项式Logistie回归、决策树、神经网络、随机森林这四种机器学习算法分别构建四种算法对应的模型。之后对于四种不同的模型,选用不同的参数估计法进行参数估计。最后利用一些操作软件,如Eviews、SPSS、R等,操作得到模型的估计结果。再对结果进行比较,这其中分为数据层面的对比分析和模型层面的对比分析,最后对模型进行评价分析。这样就将机器学习应用到了债券风险预测当中。

(三)模型结果预测

本文将更倾向于使用Logistic回归能得到不错的预测概率,因为在债券风险评估中,其结果通常会被认定为“违约”或者是“不违约”,本质上是一个二分类问题。对于这种问题,Logistic回归无疑是一种非常好的评估选择,因为其本身适用的范围就是二分类问题,且最后结果的解释性也很强,通过特征值的权重就可知这些特征对是否违约的影响大小,一般特征权重越高,对是否违约的影响越大。