赵 杰 李春华

摘 要:利用测井资料实现岩性识别对于储层评价具有重要意义,采用概率神经网络(PNN)和自组织特征映射神经网络(SOM)的模式识别方法,分别建立测井岩性识别模型,并利用该模型对样本进行预测。仿真结果表明,建立的模型用于岩性识别具有预测精度高、易收敛和自动聚类等特点,对于岩性类别的划分是准确和可靠的,为相关领域的研究提供了新方法。

关键词:自组织特征映射神经网络;概率神经网络;岩性识别;预测

中图分类号:TP183

0 引 言

岩性识别是储层评价的重要工作之一,是求解储层参数的基础。测井在勘探中的作用和地位正在日益提高,测井参数值是地下岩石的矿物成分、结构和孔隙度等的综合反映,是岩性分析的基础资料。对于一组特定的测井参数值,它就必然对应着地层中的某一种或某几种岩性。在分析岩心和测井参数对应特征的基础上,划分岩心的岩石类型,并从各类岩石中读取能够代表岩样的测井参数值,确定岩性与测井参数对应关系。

由于井下地质构造的复杂性和测井参数分布的模糊性,传统的数理统计等方法难以准确地反映测井资料与地层岩性的非线性映射关系,识别精度有限,采用具有聚类功能的人工神经网络——自组织特征映射网络(SOM)和概率神经网络(PNN)完成测井资料的岩性识别。采用神经网络对测井数据进行岩性识别,具有较强的自组织和自适应性,有较高的容错能力。

1 概率神经网络(PNN)

概率神经网络(Probabilistic Neural Network,PNN)是基于贝叶斯最小风险准则和Parzen窗的概率密度函数方法发展而来的一种并行算法,是径向基函数模型的发展[3]。它直接考虑样本空间的概率特性,以样本空间的典型样本作为隐含层的节点,其网络权值是模式样本的分布。

概率神经网络由四个结构层组成:输入层、样本层、累加层和输出层。输入层的节点数是样本向量的维数,将所有样本不变地传给样本层后,样本层将输入向量的各个分向量进行加权求和,然后再用一个非线性算子进行运算,非线性算子取高斯函数:

式中:[WTHX]X为输入向量;W[WTBX]为权值向量;1/R2为平滑因子。オ

然后将计算结果传递到累加层[5],累加层各个节点只与相应类别的样本节点相连,计算同类样本输出值的和,权值都为1。网络的输出层,即竞争层采用胜者为王的学习规则,使具有最大概率的向量的输出为1,其他类别的向量输出为0。这样网络就按Bayes决策[6]将输入的向量分配到具有最大后验概率的类别中去。

2 自组织特征映射神经网络(SOM)

自组织特征映射网络(Self[CD*2]Organizing feature Map,SOM),接受外界输入模式时,将会分为不同的对应区域,各区域对输入模式具有不同的响应特征。自组织映射学习算法包含:竞争、合作和更新三个过程[7]。

(1) 在竞争过程中,确定输出最大的神经元为获胜神经元。由于神经元的激励函数为线性函数,神经元的最大输出取决于其输入u琲=∑Nj=1w﹊j獂璲,即输入向量[WTHX]X[WTBX]=猍x1,x2,…x璑]玊和权值向量[WTHX]W[WTBX]璱=[w﹊1,w﹊2,…w﹊N猐玊,i=1,2,…,M的内积。而该内积在输入向量和权值向量均为归一化向量时,等价于输入向量和权值向量的欧氏距离最小。所谓欧氏距离就是n维欧氏空间中向量[WTHX]Y[WTBX]=[y1,y2,…,y璑]和向量[WTHX]Z[WTBX]=[z1,z2,…,z璑]的距离,其值为∑ni=1(y璱-z璱)2。所以当输入向量为[WTHX]X[WTBX]且第c个神经元获胜,满足条件:‖[WTHX]X[WTBX]-[WTHX]W[WTBX]珰‖=┆玬in‖[WTHX]X[WTBX]-猍WTHX]W[WTBX]璱‖(i=1,2,…,M) 。И

(2) 在合作过程中,确定获胜神经元的加强中心。拓扑邻域的中心就是在竞争过程中得到的获胜神经元,在邻域范围内的神经元为兴奋神经元,即加强中心。

(3) 在更新过程中,采用Hebb学习规则[8]的改变形式,对网络上获胜神经元拓扑邻域内的神经元进行权值向量的更新。

自组织特征映射神经网络是一种竞争式学习网络,共有两层,输入层各神经元通过权向量将外界信息汇集到输出层的各神经元。采用Kohonen算法,获胜神经元对其邻近神经元的影响是由近及远,由兴奋逐渐转变为抑制,其学习算法中不仅获胜神经元本身要调整权向量,它周围的神经元在其影响下也要程度不同地调整权向量,调整力度依邻域内各神经元距获胜神经元的远近而逐渐衰减。最后使输出层各神经元成为对特定模式类敏感的神经细胞,对应的内星权向量成为各输入模式类的中心向量。并且当两个模式类的特征接近时,代表这两类的神经元在位置上也接近,从而在输出层形成能够反映样本模式类分布情况的有序特征图[9]。

3 基于神经网络的岩性识别

通过对已知井段测井数据进行学习,来预测同一地区其他井段的岩性。

3.1 岩性样本

为了探讨神经网络在岩性识别中的具体应用,选择一批测井岩性数据用于岩性识别建模工作。选择某地区的资料进行研究,该地区属于碳酸盐地层,选取的样本岩性有3种,即泥岩、砂岩和石灰岩。影响岩性的重要因子有5个,补偿中子空隙度CNL、补偿密度曲线DEN、声波时差DTC、自然伽玛GR和微电阻率RT。通过对历史资料的分析,获得了6组样本数据。

在各种测井工作中,由于不同的测井响应具有各自的测量量纲,数值大小不一,差异较大,无法直接进行定量比较,因而必须对测井数据进行处理,对其归一化,将非地质因素校正到同一水平上。在归一化处理后的测井响应值是没有量纲的,而且其数值在[0,1]范围内变化,消除了不同测井响应在量纲和数量级上的差异。原始数据归一化后的结果数据列出如表1所示。

3.2 PNN网络岩性识别仿真

建立PNN网络,其输入层有5个神经元,分别对应5个影响因子,选取的样本有三种不同的岩性,利用二进制格式描述这三种岩性,作为目标向量。利用下面函数创建PNN网络用于岩性识别。

net=newpnn([WTHX]P[WTBZ],[WTHX]T[WTBZ],SPREAD);其中:[WTHX]P[WTBZ]为输入向量;[WTHX]T[WTBZ]为目标向量;SPREAD为分布密度。

运用建立的模型对学习样本仿真,输出结果如表1最后一列所示。

由表1的仿真结果可知,网络成功地将岩性样本分为三类,这与实际情况一致,并且可知第1类为泥岩,┑2类为砂岩,第3类为石灰岩。接下来用一组测试样本,检验模型的未知岩性的识别能力。测试样本数据如表2所示。

运用建立的模型对上表的岩性影响因子测试样本进行仿真,输出结果如表2最后一列所示。仿真结果显示该组测试样本属于第3类,即为石灰岩,与期望输出一致。可见,PNN网络能够正确识别未知岩性样本。

3.3 SOM网络岩性识别仿真

SOM神经元数的选取与样本有多少模式有关。如果神经元数较少,对输入样本类别进行“粗分”,如果神经元数较多,可将输入样本类别“细化”。

选取竞争层神经元为2×3的组织结构,通过距离函数linkdist来计算距离,利用下面函数创建SOM网络,用于岩性类别的“粗分”。

由于网络的初始权值相同,权向量是重合的。利用表1的学习样本对网络训练,训练步数的大小影响网络的聚类功能。不断调整训练步数,训练100次后,神经元就可以自组织分布。网络训练结束后权值也就固定了,以后每输入一组新的样本,竞争层的神经元开始竞争,激活与之最为接近的神经元,从而实现岩性自动识别。运用建立的SOM网络对学习样本和测试样本进行仿真,聚类结果如表3所示。样本序号类别激发神经元索引

聚类结果表明学习样本分为三类,序号为1,2的样本为第1类,激活第5个神经元;序号为3,5的样本为第2类,激活第4个神经元;序号为4,6的样本为┑3类,激活第1个神经元。而测试样本激活第1个神经元,属于第3类,由学习样本可知,为石灰岩。可见,SOM网络能够准确地划分岩性类别。

将上述岩性样本类别“细化”,或者增加更多不同类型的岩性样本,那么应该增加竞争层神经元的数量。选取竞争层神经元为3×4的组织结构,创建SOM网络,随着神经元个数的增加,增加训练次数,当训练1 000次时,神经元就可以自组织分布。运用建立的SOM网络对学习样本和测试样本进行仿真,聚类结果如表4所示。[JP]

参照样本实际分布曲线,分析聚类结果,当竞争层的神经元数目较多时,几乎每一个样本都被划分为┮焕唷*从图1可以看出,序号1和2样本、序号3和5样本分别在高维空间相近,而聚类后激活的相应神经元的位置也接近,序号4和6样本相仿程度更高,聚类后激发了同一个神经元1,这和实际情况是吻合的。测试样[LL]本与序号4和6样本极为接近,聚类后激发了同一个神经元,即网络的第1个神经元,所以样本属于第4类。增加竞争层神经元的数量,可以使岩性类别划分更加详细,岩性识别准确。

4 结 语

采用概率神经网络和自组织特征映射神经网络对岩性进行自动识别是准确的。PNN网络不需要训练,具有结构简单、追加样本容易的特点,是一种具有较强容错能力和机构自适应调整的网络,但需要预设目标向量。SOM网络具有效率高,无需监督,能自动对输入模式进行聚类的优势,但输出层的神经元数目多,网络规模较大。仿真结果表明这两种网络用于岩性分类和识别是准确和可靠的,对用于油层、煤层及其勘探等领域,具有重要的参考价值。

参 考 文 献

[1]于代国,孙建孟,王焕增,等.测井识别岩性新方法[CD2]支持向量机方法[J].大庆石油地质与开发,2005,24(2):93[CD*2]95.

[2]Gao T H,Cao J Y,Zhang M L,Qi J B.Lithology Recognition during Oil Well Drilling Based on Fuzzy[CD*2]adaptive Hamming Network [A].Proceedings of the Sixth International Conference on Intelligent Systems Design and Applications[C].2006:574[CD*2]578.

[3]Specht D F.Probabilistic Neural Network and General Regression Neural Network [M].McGraw-Hill,1996.

[4]Tao Song,Mo Jamshidi,Roland R Lee,玡t al.A Novel Weighted Probabilistic Neural Network for MR Image Segmentation[A].IEEE International Conference on System,Man and Cybernetics[C].2005,3:2 501[CD*2]2 506.

[5]Han J,Kanmber M.Data Mining:Concepts and Techniques[M].San Francisco:Academic Press,2001.

[6]Chuhee Lee,Euisun Choi.Bayes Error Evaluation of the Gaussian ML Classifier[J].IEEE Trans.on Geoscience and Remote Sensing,2000,38 (3):1 471[CD*2]1 475.

[7]杨建刚.人工神经网络实用教程[M].杭州:浙江大学出版社,2001.

[JP2][8]Parag C,Pendharkar A.Data Envelopment Analysis[CD*2]based Approach for Data Preprocessing[J].IEEE Trans.on Knowledge and Data Engineering,2005,17(10):1 379[CD*2]1 388.[JP]

[9]韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006.

[10]飞思科技产品研发中心.神经网络理论与Matlab 7实现[M].北京:电子工业出版社,2005.[HJ0][HJ]

作者简介 赵 杰 女,1977年出生,黑龙江人,硕士研究生,讲师。研究方向为自动化与智能控制。