距离论坛开幕还有:

2023年10月26-27日

中 国 • 成 都

【CSGS精华】石祥超:人工智能大数据钻井提速技术现状及探索

时间:2022-04-27 17:14 来源:振威会议 点击:

非常规油气藏的勘探开发工作中,钻井提速一直是被广泛关注的主题,关于“如何让钻井高效提速”的研究也从未间断。第十一届中国页岩气发展大会特别邀请西南石油大学油气藏地质及开发工程国家重点实验室石祥超教授现场分享《人工智能大数据钻井提速技术现状及探索》,共同探讨钻完井大数据人工智能的实现路径。

图为石祥超教授现场演讲画面

嘉宾简介:石祥超

西南石油大学油气藏地质及开发工程国家重点实验室 博士 教授 博导

主要从事石油工程岩石力学及油气井工程领域的研究和教学工作,兼任中国能源学会委员、中关村绿色矿山智库青年专家、《Petroleum》与《油气藏评价与开发》青年编委等,获“西南石油大学优秀共产党员”称号,获省部级科学技术奖3项,主持自然科学基金3项,省部级以上及油田课题20余项,发表论文50余篇,申请发明专利30余项。在深井钻井提速、钻井大数据人工智能、井壁稳定性评价等方面取得了重要成果,成果在塔里木、川渝地区等多个油气田推广应用,取得了显著的社会经济效益。

以下为石祥超教授现场演讲内容

尊敬的各位专家,今天很高兴组委会给这个机会让我做关于人工智能大数据钻井提速方面的汇报。

在钻井中,钻井的提速是我们永恒的主题,自从有了钻井直到今天,关于这方面的研究就从来没有间断过,也关系到整个钻井的周期和成本。人工智能、大数据也是现在国际和国内一个热点话题,我们很有幸在2016年到今天,一直开展了这些方面的研究,作为大学教师,要做最底层的技术研究。我理解的钻井提速是一个系统工程,昨天碰到了西南石油大学的一个校友,也是我师弟,聊到钻井提速是一个系统工程,提速要有系统性的思维。我认为钻井提速研究应该从两个方面来开展:一是“白箱模型”,就是要把井筒从转盘到钻杆、到下部钻具组合,再到钻头,整个系统我们都要研究,包括井筒的流体,我们也有幸在这方面取得了一些成果;再一个就是“黑箱模型”,这就是人工智能和大数据方面的研究,我们也有幸在这方面有了一些突破,希望今天有这个机会跟各位领导、专家、学者一起来探讨这个问题。

我将从以下几个方面来汇报:

一、问题提出与研究进展

钻井里边,整个石油开发,从勘探-钻井-开发-到后期储运,整个石油开发过程都会产生海量的数据。目前来说,我们记录数据的手段有了大幅度提升。有一个文章说过,今天在钻井里边的数据,尤其是在非常规油气钻井生产过程中,每打一口井所产生的数据能达到1T-15T,这样的数据量是非常非常大的。它里边的价值需要被我们挖掘出来,怎么样挖掘对技术提高带来的价值?这就是我今天汇报的主题。

从大数据研究进展来说,我调研了国外的数据,而且一直跟踪着国内外技术的现状,我个人的判断,不一定准确,我认为整个研究处于一个初级阶段。我们调研了国外的很多公司,他们在地震、地震的传感器、在数据的采集等等,包括钻井方面,都在做前瞻性的研究,但是整体来说仍然是处于一个初级阶段。比如说美国德州大学奥斯汀分校,2014年他们就建立了一个针对钻井优化的大数据平台,在2017年发表这篇文章,他们是基于研究生的培养建立的这个平台,但是后面怎么应用,至今我一直在跟踪他们的技术,但是还没有看他们最新的报道。

再一个就是俄罗斯的一个国际咨询公司,他们在SPE上也发表了一个文章,但是这个文章非常短,只是告诉我们他们在做这方面技术前瞻性研究。

再一个就是2017年另外一篇文章,这个文章提出来了传感器技术与传统数据的有效结合,将有助于降低钻井生命的周期,我很认同这个观点。因为我们未来大数据的发展,不单单是要考虑传统数据,我们必须要有传感器技术的发展,来驱动我们整个大数据技术的发展。目前我们国内关注的这一点不是石油行业,在其他工业行业做得非常前沿,但是石油行业相对来说我认为做得还不够。

另外就是Kwantis公司做了一个系统叫ID3,他们2018年发表了一篇文章,这个文章也非常非常短,他们在SPE上发表的文章都是非常非常短的,只是告诉我们有这个技术。他提出的观点也是要把钻机的传感器与传统数据进行结合,提出了这样的观点。

整体来说前面我分享了几个典型案例,整个来说大数据与石油工艺的结合实际上还处于一个初级阶段,我们还有很多的路要走。技术和商业的价值都非常大。但是国外公布这些技术,它的细节和成熟的技术方案并没有提供,那我们应该怎么做?我们应该走自己的路。

我们整个行业所面临的问题,我认为第一个问题就是数据的不规范,这是非常非常重要的问题。我在接触塔里木,还有四川的这些数据,包括中海油的这些钻井数据,都存在这样的问题,这是阻碍我们行业发展的一个非常大的问题,就是数据的不规范,太繁杂、多样,成为我们阻碍行业发展的一个重要技术难题。我们在处理四川盆地的一个区块数据,我们能拿到几十口数据,把不规范的数据处理以后,规范化,可能一个区块有十几口井数据能够用来数据建模,已经非常非常不错了。现在这两年的数据规范性相对于2016年拿到的数据已经要好很多了,证明我们整个行业也在规范数据,但是仍然还是有差距,离国外的,国外的数据就非常非常规范。

再就是目标体系的不明确,我们对于钻井大数据的价值体现在很多很多方面。比如说用来做钻井技术的优化,成本的降低,提高单井产量,地质勘探,甚至是地质科学的研究、教育培训这方面的都有很多。那我们应该从更顶层的价值上去考虑,去建立大数据开发系统。这是我们应该考虑的。

从业人员的考虑,对我们石油行业特色、技术特征、数据价值的研究不透彻,思考不深入。我接触到很多做大数据的,不是我们石油行业的也纷纷介入到石油行业,我们石油行业的大数据与其他行业相比,现在还是发展的初级水平,其他行业,交通、电信等等行业技术发展远远比我们超前。而这些行业的从业人员想进入我们这个行业,但他对我们的技术特征不了解、不透彻。所以说我们要想建立起来石油行业的大数据,还要靠我们自己来领头,可以用他们的技术,但是必须由我们来做好顶层的架构和设计。这是我的一个个人观点。

二、钻完井大数据人工智能实现路径

从钻完井大数据来说,如何实现平台的建设?钻井技术的发展?

分析关联因素,确定数据源。我们知道钻井系统是一个非常复杂的系统,关联的因素非常多,这符合一个复杂系统的特征。从钻井参数,从地层参数,从水力参数,从钻井液参数,我们有几十种参数来影响钻井,影响机械钻速,这是传统模型,没有办法建立一个经典模型。因为建立机械钻井系统钻速方程的话,需要建立一个大数据,它没有对因素、参数做限定,所以我们可以基于大数据来解决问题。

所以我们做的工作就是把影响钻井的因素进行体系分类。第一级的不可控因素就是地层的因素;可控的因素把它分出来,再把地层的机械参数、钻井液参数等参数再进行分级,我们通过这样的分级建立基于人工智能的机械钻速方程。

再就是算法,现在人工智能的算法非常非常多,不下几十种、上百种之多,哪种算法更适合?这是我们需要做深入研究的。我们现在至少研究了五种算法以上,我们认为关于算法的研究是非常必要的。

再一个就是数据的标准化,几年以前我在说,一定要建立我们石油行业的数据标准化。因为2018年大数据行业协会提出来大数据标准化的白皮书,它要统一维度、统一格式,统一来源、统一质量,到目前为止,我们石油行业包括钻井行业关于数据标准的建立,至今还没有看到相关报道、相关研究,这是我们需要做的事情,我们期望未来5-10年内能够把它做成。

再就是传感器技术,传感器技术要让大数据更会“说话”,传感器是大数据的重要数据来源,包括测录井数据,包括实时钻井数据,必须要开发传感器技术,把它加到钻井平台上,让实时数据能够有效获取。这是我们必须要发展的一个物质基础。

三、人工智能预测机械钻速及优化钻井的探索

我们对国外关于人工智能预测机械钻速做了一些探索和调研,调研了很多很多文献,从2011年-2021年,国内外的很多研究,但是目前存在的问题是很多都没有考虑非结构化的数据。什么是非结构化的数据?就是你用什么样的钻头,钻头的型号,在很多研究当中都没有考虑非结构化的数据。因为我们使用PDC还是使用牙轮,钻头还是复合钻头,还是使用螺杆,就是非结构化的数据,在我们传统机械钻速建模当中大多数都没有。

再就是我们做基于大数据钻速方程建立时,大多都是考虑单井,没有考虑一个区块的数据,甚至更大范围的数据。这样你用人工智能建立方程,它的普适性就面临着挑战,你建立的模型必须要具有普适性,才能够推导。目前我们把非结构化的数据考虑进去,我们单井的机械钻速预测的准确率达到92%,区块的达到88%。

现在介绍我们自己做的几种算法:CART回归树的方法,这种方法很直观的,一个是建立了钻速方程,非常非常好用,再就是可以很直观的给我们钻井优化,提供了一个非常有价值的参考。

这是我们实现的过程,我就不讲了,主要是我们把结构化的数据和非结构化数据都经过数据清洗输入到回归树模型当中,最后出来的是一个分杈的回归树,这个回归树对钻井有一个非常好的指导。这是我们做的一个案例,我们可以通过这个树的解析,可以看到影响机械钻速最主要的因素是什么?比如说钻井液密度,钻速、扭矩、钻压,这些钻井参数,包括水利参数对我们是一个什么样的影响,如何调整它的钻井参数?这样的话,通过这个树的模型我们就知道了钻井液密度不能大于某一值,如果大于某一值,它对我们的机械钻速有非常大的影响。当然,由于我们要考虑地层的安全性,所以说这个不能够随意,但是它可以解析出来。再一个就是我们的钻速、钻压、扭矩,应该在一个什么样的量级才能够达到一个比较好的效果?下边就是一个预测的结果,只有各种参数解析出来以后给我们一个优化指导,我们必须要调整到什么样的状态才能是一个最有效、最优化的。

这是优化前的一个预测,下面这个是优化后的预测。我们对同样一个井段,用了大数据人工智能的算法算了以后,认为,在3300m-4300m,如果措施、工艺得当的话,应该有一个非常明显的钻井提高,因为这一段地层特征,地层强度、可钻性没有那么高,但是钻井效率没有提上去,这样就给了我们一个指导,用什么样钻井的参数和工艺能够把这个钻井速度提上去。

我们后面是做了三种机械学习算法的拟合,把钻头的型号开次,地层的岩性这些参数,用一些不同的算法去做一个区块的预测。用了不同的参数来表征它的精度,这是用单井的数据进行建模,用单井的数据进行预测,可以看到单井的预测符合率是非常好的,但是单井的数据建模行不行?我们发现用到一个区块的效果是非常差的,用可决系数进行表征,只有0.15和0.13,说明用单井的数据预测一个区块是不行的,必须要用一个区块去建模。后面这个就是用一个区块的去建模,一个区块的,用了十几口井,三口井建模,我们用到这个区块进行单井预测,可决系数都是0.91,差的一口井是0.76,基本效果是非常好的。所以说要建立这个模型,必须要考虑建立这个模型的普适性,可推广性,它的算法能力。通过我们的研究,用一个区块建模能够达到一个非常好的效果。

四、认识与展望

国内外大数据智能的技术对比,我们知道国内也在建立“梦想云”,长庆也在建立钻井的大数据,但是整个国内外都是处于探索发展的阶段。

未来我们需要做的:1.数据的标准化需要引起整个行业的高度重视,这是做大数据的第一步;2.要做好价值的挖掘;3.传感器技术要综合大数据,有了这些思考和研究,可能未来就能够实现,实时在线智能平台的建设,我们期望在“十四五”、“十五五”,中国的技术走在世界的前列。

好,谢谢各位专家!