大模型在油气行业的落地实践应用

智通云联

+ 关注

2024-07-11 16:04

735次阅读

聊天小达人ChatGPT的出现，引爆了整个科技行业乃至人类社会，被誉为新一代的工业革命，也让背后的大模型技术被大家熟知。那么，什么是“大模型”呢？

“大模型”就是大型语言模型的简称，一个技术名词。WIKI百科对大语言模型是这样解释的：

大语言模型（英语：large language model, LLM）是一种语言模型，由具有许多参数（通常数十亿个权重或更多）的神经网络组成，使用自监督学习或半监督学习对大量未标记文本进行训练。大型语言模型在 2018 年左右出现，并在各种任务中表现出色。尽管这个术语没有正式的定义，但它通常指的是参数数量在数十亿或更多数量级的深度学习模型。大型语言模型是通用的模型，在广泛的任务中表现出色，而不是针对一项特定任务。

更直白的解释是，大语言模型是一种主要基于深度学习和自然语言处理（NLP）技术的人工智能技术。这些模型的设计旨在理解和生成自然语言，就像人类一样。

大模型的技术特征一个是“大”，另一个是“通用性”。“大”体现在大模型的参数量大、运算量大、数据量大、算力也要大。这种规模的模型可以更好地理解和生成复杂的语言结构，因为它们可以学习到大量的细微语言特征和语境信息。“通用性”，意味着可以在各种不同的任务和语言上进行训练和使用。一旦训练完成，可以在多个任务和领域中应用，无需针对每个特定任务进行单独的训练。

大模型之所以获得各个行业青睐，主要在于具备以下优势：

关联推理能力强：可以学习掌握大量跨模态知识模式，隐空间的关联推理能力强，具有很强的泛化能力；
多任务通吃：一套大模型处理各类跨模态任务；
人工成本低：依赖人工schema设计与数据标注比较少；
适配能力强：可通过调优训练或prompt对话等方式来适配新的领域和任务。

目前，大模型在国内外可谓是百花齐放。在美国，以OpenAI、Anthropic等初创企业和以微软、Google为代表的科技巨头带领着美国在AI大模型的道路上蒙眼狂奔，最大参数已达到5620亿。在国内，多家中国企业、科研院所积极进入大模型竞争赛道，涌入大模型研发行列，竞相开发各自的大模型，在短时间内国内呈现“百模大战”的竞争态势，也涌现了许多具有划时代意义的大模型，如OpenAI的GPT-3、华为云的盘古NLP、百度的文心等。

多数大模型依然应用在广域性知识领域。如果将大模型应用在特定行业，例如油气行业，面临以下几方面挑战：

智通云联深耕油气行业知识管理十余载，拥有千万级石油石化行业专有微调语料，训练参数达百亿级，采用知识图谱和大模型结合的技术路径来建设油气领域大模型。知识图谱的优势在于准确性、可解释性；大语言模型的优势在于涌现能力、适用范围广。两者结合可以发挥各自优势，解决诸多油气行业场景问题，提高大模型在实际应用中的准确率。对于准确性比较高的生产性问题，知识图谱为大模型提供数据、约束内容范围，保证回答内容真实可信；在图谱构建阶段，利用大模型衍生出各类加工模型，提高图谱构建速度、降低人工工作量。

考虑到大模型训练需要大量GPU算力资源和油气行业通用语料，及油气领域大模型通常由大型区域公司、集团公司整体布局建设，智通云联推出油气行业基础大模型快速构建服务模式，方便用户在局域网内训练企业专属“油气行业基础大模型”。同时，用户可进一步开展多专业微调和强化训练，形成不同“专业应用模型”，实现大模型应用快速落地。

大模型在油气行业的落地实践应用

大模型具有强大的泛化能力，单一模型可用于处理各种类型任务，如文本分类、实体识别、情感分析、问答系统、文本生成等。这意味着，一个油气领域大模型可以同时处理多项不同任务。在预训练阶段，油气领域大模型积累了丰富油气行业知识和常识，添加少量如企业标准、历史方案、公文等的细分领域特定数据，就可以得到适应特定任务或领域的大模型，极大减少了开发、维护不同模型的复杂性和成本。

智通云联自研油气领域大模型，已实现自动学习油气行业知识、智能识别任务类型、准确识别内容中的违规部分及对应法规条目、总结归纳油气行业知识、编写提纲性内容的功能。现和石油石化勘探开发研究领域知名研究院联合，针对油气上游勘探开发相关业务，进行油气基础大模型训练、领域模型微调和强化训练，在研究类典型场景、生产类典型场景进行试点。

油气领域大模型训练成功后，可以在全业务领域的不同岗位上发挥作用，提供方案编写、报告审核、问题研判、知识问答、工作策略推荐等服务，大幅度提高业务人员的工作效率和质量，全面赋能企业数智化转型升级。典型应用场景如下：

--油气田百事通：通过对某一油气田开发过程的勘探开发数据、开发方案等资料的学习，大模型可以全面掌握该油田的勘探开发技术细节、地质油藏参数、单井历史及钻采参数等知识，帮助不同岗位业务人员随时、全面了解该油田的历史背景、开发现状和未来趋势，将数据获取时间缩短80%以上，全面提升油田工作者的工作效率。

--技术研究助理：利用油气田勘探、研究对象基础资料、历史研究成果等内容对大模型进行微调训练，可形成勘探开发技术研究应用模型。该模型能够帮助研究人员快速搜集数据，辅助编制研究报告、设计报告，并智能审核报告成果，把传统“人工研究”转变为“大模型研究、人工审查”的新模式，大幅度缩短研究周期，提升整体研究水平。

--生产作业督导：基于对现场一线生产作业规程和历史资料学习，大模型可以：在基层队生产作业任务开展前，智能设计操作方案和安全作业指导书；作业中，即时提醒操作标准规范；作业后，智能编写作业总结报告。通过智能化督导，减少作业过程弯路、提升作业效率，将作业中人的不安全行为风险降到最低，全面提升安全生产的保障能力。

--分析决策秘书：针对勘探部署、井位论证、开发方案论证、生产指挥、应急指挥等重大决策场景，油气大模型可以为决策者及时、准确提供数据、标准、案例等决策依据，智能研判问题、推荐策略建议，全面提升勘探开发重大决策的科学性和高效性，有效降低勘探开发风险，最大程度提高油气开发效率。

- END -

[免责声明]

原文标题：大模型在油气行业的落地实践应用

本文由作者原创发布于36氪企服点评；未经许可，禁止转载。