【第四届数据生产力大赛】统一数据管理,发掘数据资产价值,奠定延长石油数字化转...
统一数据管理,发掘数据资产价值,奠定延长石油数字化转型基础
1 企业简介
陕西延长石油(集团)有限责任公司(简称“延长石油”)是集石油、天然气、煤炭等多种资源高效开发、综合利用、深度转化为一体的大型能源化工企业,隶属于陕西省人民政府,注册地在延安市,排名世界500强企业第265位。
延长石油产业主要覆盖油气探采、加工、储运、销售,石油炼制、煤油气综合化工,煤炭与电力,工程设计与施工、技术研发与中试、新能源、装备制造、金融服务等领域。目前已形成原油生产能力1200万吨/年、炼油加工能力1740万吨/年、天然气产能53亿方/年、煤炭产能1100万吨/年、化工品产能670万吨/年、煤制油110万吨/年、乙醇10万吨/年。特别是经过10余年的持续努力,探索走出了一条煤油气资源综合利用、深度转化的差异化、特色化发展道路,在特低渗透油气田勘探开发、煤油气资源综合利用、节能环保等领域掌握了一批国际国内领先的前瞻性创新技术,建成投产了全球首套煤油气资源综合化工园区、全球首套煤油共炼和合成气制乙醇等多个工业示范项目,正在开展多项高端能源化工技术中试和示范,基本形成了综合型能源化工产业格局,成为保障国家能源供应的重要力量和地方经济发展的重要支柱。
2 项目背景
为了满足延长石油集团对于数据资源整合管控和便捷共享服务的需求,解决目前数据分析类项目多头建设造成重复投资、点对点集成难以集中管控、数据标准不统一造成分析结果良莠不齐、数据分散难以形成数据资产等问题,集团公司将建设统一的数据资源共享平台。
经过前期对相关部门的调研,我们发现在数据分析领域,集团公司普遍主要存在以下问题:
1)数据管理:数据组织未完全建立起来,不能形成完整的管理体系;
2)数据运营:数据项目建设后没有运营服务组织对数据进行统一管理,还是谁建设谁使用,造成建设投资的浪费;
3)数据标准:部分数据标准不统一、统计口径不一致;
4)数据采集:数据多头重复采集、渠道分散多、数据质量不高,增加了后续分析人员的工作负担;
5)数据资源:数据资源没有统一利用,跨部门的分析场景较少,集团管理层无法全面及时了解“已经发生什么、为什么发生、正在发生什么、将会发生什么”;
6)平台及工具:现有版本的SAP BW系统不适应大数据的处理,当前版本的SAP BO软件不再更新,从技术上建议升级或者替换。
综上所述,现有的数据仓库平台、商务智能软件在先进性上已经不能紧跟技术趋势的发展,集团公司亟需以适度超前、分步建设的思路搭建符合延长实际情况的数据管理平台。
3 解决方案
根据集团数字化转型远景目标和“十四五”信息化规划的具体要求,延长石油集团数据资源共享平台(以下简称“平台”)建设的战略目标是建立全集团统一的数据资源管理、分析、共享和服务四位一体的平台,打造集团及各下属单位统一的数据资源共享中心、分析应用共享中心、接口服务共享中心,实现大数据分析在采供、生产、经营、销售和服务等业务领域的深化应用,提高经营决策分析能力与水平,以数据驱动技术融合、业务融合、创新融合,推动生产制造、综合服务迈上价值链中高端,促进集团数字经济发展壮大。
数据资源共享平台的战略定位是集团及各下属单位统一的数据资源中心,属于技术支撑平台的重要一环。平台集数据采集、存储、建模、治理、分析、共享为一体,建立财务、生产、采购、销售、客户服务等业务领域的数据资源池,形成并运作延长石油的数据资产,为进行跨系统、跨业务、跨组织的综合数据分析与服务提供高质量的数据来源和分析结果,支持科学决策,驱动业务创新。
延长集团数据资源共享平台基于数据资源的全生命周期各个阶段进行架构建设,包括数据采集、存储、使用(展现、服务、交互)以及贯穿始终的治理工作。产品上使用主流的数据仓库、商务智能分析、大数据、数据集成产品;产品之间的集成、平台融合工作、客户化定制需求则通过二次开发完成,其技术组件会选用较为先进的互联网开发技术,如采用微服务架构、前后端分离方式等。
延长集团对于数据资源共享的需求目前以结构化为主,后续会加入对于非结构化的挖掘分析功能。技术架构上考虑以数据仓库为中心,搭建采集、处理、展现和服务共享的一体化平台。由于延长已经采购SAP BW系统作为数据仓库,与帆软OEM的GreenPlum系统(MPP数据库)的功能有一定重复。根据延长集团的信息化现状,项目组建议:
过渡期阶段(2020年-2021年)
目前还是采用BW+MPP数据双数据仓库的方式,其中SAP BW的定位是针对集团SAP ERP内数据进行分析,帆软MPP数据库的定位是针对ERP和非ERP结合的数据集、以及非ERP的数据集进行分析。SAP BW原则上不再接入新的非ERP数据源。架构图如下:
快速发展阶段(2021年-2023年)
随着数字化转型和“十四五规划”项目的推进, SAP BW由于不再升级成BW4/HANA系统,因此仅保留从SAP ERP获取数据和明细ODS数据推送至MPP的功能,集团的数据仓库逐步由逐步将被帆软MPP数据库代替。架构图如下:
全数据管理阶段(2023年-)
未来延长集团的数据管理范围将向下属企业的生产领域扩展,技术架构考虑以“数据仓库+大数据”双中心的方式,建设数据共享的全生命周期一体化平台。其中数据仓库使用帆软OEM的GreenPlum系统(MPP数据库),可提供高效的数据访问能力,大数据平台采用基于开源组件的成熟商用系统,可提供海量数据、非结构化数据、实时数据的存储与处理能力,具备一体化的管理功能。其中MPP数据库的定位在于集团和下属公司经营管理层面的分析与展示;大数据平台的定位在于厂矿、油田等实际生产单位实时数据、外部互联网数据抓取的存储与处理、数据挖掘分析、人工智能应用、区块链应用等这些特定场景,架构图如下:
4 项目成果
4.1 成果总结
(1)建设成果
平台主要分析模块:延长石油集团驾驶舱
平台报表/分析模板总量:200
平台月均访问量:420
平台活跃用户数:80
(2)整体价值
1、打破数据孤岛,打通不同软件不同数据库的数据,解决掉数据壁垒问题,实现信息互通,使集团能通过数据资源共享系统穿透到不同业务形态的数据。
2、炫酷视觉效果,丰富的统计图保证了其具有美观的图形展现能力,包括常用的柱状图、线状图、条形图、面积图、饼图、点图、仪表盘、走势图等展现形式,通过组合设计可以搭配出上百种视觉效果,给人以美的享受。
3、管理决策支持,通过可视化分析,辅助集团决策。各个软件的数据库为决策提供数据能力和资料能力,智能决策系统可视化模型为决策提供分析的部件。组合起来就是一个强大的驾驶舱,引领延长石油的数据化转型。
4.2 典型场景
(1)场景一:在线填报+文件上报
项目建成前,集团还是采取 EXCEL表格和邮件传送的方式进行数据的填报、汇总、分析,传统的人工 EXCEL工作统计量大、耗费时间长、容易漏掉或是重复统计,集团通过邮件收集这些 EXCEL,需要不断的催促子公司上报邮件,汇总的时候会面临手工数据无法及时更新的问题,而且查询不便,汇总容易出错,导致工作效率低下。统计的数据对公司非常重要,但采用人工统计,存在人员变动及数据安全不可控等风险。集团科技与信息化管理部经过多方选型测试,建设了基于FineReport的电子化报表填报系统,实现了报表、文件在线填报、上传,在线审批和查询,提高了每月报表的上报效率,减轻了员工工作强度,同时,避免了其它形式传输造成数据泄露的可能性。
在线填报
在线审批
文件上报
文件上报权限管理
(2)场景二:数据治理
项目建成前,集团无成熟的数据管理体系,企业数据标准不统一、数据存储于多部门、多系统、多介质上,这为集团数据资源再利用造成了很大困难。集团科技与信息化管理部在帆软平台上集成了数据治理系统,从主数据管理、元数据管理、数据质量管理三大维度出发。事前利用ETL工具进行数据的清洗和转换,去除或完善数据质量较差的数据;事后实施数据质量监控、质量分析,保证了集团数据资源的准确性、完整性、一致性、唯一性、有效性。推进了集团数据治理体系的发展。
数据标准管理
数据标准查看
元数据管理
数据质量管理
(3)场景三:数据可视化分析
项目建成前,集团生产、财务、物资等业务可视化大屏由独立项目支撑,集团领导关心的核心数据未进行统一展示。同时,由于不同项目基于不同技术底座进行图表展示,修改起来难度大,不灵活。集团科技与信息化管理部选用FineBI进行前端数据展示,开发不同业务领域BI驾驶舱9个,集团核心数据驾驶舱1个,直观的向用户展示集团内运营的相关指标。帆软FineBI,可视化拖拽式配置,几乎0代码的开发过程,把集团各个部门成熟的管理思路和丰富的业务报表,都开发到了数据资源共享系统里。
5 项目总结
5.1 CIO/项目负责人点评
石化是工业的血液,数据也是信息系统的血液,要成功实现延长的数字化转型,管理好数据是前提。之前我们认为搞信息化就是建系统,满足了业务需求,上线了、验收了就万事大吉,但是随着国家大数据战略的发布和国资委对数据工作的重视,我们也必须认识到数据是延长石油的战略资产,不仅要建好系统,更要用好数据,深挖数据价值。帆软平台作为一个能够整合各类业务应用,能够精准实现数据收集、处理、分析和应用,并且能够快速敏捷开发,迅速实现需求,符合未来的发展趋势,助力延长石油数据资产管理和运营。
5.2 经验心得
随着集团产业规模快速增长、兼并重组和数字化转型战略的加快推进,面临着管理幅度拓宽、难度加大的问题,对集团的科学决策能力提出了更大的挑战。我们面临着数据标准不一致、采集渠道分散、数据质量不高、没有系统支撑等等种种问题。希望大家摒弃“数据不上系统更方便、更安全”的错误思想,敢于从数据的源头采集、在线使用和共享方式上进行创新;各级一把手也要带头使用系统进行数据分析,改变拍脑袋做事情的方式,形成“用数字说话”的企业文化氛围。借助帆软数据资源共享平台的实施,可将数据集中起来规范管理,减少因各自为政带来的数据孤岛,促进管理模式由粗放向精益的转变,为决策的科学性、合理性提供有效支撑。