请上传宽度大于 1200px,高度大于 164px 的封面图片
    调整图片尺寸与位置
    滚轮可以放大缩小图片尺寸,按住图片拖动可调整位置,多余的会自动被裁剪掉
取消
82520(uid:82520)
追求自由者。 职业资格认证:FCA-FineReport | FCA-FineBI | FCA-业务分析理论 | FCP-报表交付工程师
【中国数据生产力大赛】“三步走战略”引领新药研发临床数字驱动新局面
一、企业简介 石药控股集团有限公司是一家集创新药物研发、生产和销售为一体的国家级创新型企业。跻身2022年度全球制药企业50强排行榜,国内排名位居Top5,为国内新药研发龙头企业。全集团现有资产总额580多亿元,员工2.7万人。在港上市公司(01093.HK)跻身千亿市值俱乐部,是恒生指数成份股。2019年,下属公司新诺威(300765.SZ)成功在创业板挂牌上市,石药集团实现了“红筹+A”融资格局新纪元。 目前在冀、晋、鲁、苏、赣、津等省市设有10余个药品生产基地,产品销售遍及全球100多个国家和地区,有36个品种单品种销售过亿元。 二、业务背景 纵观全球各国,医药创新不仅可为经济发展提供长久动力,同时也是解决民生问题的根本要求。新药代表着制药工业的科研和生产技术水平,新药的发展直接影响着防病治病的质量和进程。一种有效的好药诞生,不仅标志着国家制药工业的发展水平,而且能根本性地改变某种疾病的治疗状况,造福国家乃至全人类。石药集团“做好药,为中国,善报天下人”的企业使命也是源自于此。 研发也是医药企业的生命线,国际医药巨头的经验表明,研发是构建持续增长和核心竞争力的关键。在外部监管日益严格、市场竞争日趋激烈的环境中,现有药品的利润空间不断下滑,迫使医药企业更加重视新药研发以构建丰富产品群、打造新的重磅药物。然而,创新药的研发存在较高的研发失败风险,医药企业既要缩短新药研究开发的时间,还要控制研发成本、降低风险。 石药集团作为国内头部药企,早已完成从原料到制剂、从普药到创新药的彻底蜕变。目前,创新药的销售收入已占到集团一半以上,成为集团的中流砥柱。集团投入多达几十亿的研发经费来支持创新药的研发,临床试验是其中关键的一环。 当前石药集团临床试验项目数达300多个,年研发投入35亿,研发团队规模超2000人。对于临床试验项目的管理,还是以传统的人工管理方式为主,存在进度管控滞后、信息更新不及时、过程管理不规范等弊端,导致大量人力、物力、财力等研发成本的浪费,投资收益比明显不如预期。 近年来国内外同行纷纷加大对创新药研发资源投入,市场竞争日趋激烈。同时,国家又陆续推出“带量采购”等新医改政策。在如此大环境下,加快研发速度、提升研发效率和质量、控制研发成本、加速上市抢占市场是集团突出重围的唯一路径。 2.1 管理困境   药物研发是一项高风险、高技术、高投入、长周期和精细化的系统性工程,一款创新药的研发可能需要数十年的时间,耗资可达数十亿美元,临床试验是其中重要一环。开展临床试验涉及多方合作,如:研究中心、患者、CRO、实验室等等,管理难度非同一般。如何高效与各方合作,互利共赢,最终促使临床试验能够用最短的时间,最少的资金投入,保证试验质量,降低各种风险,通过国家药监局核查、审批、上市是临床医药研发管理层梦寐以求的解决方案。 图1 药物研发流程环节及耗时 摆在研发管理层面前的关键难题如下: 1)如何从整体层面把控项目进展: 不同的管理职能,对于项目数据的查看维度和分析角度不尽相同。当前是使用Excel逐级填报和汇总的形式,由于统计口径和要求不一致,一线业务人员(CRA)往往需要同一个信息反复填多遍,才能满足不同管理部门的汇总和统计需求。 就拿受试者入组这一关键步骤来说,部门1和部门2对于受试者的入组计划的制定标准不一致,部门3和部门4对于受试者实际入组情况的统计标准也不一致,按照这些标准得出的完成进度(实际/计划)也是不同的。 带来的后果就是: (1)CRA填报操作频繁,工作量重复,数据的准确性无法保证;且CRA耗费大量时间在数据收集和填报上,无法投入足够的精力在研究中心的核心工作上,反而影响到项目效率。 (2)各管理部门汇总出来的数据是割裂的、分散的,往往只从自己部门角度去分析,无法从整体层面来进行数据联动或钻取,多维分析很难实现。 2)如何获知实时数据,保障临床试验稳步推进; 试验质量与进度均与试验推进情况强相关。目前入组进度数据通过Excel层层汇总可收集上来,存在一定的延时,并且数据真实性无法保证;同时临床试验里程碑数据及质量数据存在严重的滞后性,往往某个质量或进度问题已经持续很长时间,领导层却无法获知、无法及时干预,等到决策层给出调整方案时,针对的问题已经发酵变质,错过了最佳整改时间。诸如此类场景多次发生,造成资源的极大浪费。获取实时数据,亟待解决。 3)如何有效的控制研发项目成本; 药品研发如同淘金,费时费力费钱,需要精打细算、节约成本,用最少的资源换取最高的获益。临床试验中的物料、人力、资金等资源投入落实到具体项目之上,需要做到最细粒度的拆解,评估其合理性和风险性,并与预算做差异分析,才能够去评测每一个临床试验的投入产出比,并为后期的项目投入提供参考。 综上所述:开展临床试验面临的核心问题就是如何从质量、进度、财务等方面去把控风险,力争在保障试验质量前提下,如何用最快的速度,最少的资金投入,来让临床试验稳步推进产品上市。这也是临床试验管理层面临的关键难题的核心。 2.2面临的挑战 结合目前事业部困境及临床试验行业现状。要实现上述业务诉求,面临极大挑战。主要挑战分为以下三个层面: 1)数据孤岛 主要体现在以下2个层次: (1)临床试验整体数据链条涉及众多的应用系统,如:IRT、EDC、CTMS、PV、eTMF、ePRO等,各应用系统分别服务于临床试验的某个环节,自成体系,分别有各自的数据管理要求和统计维度; (2)随着临床试验项目逐年增多,提供更细化服务的系统供应商也逐渐增多,且应用系统均为SaaS架构,导致试验相关数据分散存储于不同系统供应商平台,无法实现统一的数据管理、调度。 2)价值挖掘 目前,数据仅仅用来撰写临床试验报告,及试验完成后递交给国家药监局审查,偏向于结果类数据。实际上,临床试验整个数据链条背后隐藏着每一类试验的关键节点、进度、质量、财务是否合理等过程信息,涉及临床试验运营的方方面面,商业数据价值目前还是一片蓝海。 3)业务赋能 如何把数据用“活”是对数据分析团队最大的考验。通过数据分析手段将临床试验整个数据链条沉淀下来、体系化、标准化,构建业务评价与数据分析指标体系是需要结合业务去探索的技术难题。解决这些难题,才能让数据流动起来,从而达到提升团队工作效率,节省投入成本,保障临床试验质量的目的。进而加快试验推进进度,促进临床试验精细化运营,真正实现用数据创造财富。 三、解决方案 为了解决相关的业务管理诉求,我们提出了三步走战略方针目标。 1.构建临床试验信息共享平台; 2.构建临床试验运营分析平台; 3.构建临床试验智能决策平台; 平台整体架构图如下: 图2 临床数据化管理平台架构 1)信息共享平台 信息共享平台,旨在解决数据汇聚及标准化的问题,尽可能整合临床试验整个数据链条。我们搭建了数据仓库,通过简道云、集成接口对接等手段,将分散在各应用系统里的数据,汇聚到数据仓库里,再结合实际业务逻辑及数据治理等手段,实现数据的统一化、标准化、体系化。在此基础上,构建业务评价指标体系,使用FR/BI对信息按层次,分类别整理汇总,使得不同用户依据相应权限能够实时获取相关数据服务。 (1)梳理各应用系统,制定数据回流方案。 (2)对于无法回流数据,使用简道云搭建相关应用。 (3)实施数据治理,创建数据仓库架构模型。 (4)使用FR/BI开发相关数据报表,集成企业微信,实现数据获取、汇聚、集成、治理、查看一站式服务,且能够自动推送相关数据报表。 图3 信息共享平台搭建流程 图4 数据仓库部分架构   2)运营分析平台 运营分析平台,旨在解放一线业务人员的Excel式数据收集汇总的问题。借助数据仓库,建立起业务评价指标体系,并使用BI构建相应的主题式数据分析模型,依据数据使用需求分层,分别为高层、中层、基层的使用者提供数据服务: (1)高层:集团CEO/副总裁通过驾驶舱从集团整体层面把握试验涉及的人、财、物、进度等各方面的执行情况,以明确执行情况与企业战略保持一致; (2)中层:临床试验各级负责人借助仪表板,可实时掌控临床试验进展数据,借助上卷下钻、数据联动等功能,能够多角度分析问题; (3)基层:一线业务人员能够使用数据,借助BI自助式分析,进行自主分析、探索,将更多的精力放在发现问题,落地策略,优化现有业务上。 通过以上举措,逐步形成人人用数据,人人懂数据的数据生态圈。 (1)构建评价指标体系 (2)选择切合的数据分析模型 (3)构建数据BI看板体系 (4)培养自助分析核心用户 (5)营造数据分析文化 (6)打造和谐数据生态     图5 运营分析平台搭建流程 图6 业务指标体系分类 3)智能决策平台 目前处于探索阶段,规划实现后的功能如下: (1)各应用系统数据回流数据仓库之后,依据相关业务逻辑,设计算法,推算出相关模型的风险因子,通过简道云/BI的数据展示,集成企业微信,自动触发相关消息或流程,推送给相关负责人。 (2)各负责人接收到相关风险因子后,及时讨论解决方案,快速落地相关策略,通过最新回流数据验证策略效果,从而实现智能循环。 (3)通过各种模型(项目风险评测模型/财务健康度评测模型/人员绩效评测模型等),结合行业经验,构建智能决策平台。 为保障整体方针目标落地,团队内部引入了敏捷开发方法论。结合团队的实际情况,分工图示如下: 图7 内部敏捷开发流程 四、业务/管理应用场景 4.1 场景一:流程收集快速准确,信息共享便捷高效 业务痛点: 1)目前临床试验基础信息、计划与实际达成信息等,通过登录多个应用系统查询并导出原始数据,然后使用Excel逐级填报和汇总的形式,由于统计口径和要求不一致,一线业务人员(CRA)往往需要同一个信息反复填报多次,才能满足不同的管理部门的汇总和统计需求;而且由于汇总频次高,部分CRA存在更新不及时的情况,导致数据不准确;管理层拿到不同统计口径的汇总数,无法做出准确的判断和分析。以上问题综合起来,导致事业部上下都在要数据、又都在反馈数据不准。可以说怨声载道,数据收集形同虚设。 2)针对临床试验运营年度计划动态调整的需求:目前实行的手动调整策略是由各项目PM通过Excel分别上报,管理部汇总之后,提交给各级领导审批,PM的调整记录无法追踪,各领导的审批过程也无法留痕。动态调整的目的是使用集成业务逻辑的算法,随着实际入组情况自动做出调整,PM的单个项目计划调整及审批也能够留痕、追踪。现有情况下依靠Excel无法实现上述需求。 解决过程: 1)对现有的临床试验数据信息进行了重新梳理,标准化、规范化各字段取值;将现有通用型数据划分为产品信息、试验信息、中心信息、相关负责人信息等主数据;其他业务强相关数据划分为里程碑信息、年度方针计划动态调整、实际达成实时上报、试验交接、试验监查、试验稽查等模块。 2)使用简道云针对上述模块创建了相关流程表单和普通表单,同时将数据仓库与简道云通过数据接口互通,实现简道云的数据直接汇聚到数据仓库。 3)通过数据汇聚解决方案将各应用系统数据及简道云数据通过API数据接口汇聚到本地数据仓库。在数据仓库做好数据加工后,选择相关的数据集市,使用FR/BI进行数据可视化呈现。同时将数据仓库的部分数据回流到简道云的普通表单,作为基础数据,智能触发相关流程的自动发起。 图8 流程式数据收集及回流方案 应用价值: 1)数据仅需录入一次,可在多处重复利用,数据重复使用率提升了20倍,实现了临床试验信息的共享; 2)简道云的数据联动/数据关联等智能组件,使手动录入数据工作量降至之前的1/4,大大提升数据采集效率; 3)实现数据口径统一管控,降低部门之间因数据是否准确造成的沟通成本,沟通时间降至原来的5%; 4)实现简道云——数据仓库——FR/BI(数据应用)的数据自动化流转,人工整理数据的误差降至1%以下,保证了数据的准确性。 5)实现了数据实时录入、实时查看、实时分析,数据利用效率提升了80%以上。 4.2 场景二:基于简道云的EDC系统建设探索 业务痛点: EDC作为临床试验电子数据采集系统,是开展临床试验项目必须使用的电子系统,其功能强大,模块众多。但是存在如下2点弊端: 1)搭建临床试验数据生产环境耗时也相应较长。临床试验的方案设计有繁有简,EDC建库团队的人力资源却很有限。且在实际的试验过程中,往往会存在因为方案多次变更而反复修改数据库的情况,耗费很多的时间和人力。 2)EDC系统的服务商往往是如Medidata等覆盖全球的global vendor,服务合同动辄几千万,且对于已购买资源的使用情况有严苛的要求和管理制度,并不随方案设计复杂度而灵活变动,实际使用过程中,会存在部分资源浪费。 基于以上2点,如何利用有限的人力资源和系统资源,在尽可能短的时间内,根据方案设计的复杂程度快速、高效、保质搭建数据采集生产环境显得尤为重要。 解决过程: 1)针对方案设计较为简单的临床试验进行整体梳理、归类;提取出共性的eCRF标准化表单,对字段、表单、逻辑分别整理成标准模板。 2)依照整理出来的标准模板,基于简道云搭建简版的EDC环境(标准版本); 3)针对方案设计中比重较小的个性化的需求,再依照单个临床试验项目需求去单独设计。 应用价值: 1)使用简道云搭建的简版EDC环境的标准版本涵盖了85%以上的功能,且只需搭建1次。后续使用时,直接复制应用,在标准应用模板基础上修改或增删一些个性需求;平均构建EDC时间降至原来的1/5,大大提升了应对方案设计简单的临床试验EDC搭建工作的效率。 2)节省工时,同时优化了人力资源配置,使得相关同事有更多时间去梳理、完善标准eCRF,进一步搭建不同适应症的标准版本,使得标准eCRF迭代升级的周期降至原来的1/4。 3)作为现有EDC系统的一种补充,同时也节省了等价于现有EDC上的费用支出300多万元。 综述,针对于方案设计复杂的临床试验,需要借助专业的EDC去构建数据生产环境;对于方案设计相对简单的临床试验,选择基于简道云快速搭建生产环境。相比EDC系统的厚重和复杂,简道云更加轻量便捷。在实际的项目实施过程中,可依据方案设计的简繁情况选择轻重,在满足业务规范的要求下实现最优的资源配置:执行高效、节省人力、节省开支。 4.3 场景三:可视化助力运营分析,多快好省多维掌控 BI系统上线之前,临床试验运营数据主要由各业务部门从不同的业务系统导出进行人工统计,书写汇报PPT,在领导层会议上进行汇报。这种人工统计的方式存在诸多痛点问题: 1)取数困难; 由于临床试验环节的业务数据分散在多个应用系统里,故需要逐一登录多个系统,手工导出数据,然后再手工汇总、核对,严重占用了一线业务人员的工作时间。 2)展示效果差,不能全方位分析; 分析业务问题需借助过程指标拆解及多维度拆解,多视角去验证问题的真伪。因Excel数据无法实现数据联动、上卷下钻等功能,且汇报中多以汇总数据表呈现,故无法明显发现问题,也无法定位到相应明细数据做问题追溯,无法从多角度去验证问题的准确性。 如要分析入组达成情况,之前只是按月度统计各研究中心的实际入组与计划入组数据;引入BI看板之后,能够从试验、年度、月度、大区、省份、研究中心共6个维度去多视角分析,查询方案可达63种;能够快速发现问题(高维)、原因定位(低维)、落地策略(明细数据)、反馈效果,检测问题是否已解决(高维)。 3)数据严重滞后; 领导要数据,从上到下逐级传达数据需求;一线业务人员收到需求后,导出数据,再从下到上逐级汇总,给到领导的时候,往往已经过去了一周。 4)统计口径不统一,准确性待考证; 同一指标,不同部门统计口径不同。致使汇报会中,出现同一指标不同部门数据不一致的尴尬局面;另一方面,因数据汇总均为人工操作,不可避免出现统计失误。 5)数据造假,不能杜绝; 因数据是从各应用系统手动导出,再逐级汇总。整个流程都是手工操作。为了达成绩效,很难保证数据不被肆意篡改。 解决过程: 为解决以上痛点问题,我们计划打造一个以整合临床试验整体数据链条为目标,展示整个研发事业部产生的数据价值,以临床试验运营效果的变化为依据,实时反映临床试验运营状况的运营分析平台(注,截图仅截取了相关看板的部分图标,并非完整看板)。 1)临床试验评测视角; 仪表板以某个产品为基点,探索产品内各试验在进度、质量、财务层面的风险。看板包含了KPI指标及相关视角的分析模块,使用了多种数据分析模型,涉及到的核心业务指标包含:入组率、脱落率、入组进度、达成率等等。 2)临床试验质量(监查/稽查)视角; 仪表板以试验监查问题为主题,包含了试验监查需要的KPI指标,及从年度/季度/月度等维度去查看稽查问题数。借助饼状图将稽查问题的状态类别与问题开放时长给出直观的统计。 仪表板以试验稽查为主题。包含试验稽查涉及的KPI指标;稽查全年各月份工作量及质量;稽查类别统计及占比;稽查问题严重程度统计及占比;各类稽查的稽查平均耗时统计;延误时长与整改时长的关系探究;延误原因词云图展示等。 3)年度计划动态调整视角; 仪表板以临床试验年初运营年度计划为依据,统计各试验各月份入组情况,将实际入组与年度计划比对,通过集成相关调整规则及算法,每月月初对年度计划中的后续月度计划做动态调整,从而达到对年度计划的精准、动态调整。年度计划的达成率更加贴合实际。 4)入组漏斗分析视角; 仪表板以受试者入组过程为主题,包含了相关KPI指标;相关筛选维度(涉及产品维度、时间维度、地理纬度等);两个漏斗图(左图,是整体漏斗图,右图伴随筛选条件变化而产生数据联动),能够实时获取各产品、各试验等的入组率/脱落率。 5)入组达成视角; 仪表板以入组达成情况为主题,从试验、年度、月度、大区、省份、中心共6个分析维度汇总入组达成情况,共63种查询方案。借助数据联动及上卷下钻功能多视角分析。根据当前的入组进度,进行相关策略的调整,助力项目运营。 6)入组速率视角 仪表板以入组速率为主题,从试验、中心两个层次去分析入组速率,通过上卷下钻、数据联动,去分析哪些试验入组速率高/低,原因是啥?是因为中心选择还是与受试者人群分布有关,还是其他相关因素。然后复盘、汇总,应用于当下及后续试验,都能起到良好的风险把控。 7)脱落分析视角 仪表板以脱落为主题,从研究中心出发,研究某产品某试验脱落情况,包含受试者参与时长、脱落速率、脱落原因等信息。从生物统计视角分析脱落原因,然后落地相关措施,防止继续脱落,也可应用于其它相同适应症临床试验。 8)财务分析视角 仪表板以医院合同财务分析为主题,从试验分期、试验、研究中心3个层级展示了医院合同财务花费的构成(总金额/已支付金额/已支付比例);同时展示了每例受试者合同价格与当前实际价格的对比(中心层面)。以判断当前某试验某中心的入组进度,进而判断该研究中心所对应的合同是否存在资金占用(当前价格远大于合同单价),进而判断公司的相关资金的利用率。 9)移动端应用 根据领导需求,定制化移动端仪表板,使用FR开发了移动端,并集成到企业微信,定时发送相关图表。领导开会可直接使用PC端浏览大屏,不在办公室则能通过移动端(手机/平板)随时查看相关报表,查看数据不在受地域限制。 应用价值: 临床试验运营分析平台通过直观易懂的图表,多维度、多视角分析经营数据,层层钻取,深度挖掘数据价值,为管理层提供高效可靠的决策依据与数据支撑。相较于传统的汇报方式,运营分析平台通过数据自动化汇总,提高数据统计效率80%。优化业务流程,减少了60%以上的重复性工作。业务人员从数据统计中得以解放,回归到本职工作当中,企业效率提升30%。 通过对临床试验运营各环节监控,领导可实时掌握运营情况,及时做好优化资源分配、计划调整等,提升运营效率50%以上。同时对于临床试验运营实时监控,可以最大程度规避临床试验中存在的质量、进度、财务等风险因子。 五、总结与展望 5.1 价值分析 1)借助简道云,手动录入数据工作量降至之前的1/4,平均构建EDC时间降至原来的1/5,标准eCRF迭代升级的周期降至原来的1/4,作为现有EDC系统的一种补充,同时节省了EDC费用300多万元; 2)通过数据汇聚、构建数据仓库、数据治理,因数据准确与否的沟通时间降至原来的5%,人工整理数据的误差降至1%以下,数据利用效率提升80%以上,数据重复使用率提升20倍,减少了60%以上的重复性工作。 3)利用Fine BI及FR展示数据、突出问题,在业务层面做出如下成果: (1)在中心筛选方面提供数据依据,精准选择最佳研究中心,整体时效缩短15%; (2)针对各类研究中心,原因定位迅速,落地相关策略后,使得入组率提升近20个百分点、脱落率降低5个百分点; (3)针对入组达成,原因定位精准,落地相关策略到位,整体达成率相比之前提升了近10个百分点; (4)质量稽查方面,可迅速定位主要问题,整改目的性较强,进而推至其他研究中心,后续稽查工作量有望降低30%; (5)财务风险方面,可从试验、中心、合同,逐级定位,迅速查找风险点,落地规避措施,粗略统计,规避风险金额可达数百万元。 整体上讲,提升临床试验运营效率50%以上。 5.2 CIO/项目负责人点评 近年来,石药集团创新药临床试验项目逐年增多,资金投入逐年加大,传统人工管理方式在进度管控、信息更新、过程管理等方面存在诸多弊端。 事业部成立数据BI团队,以整合临床试验完整数据链条为基础,打破临床试验各应用系统的数据壁垒,结构化、流程化、成体系的将临床试验相关数据沉淀下来,制定数据标准,借助数据仓库,构建临床试验信息共享平台、运营分析平台等,服务于临床试验运营的方方面面,以发挥临床试验数据巨大的商业价值。 目前已经分别使用简道云与BI解决不同场景问题,后续会尝试将两个产品融会贯通,借助数据仓库,使得简道云与BI数据相互流通,相互优化。最终实现:数据获取、数据汇聚、数据治理、数据仓库、BI展示、问题发现、方案落地、新数据回流,组成一个循环,构建临床试验智能决策平台。成为石药集团实现“管控数字化、决策智慧化、服务平台化”战略规划的重要支撑。 5.3 成果与愿景 1)服务于石药集团 我们不是专业IT开发团队,而是专注于业务的数据分析人员。旨在立足业务的层面去深入思考、挖掘业务痛点,借助Fine BI强大的数据自助式分析、FR的极佳展示效果、简道云的零代码开发优势,去构建贴合业务痛点的解决方案。通过落实“三步走战略规划”,构建临床试验智能决策平台,以满足临床试验管理层对质量、进度、财务的精准把控要求,规避风险,强化管理,让数据说话,为集团降本增效。 2)引领医药行业数字化创新 临床试验成功与否,很大程度上决定着该药品能否顺利上市、回收研发成本、创造经济效益、造福人类。在这一重要领域,针对临床试验全流程,实施数字化转型,实现数据驱动管理,提高研发的投资回报率,可谓是箭在弦上不得不发。石药集团作为全球医药行业Top50,成功构建了临床试验智能决策平台,在探索临床试验数字化转型道路上走在了前列。希望能够借此平台引领医药行业,在对临床试验的质量、进度、财务精准管理层面,树立标杆效应,做出表率,吸引更多的医药企业投身到临床试验的数字化变革,推动医药行业的进一步发展。 3)贡献于国家 “做好药,为中国,善报天下人”,是每一名石药人的使命。国家陆续推出“带量采购”等相关政策,旨在实施腾笼换鸟。这也意味着:仿制药的高毛利时代结束,仿制药的相关企业集中度提升,创新药崛起。在未来5-10年,随着仿制药一致性评价的完毕,带量采购的全国推行,中国仿制药支出也会逐步降下来,创新药的比例会逐步上升。作为国内医药行业Top5,石药集团持续研发创新药,是顺应国情、顺应时代的举措。集团大力支持构建临床试验智能决策平台,致力于临床试验数字驱动改革,旨在降低研发成本,提高研发效率,从而为国家、为老百姓提供低价优质的好药,让医药创新能够普惠万家。 集团借助帆软的产品(BI、FR、简道云),开始了基于临床试验的商业智能平台探索之路。凭借我们团队对业务的精准把控,已经踏出了一个良好的开端;我们将戒骄戒躁、开拓创新、砥砺前行,逐步推进临床试验管理由人工决策向智能决策的转变。 也期盼着有更多的国内医药企业加入我们,共同推进临床试验的数字化转型之路,为民做好药,创造社会价值,为国民身体健康做出应有的贡献。
【2022BI数据分析大赛】工业制药-数据分析
Your browser does not support video tags.   一、选手简介 1.1选手介绍 本人目前从事于临床试验全流程业务数字化、可视化及商业决策数据分析领域,负责事业部临床试验智能决策分析平台构建,是事业部数字化转型项目倡导者与负责人。个人感兴趣方向:为传统制造企业实施数字化转型提供可快速落地方案,涉及数据获取、数据汇聚、数据仓库构建、数据指标体系搭建、数据分析等。   1.2 参赛初衷 传统制造业转型数字化驱动势在必行,临床试验数字化正处于起步阶段。目前只是借助于各应用系统,如IRT、EDC、CTMS等,并未将临床试验整个数据链条整合。事业部成立数据BI团队,以整合临床试验完整数据链条为基础,借助数据仓库,构建临床试验智能决策分析平台,以发挥临床试验数据巨大的商业价值。   二、作品介绍 2.1 业务背景/需求痛点 开展临床试验,需要面临多方面挑战。作为产品负责人需全方面统筹一个产品所涉及的所有临床试验。每一个临床试验涉及研究中心选取、受试者入组、里程碑规划、质量把控、财务风险规避等。产品负责人希望能够将多方面的数据汇总到一张看板,这样能够实时把控临床试验各方面情况,快速定位相关问题,找到相关负责人,进而快速解决问题,使临床试验健康推进。这张看板也因此需求而诞生。   2.2 数据来源 本次参赛,使用企业数据。相关数据已做脱敏处理,最终确定使用DM层10张数据表。涉及:试验基础信息、入组进度、里程碑、质量、财务等。 本参赛作品针对某一个产品开展的所有临床试验,做全方位的信息整合,涉及以下几个方面: 1)临床试验进度(里程碑进度、入组进度); 2)临床试验质量(重点突出稽查); 3)临床试验财务(重点突出研究中心费用)。   2.3 分析思路 2.3.1 分析框架 图1-1:临床试验分析框架 临床试验最为核心的3个模块分别为:进度、资金、质量。如何评测试验进度、财务花费、试验质量最为关键;如何构建临床试验健康度/风险控制两大评测模型也是现阶段的工作重点,此处不深入讲解。本次参赛只涉及简单的数据展示,后边若有机会可深入探讨。 2.3.2分析思路 图1-2:临床试验分析思路 本次参赛分析思路如上图所示,选取了10个层面的数据;因篇幅有限,不再详述应用场景、业务流程、核心指标梳理、指标体系构建等。若有兴趣,可以参考去年参赛作品《临床试验与BI结缘》,网址为:【2021夏季挑战赛】临床试验与BI结缘-帆软社区 (fanruan.com),也可私下共同探讨。 图1-3 临床试验分级管理 临床试验运营管理分为3级,分别为:产品、试验、中心,相关角色分别为:产品负责人、PM、CRA。检测问题需从高维度(试验)向低维度(中心)去拆解,然后再左右比对(试验、中心);再从低维度回到高维度,判断检测结果的正确性。方案执行从下到上。 2.3.3仪表板模块结构 图1-4:仪表板沙盘 本次参赛作品看板共分为2个部分:KPI指标卡7个;正文中章节10个。每个章节涉及相关分析维度、度量值、分析模型,此处不做详述。 2.4 数据处理 2.4.1 DM层数据集 由ODS层数据、EDW层数据制作用于看板使用的DM层数据集。ODS层存储通过接口程序从多个应用系统抽取基础数据,在EDW层对数据进行清洗、转化、筛选、连接、汇总等操作,生成目的数据集。 数据处理过程均使用MySQL数据库,编写存储过程,自动化运行生成目的数据集,并存放在数据仓库DM层。 2.4.2 维度与度量值 根据上文的看板模块构成,确定明确的数据指标及相关维度。 度量值较多,简单列举几个衍生度量值,如下:         差值=实际入组-计划入组;         金额支付比例=已付金额/总金额;         入组进度=已入组数/合同签订入组数;         质量KPI=例次/发现项数。 维度较多,简单列举如下:         合同主体(供应商/医院);         财务风险分析主体(试验/中心/合同);         地理纬度(大区、省份、中心);         里程碑维度(里程碑/关键节点/状态/开始标识/结束标识/耗时标识)。 通过多维度交叉、联动,观察相关指标变化趋势,分析背后原因,为相关人员制定合理的应对策略,快速落地。高效、高质量、成本合理控制,推进临床试验。   2.5 可视化报告 2.5.1 看板整体布局 模块1为看板第1部分 (1)模块1,宏观指标展示 图2-1:宏观指标模块 宏观指标默认显示为总量,比如总中心数、计划入组数,已入组数,总的试验数等。 模块2-11为看板第2部分,从图2-2可以看出,主题为药物临床试验,从Content可以看出正文可分为10个层面,分别为模块2-11。 图2-2:正文目录结构 (2)模块2,试验基础信息 图2-3:试验基础信息 左侧重点关注试验级别与试验分期;右侧突出问题点。 (3)模块3,试验中心信息 图2-4:试验中心信息 左侧重点关注中心所处状态及占比,中心所处地域,单个中心平均分配率;右侧突出问题点。 (4)模块4,试验入组信息 图2-5:试验入组信息 第1部分使用Tab组件,同时使用漏斗分析,展示了筛选-入组-脱落这一流程,以及对应明细数据;第2部分使用波士顿矩阵,将研究中心分为4大类;第3部分使用Tab组件,同时使用TOP10,突出重点关注数据。同时需关注每一部分对应的问题点。 (5)模块5,入组达成信息 图2-6:入组达成信息 本模块是去年参赛获奖作品的核心,维度:所属试验、年度、月度、大区、省份、中心,度量值:计划数、入组数、差值。其中年份倒序展示,突出最近一年计划与入组达成情况;中心分布放在最后,因中心名称较长,故选取中心ID作为横轴标签,中心名称作为提示出现;中心入组达成累计分布图使用帕累托模型;因领导更看重差值,故用差值替代达成率,且使用颜色变化体现在入组柱状图中。各维度间通过数据联动,能够从多维度进行分析,同时需关注右侧问题点。 (6)模块6,单产品当前里程碑分析 图2-7:单产品当前里程碑分析 该模块关注各试验所处里程碑,该里程碑开始标识/结束标识;同时需关注问题点。 (7)模块7,单个试验整体里程碑分析 图2-8:单个试验整体里程碑分析 该模块展示X试验整体里程碑进度、各里程碑开始标识/结束标识/耗时标识,并对各里程碑耗时数据进行展示(瀑布图),同时需关注问题点。 (8)模块8,单产品单关键节点分析 图2-9:单个试验单关键节点分析 该模块展示了X关键节点各试验的完成状态/开始标识/结束标识/耗时标识;各试验计划与实际耗时,使用差值标识是否延时完成,同时需关注问题点。 (9)模块9,单个试验关键节点分析 图2-10:单个试验关键里程碑分析 该模块展示了X试验各关键节点的开始标识/结束标识/耗时标识/明细数据,明细数据设置预警,查看相关节点详情;同时需关注问题点。 (10)模块10,产品稽查质量分析 图2-11:产品稽查质量分析 该模块使用Tab组件,从试验/中心/问题级别维度汇总了发现项;使用散点图对问题主类别/试验维度汇总了发现项、例次;同时需要关注问题点。 (11)模块11,产品财务分析 图2-12-1:产品财务分析 图2-12-2:产品财务分析 该模块从合同主体/试验分期/所属试验维度,展示了合同额/已付金额;从试验/研究中心/合同展示了付款进度风险与已付款金额风险;使用瀑布图展示各中心亏损情况;明细数据预警,查看相关详情;同时需关注问题点。 2.5.2 可视化分析 本次参赛作品几大亮点: 1)信息高度浓缩(去年参赛获奖作品作为本作品一个分析模块出现) 2)模块内(2-11)通过数据联动进行多维度分析 3)问题点提炼(为中高层领导解读仪表板) 4)多种数据分析模型应用(波士顿矩阵、帕累托分析、漏斗分析、描述性分析等) 2.5.2.1 概况 宏观数据:本产品包含13个试验、137个中心、325计划入组数、412已入组数、涉及合同金额6534万,已支付金额3530万、支付比例已达54%。 产品负责人最为关注入组进度与费用,入组与花费均会分摊到各研究中心,故选取以上宏观指标。 2.5.2.2 试验信息 图3-1:试验基础信息 问题点解读了饼状图/堆积柱状图,使用描述性统计分析方法,应关注重点推进实验、暂停试验,且清楚暂停原因。 图3-2:试验中心信息 问题点解读了饼状图/堆积柱状图/中心地域分布地图,使用描述性统计分析方法,应重点关注激活中心数及占比、中心区域分布,考虑入组进度与成本因素,评估样本量与中心数是否合理。 实例分析:点击柱状图中Pro01-ECL试验,通过数据联动可从饼图中看出:激活中心数及占比,同时可从地图中查看各中心分布;核实该实验所需受试者是否与中心分布一致,受试者存量是否充足,以验证中心选取是否合理。 2.5.2.3 试验入组信息 图3-3:试验入组信息 (1)第一部分 依据漏斗分析模型,重点关注各试验筛选量/入组量/脱落量;依据警戒线(平均入组率/平均脱落率),评估各试验情况是否在于期内,并给出相应解决方案;借助第二部分散点图,通过数据联动,可查看X中心在各试验情况对比。 (2)第二部分 依据波士顿矩阵模型,使用入组率均值/脱落率均值将研究中心分成4类,并针对每一类中心提出相关策略解决相应问题(详见问题点),以推进试验整体入组进度。 (3)第三部分 使用TOP10/TOP5对筛选量/入组量/脱落量做了红榜/黑榜展示,以突出需要重点关注的中心;同时使用雷达图展示了筛选量TOP10中心入组率/脱落率,借助警戒线对各中心优劣进行综合评估,并给出改善举措。 实例分析(1-3部分):从柱状图中可直接看出各试验入组率/脱落率,若入组率较低,则需分析原因并落地相关措施,提升受试者质量,以保证入组人数;若脱落率较高,则需分析原因并落地相关措施,防止后续受试者脱落,以降低脱落率,提升试验数据质量。点击柱状图中Pro01-ECL试验,通过数据联动,可从散点图中看到该试验各研究中心被划分为4类。理想状态是第四象限分布较多且气泡较大(高入组率、低脱落率、入组量高),若其它象限分布较多,则需要提出相关措施,来扭转局面。点击散点图中的圆圈,可以通过柱状图查看该中心在各试验的表现,用来分析入组率/脱落率是否稳定,是否可作为新开展其它同类别试验的备选,以降低新试验研究中心选择的风险(资源、时效、花费);通过数据联动,可以实时观察Pro01-ECL试验筛选量/入组量/脱落量TOP排名,对相关负责人予以相应奖励,同时可以根据雷达图,分析各中心的优劣,最终实现该试验整体入组进度。 2.5.2.4 入组达成信息 图3-4:试验达成信息 本部分是去年参赛获奖作品核心,使用Tab组件,将地理纬度(大区/省份/中心);时间维度(年/月);项目维度(试验)。3大维度,6个细分,依据排列组合,共有63种查询方案。最后一个Tab,使用帕累托分析模型,展示累计计划入组/累计实际入组80%所涉及的中心,依据入组进度需求调整对各中心的财务投入。 实例分析:试验维度点击Pro01-P-001,可查看该试验各年度入组达成情况;继续点击2021年,可查看21年各月度达成情况;继续点击04月份,可进一步看该实验21年4月份入组情况,结合大区、省份、中心。重点关注未达成大区、省份、中心。结合其它月份、年度,综合分析未达成原因,是偶然还是已持续很久,是人为原因还是资源不足等。然后落地相关举措,保证试验整体入组进度。 2.5.2.5 里程碑分析 图3-5:单产品当前里程碑分析 使用描述性统计分析方法,问题点解读了饼状图/堆积柱状图;应重点关注各试验当前里程碑,及其开始标识/结束标识,以判断当前里程碑进度是否可控,并给出相关措施。 图3-6:单个试验整体里程碑分析 使用描述性统计分析方法,问题点解读了饼状图/堆积柱状图;应重点关注X试验提前启动/不能正常启动里程碑及原因。及时复盘总结,落地相关策略,推进试验整体进度。 实例分析:Part 6中选取Pro01-P-003试验,从4个饼图中,可查看各里程碑的启动、结束及耗时情况,结合瀑布图综合分析。如点击第2个饼图中延迟启动,有5个里程碑是耗时小于计划,2个耗时等于计划,1个耗时大于计划。可分析出,延迟启动没有对这些里程碑造成大影响,只需要分析延迟启动原因,并做好复盘,应用于其它试验,则可能会提升其它试验的试验进度。 2.5.2.6关键节点分析 图3-7:单个试验关键节点分析 使用描述性统计分析方法,问题点解读了饼状图/柱状图;应重点关注X关键节点中,哪些试验已完成,提前启动/延误启动/提前结束/延误结束/提前完成/延误完成及相关原因;通过柱状图比对各试验计划与实际耗时,对新开展试验评估更加合理的工时消耗。 图3-8:单个试验关键里程碑分析 使用描述性统计分析方法,问题点解读了瀑布图/明细数据;应重点关注X试验提前启动/延误启动/提前结束/延误结束/提前完成/超时完成的关键节点及原因,及时复盘,总结经验教训,为新开展试验制定更为合理的工时。 实例分析:通过Part 7中筛选框变换,从4个饼图中查看每一个关键节点各试验的完成状态/启动状态/结束状态/耗时状态的个数统计,并对每一个关键节点查看各节点耗时,柱状图中,显示第一个关键节点在Pro01-P-001试验中超时,需分析超时原因,以便在其他试验避免同类原因;同时可以借助Part 8查看该试验所有关键节点耗时情况,已完成的2个关键节点均延误,此时产品负责人需找到相关试验负责人了解情况,找出具体原因,同时需要落地一些举措,保证后续关键节点进度,以降低对该试验整体试验进度的影响,避免对临床试验递交CFDA及审批上市造成影响,进而损失市场份额,影响集团收益。 2.5.2.7产品稽查质量分析 图3-9:产品稽查质量分析 使用了描述性统计分析方法,问题点解读了堆积柱状图/气泡图;应重点关注重大/严重发现项及占比;根据数据联动,同一个试验各中心对比,同一中心各试验对比;气泡图中,重点关注大气泡,气泡越大表明该发现项问题应尽快解决。 实例分析:点击试验-发现项,选择Pro01-ECL,通过数据联动,可查看中心-发现项:上海02医院/河南02医院有重要发现项,点击上海02医院,散点图中最大的圆圈表明问题主类8影响比较大,需要重点解决。当然也可从散点图开始,然后通过数据联动,分析中心及试验。 2.5.2.8产品财务分析 图3-10-1:产品财务分析 图3-10-2:产品财务分析 问题点解读了饼状图/柱状图/散点图/瀑布图/明细数据;使用波士顿矩阵分析模型,应重点关注2个财务风险:已支付比例/已支付金额;后期可将这两个风险点与其他风险点共同考虑,加入权重,组合为合理的风险模型,促进财务风险精准把控。 实例分析:通过饼图查看医院费用占据90%以上,I期占比40%,结合试验基础信息,分析出每类分期,单个试验费用值。通过柱状图,可分析各试验费用比重。第一个Tab图,点击最大圆圈(整体不存在已支付比例风险),查看研究中心,发现部分研究中心为红色,存在风险,同时查看相关合同,可看出本试验中,哪些中心、哪些合同存在已支付比例风险。然后跟相关负责人沟通,分析是中心选择原因,还是工作不到位,还是合同金额虚高等,需落地相关举措,解除相关风险,若不能解除,则需报告上级负责人,共同制定后需解决方案。 模块2-11,可单独看每一部分,也可多部分综合查看,分析视角非常丰富;因篇幅有限,上文也仅仅是简单列举几个实例分析,如有兴趣,可在评论区共同探讨。 PDF格式.pdf (2.2 M)     2.5.3 总结 综述,此次制作仪表板,信息高度浓缩,分析层面较多;模块内可实现数据联动,多视角分析;分析模型较为丰富;问题点提炼精准,能够深入解读报告,降低中高层用户学习成本,快速定位问题。 看板结构虽简单,但是为产品负责人提供了实时、准确且全面的数据查阅与分析平台,实现了对某个产品所有临床试验的精准把控。 在中心筛选方面提供数据依据,精准选择最佳研究中心,时效整体缩短15%;针对各类研究中心,原因定位迅速,落地相关策略后,使得入组率提升近20个百分点、脱落率降低5个百分点;针对入组达成,原因定位快且精准,落地相关策略到位,整体达成率相比之前提升了近10个百分点;质量稽查方面,可迅速定位主要问题点,整改目的性较强,进而推至其他研究中心,后续稽查工作量有望降低30%;财务风险方面,可以从试验、中心、合同,逐级定位,迅速查找风险点,进而落地规避措施,粗略统计,规避风险金额可达数百万元。 该看板可以实时为产品负责人提供丰富的数据参考,以便及时从中心筛选、中心管控、入组进度、质量稽查、财务、整体试验进度方面发现问题,分析原因,落地相关策略,最终能够及时完成临床试验向CFDA递交,最终完成上市,为公司产生巨大效益。但仍有许多提升空间,希望能在此次大赛中继续提升个人及团队整体能力,同时为构建临床试验健康度/风险控制评测等模型起到抛砖引玉的功效。   三、参赛总结 3.1 Fine BI工具 觉得比较好用的BI亮点功能如下:     (1)Tab组件,能够很好地控制看板的长度。     (2)联动功能,能够很容易实现各组件之间的数据联动。     (3)复用/复制功能,能够很大程度上节省看板设计时间。 觉得不太人性化的地方如下:     (1)警戒线不能自定义函数构造公式,期待后边可实现自定义函数作为警戒线。     (2)简道云(数据工厂)模块可尝试集成到BI,增强BI的ETL功能。     (3)提示信息有覆盖,比如气泡图,大气泡覆盖小气泡,则小气泡提示信息不能展示。   3.2 参赛总结 对数据分析能力的理解:数据分析思维是道,数据分析方法是术,数据分析工具是器;如何感悟自己的道(功法),如何修炼自己的术(招式),如何选择自己的利器(兵器),是我们提升数据分析能力时时刻刻需要思考的问题。 对数据分析的理解:洞察数据背后的问题,用简单的形式表述出来,用能够落地的策略去执行,产生可观的改善效果与价值,能够结合实际情况不断迭代与完善。 牢记:大道至简。
【第四届数据生产力大赛】工业制药-商业数据分析
1 企业简介   XX药业是一家集创新药物研发、生产和销售为一体的国家级创新型企业。集团现有资产总额500多亿元,员工近3万人。上市公司,跻身千亿市值俱乐部。   XX药业已完成从原料到制剂、从普药到创新药的彻底蜕变。目前,创新药销售收入已占到集团一半以上,成为集团的中流砥柱。   目前在冀、晋、鲁、苏、赣、津等省市设有药品生产基地,产品销售遍及全球100多个国家和地区,有36个品种单品种销售过亿元。   2 项目背景 创新药研发、开发自主知识产权新药是传统制药企业保持市场竞争力、可持续发展的根本。为此,国内外的龙头制药企业均投入大量的资源用于药物研发。   新药研发的特点是涉及的环节多、研究严谨,一般耗时10-15年,耗资可达数十亿美元,临床试验是其中最重要的一环。近年来,我公司创新药临床试验项目逐年增多,由最开始的几个项目增至一百多个,公司投入也逐年加大,传统的人工管理方式存在进度管控延后、信息更新不及时、过程管理不规范等弊端,浪费大量人力、物力、财力。   为改善管理局面,研发部门开始使用相关的数据应用系统,包括IRT(随机系统)、EDC(临床数据管理系统)、CTMS(项目管理系统)、SMO等应用系统。但这些系统的运用存在如下3个主要问题:   1.数据利用不充分:系统生成的数据仅仅作为证据,用以撰写临床试验总结报告,在新药完成试验后递交给国家药监局审查,没有做进一步的延展使用。   2.数据孤立分散:各个系统以项目为范畴,独立开展,项目数据分散存在于各个项目组里。   3.无法统一管理:以上系统均为SaaS架构,数据分散存储于不同系统供应商的平台上,没有本地化,无法实现统一管理。   而实际上,这些数据的背后隐藏着每一类试验的关键节点、进度、受试者质量、财务花费是否合理等等信息,覆盖到临床试验运营的方方面面。数据的价值,并没有得以充分的挖掘。 如果能够成体系的将这些数据沉淀下来、标准化,对于类似我公司这样创新型药企来说,将大大提升临床试验的运营效率,节省研发成本,真正地用数据创造财富,同时也能成为公司的巨大数据资产。   我们要做的就是要打破临床试验各应用系统的数据壁垒,结构化、流程化、成体系的将临床试验相关数据沉淀下来,搭建数据仓库,制定相关数据管理标准,进一步服务于临床试验的运营,挖掘临床试验数据的商业价值。   3 解决方案3.1数据平台整体架构图 为了更好的实现数据汇聚、数据仓库构建、数据指标体系搭建、应用层(数据可视化、数据分析)。我们规划了如下架构图。   148225   在此架构图基础之上,我们结合工作实际情况,做了1.0版本,如下图所示:   148226 3.2核心指标体系搭建 这里我们选取其中一个业务流程,举例说明一下某个节点的指标体系搭建的流程,临床试验中受试者入组是重要节点。整个试验过程里,受试者需要参与的环节包含签署知情同意书、对受试者按照试验标准进行筛选、受试者随机入组(即开始服用试验药物)、受试者用药期间进行访视、异常出组、完成研究。   148240   比如选取筛选这个节点,搭建对应的指标体系如下所示:   (1) 指标拆解:筛败率=筛选失败人数/筛选总体人数。   (2) 维度细分:产品维度(产品/项目)、地理纬度(大区/省份/中心)、项目维度(治疗领域/研发类型/产品分类/申办方/试验分期)。   (3) 数据口径定义。开发接口对接各个系统供应商提供的数据,并根据业务逻辑,确定入组受试者信息优先取IRT系统,其次取CTMS,最后才取excel。   (4) 全面检查复核所有指标的口径和维度,并确定更新周期。   148229   同理,可以对达成率、脱落率进行指标体系搭建。此处不再赘述。   3.3数据应用层建设 根据各个指标体系,撰写相关数据源的数据接口,进一步构建数据仓库,最后借助FineBI/FR搭建数据应用层。   4 项目成果4.1成果总结 (1) 建设成果   l  平台主要分析模块:IRT、CTMS、EDC三个模块。   l  平台报表/分析仪表板总量:50+。   l  平台月均访问量:10000+   (2) 整体价值   整合体系:搭建数据汇聚体系、构建数据仓库,使得分散存储于不同系统供应商平台上的临床试验数据,实现本地化,能够结构化、流程化、成体系的存储起来,实现数据统一管理。   助力合理化运营:数据BI搭建,使得临床试验运营更加合理,能够促进临床试验资金投入更加合理,时间节点规划更加紧凑。   提高业务人员效率:数据BI搭建,使得业务人员摆脱了繁重的EXCEL数据整理,汇报等工作,能够利用标准化的数据集,借助FineBI简单拖拽,去探究数据背后反映的问题及价值。   4.2典型场景 场景一:统计各项目入组进度 痛点:通过excel逐级汇总数据,最后统计入组进度,费时费力,且不能保证数据准确,同时,只能收集历史数据,且不能获取实时更新数据,致使决策数据滞后。   解决过程:通过数据汇聚,将数据引流到本地数据仓库,并通过每小时调用数据接口,使得能够实时获取最新数据,然后借助FineBI将数据使用相应的图表展示出来。使数据更加形象化,反映的问题更加显而易见,图表交互效果更好。获得了运营领导的高度认可。BI图示如下:   148230   场景价值:领导层能够实时了解各项目最新入组进度,能够根据当前的入组进度,进行相关策略的调整。助力项目运营,让决策有数可依!   场景二:用户日常使用情况 痛点:数据BI平台搭建之前,PM需要定期做项目汇报。首先需要使用excel收集数据,然后做数据整理,利用Excel自带的透视图/透视表做相关分析,然后再做成PPT,跟领导汇报。存在费时费力,工作量重复,数据统计口径不一致等问题。   解决过程:数据BI项目搭建成功之后,我们会在数据仓库DM层做一些宽表。如果用户对定制的仪表板中某些数据有疑问,或者内心有想法,可以利用开放的数据权限,自己动手制作一些自己平常会经常使用的仪表板,并能够通过分享功能,分享给下属,且可以直接导出PDF文件提交给领导。用户使用自己账号所开放的数据权限制作自己专属看板如下图:   148242   148233 场景价值:发挥用户的能动性,创造性,解放IT人员的精力。用户将自己的想法,使用BI工具实现,这本身就具有一定的成就感。操作过程中,不仅能够梳理业务逻辑,劳动成果能够分享给团队、下属,同时能够拿来向领导汇报。而且同一张仪表板只需制作一次,不需要重复操作,节省了95%的时间,用于继续探索数据背后的价值,以及构思相应的措施。   场景三:移动端应用 痛点:数据BI平台搭建好之后,虽然领导能够获取实时数据。但是PC端的使用受到场地限制,如果不在电脑前,使用手机查看效果不佳,故而想开发移动端,方便领导层查看。   解决过程:根据领导的需求,定制化移动端仪表板,使用FR开发了移动端,并集成到企业微信,定时发送相关图表。截图如下:   148241148236148237148238   场景价值:领导层开会可以直接使用PC端浏览大屏,不在办公室则能够通过移动端(手机/平板)随时查看相关报表,还能够通过企业微信,定时接受相关指标图表。达到了随时随地指标监控的目的。   场景四:数据汇聚需求,打通各应用系统 痛点:基于临床试验数据现状(不同项目存储在不同的供应商Saas架构应用系统中),比如现在需要收集3个项目的实际入组数据(存储在2家供应商的IRT系统中)、计划入组数据(存储在CTMS系统中)。需要登录三个系统获取相应的数据,再逐级上报、汇总、分析、汇报。极度繁琐,浪费时间,且不能保证数据准确。   解决过程:采用数据接口,定时将各应用系统的数据传回本地,构建数据仓库模型,然后在数据仓库DM层将相关数据固定,这样就能够使用FineBI/FR去设计相应的仪表板来呈现数据。制作好入组计划/实际仪表板的截图如下所示:   148239   场景价值:数据汇聚使得分散存储于不同系统供应商应用系统的临床试验数据,实现数据定时回调本地,构建数据仓库能够使回调数据结构化、流程化、成体系的存储起来,实现数据统一管理、应用。通过FineBI/FR将相关数据更好的展示出来。解决了常规收集数据、整理、分析、汇报的繁琐流程,使得一键触达。   5 项目总结5.1CIO/项目负责人点评(偏向于宏观层面) (1) 传统行业的信息化需要尽早做好规划,企业普遍经营压力大,所以数字化建设要根据实际需求,务实推进;同时企业经营者的观念也需要及时转变,培养数字化的企业文化认同。   (2) 临床试验数字化转型,首先要将数据从各应用系统(Saas)中通过数据汇聚,存储到本地,才能进一步实现数字化转型,跨入临床试验数字化1.0时代。   (3) 如何利用现有临床试验产生的数据指导今后同类型的临床试验推进,是一件非常有价值的事情,我们将会投入更多的资源来探索临床试验的商业价值。   5.2经验心得(偏向于微观层面) (1) 了解业务需求,实现数据驱动业务将是大势所趋。项目的开展需要从标准化、体系化、精细化管理入手,将人们从复杂的报表中解脱出来。   (2) 梳理业务,构建数据指标体系是搭建数据分析平台最为核心的一个步骤。   (3) 数据分析的3种场景:   l  数据监测:长时间的对某一个数据进行实时监控,以时刻知道它的变化(看过去、看现在)。   l  数据预测:利用好当前的数据并使用合适的方法,来预测它的未来(看未来)。   l  数据检测:利用合理的手段,去针对某人某个产品或某个事件,判断它的好坏(看好坏)。   (4) 数据展示,不必过于花哨,简单实用、容易理解才是最重要的。 编辑于 2021-7-17 22:43  
【2021夏季挑战赛】工业制药-数据探究
一、选手简介1.1选手介绍网络签名白洋,目前就职于XXX制药公司,我司位列全国医药研发行业Top10。目前从事临床试验商业数据分析工作,个人感兴趣的方向和领域:如何帮助传统制造企业实施数字化转型,以数据资产,驱动企业业务优化。        1.2参赛初衷 目前大数据分析并未系统化的在临床试验领域大规模应用;我司成立数据BI小组,以深入探讨和挖掘临床数据与临床试验整体运营背后的商业价值。二、作品介绍2.1业务背景/需求痛点创新药研发、开发自主知识产权新药是传统制药企业保持市场竞争力、可持续发展的根本。为此,国内外的龙头制药企业均投入大量的资源用于新药研发。新药研发的特点是涉及的环节多、研究严谨,一般耗时10-15年,耗资可达数十亿美元,临床试验是其中最重要的一环。近年来,我公司创新药临床试验项目逐年增多,由最开始的几个项目增至一百多个,公司投入也逐年加大,传统的人工管理方式存在进度管控滞后、信息更新不及时、过程管理不规范等弊端,浪费大量人力、物力、财力。        为改善管理局面,研发部门开始使用相关的数据应用系统,包括IRT(随机系统)、EDC(临床数据管理系统)、CTMS(项目管理系统)等应用系统。但这些系统生成的数据仅仅作为证据,用来撰写临床试验报告,在新药完成试验后递交给国家药监局审查。以项目为范畴,独立存在。且以上系统均为SaaS架构,数据分散存储于不同系统供应商的平台上,无法实现统一管理。而实际上,这些数据的背后隐藏着每一类试验的关键节点、进度、受试者质量、财务花费是否合理等信息,覆盖到临床试验运营的方方面面。数据的价值,并没有得以充分的挖掘。如果能够成体系的将这些数据沉淀下来、标准化,对于类似我公司这样创新型药企来说,将大大提升临床试验的运营效率,节省研发成本,真正地用数据创造财富。        我们要做的就是要打通临床试验各应用系统的数据壁垒,结构化、流程化、成体系的将临床试验相关数据沉淀下来,搭建数据仓库,制定数据相关标准,进一步服务于临床试验运营的方方面面,挖掘临床试验数据的商业价值。       2.2数据来源本次参赛,使用了企业数据。相关人员对公司数据做了脱敏处理,最终确定使用DM层的4张数据表。分别是:项目级汇总数据集、中心级汇总数据集、受试者明细数据集、漏斗图专用数据集。本参赛作品计划针对以下几个问题: 1)宏观指标看板;2)从时间维度、地理纬度、项目维度等视角分析核心指标;3)多维漏斗图的应用(将12个维度分为4个大类,进行临床试验过程分析)。       2.3分析思路2.3.1 核心指标体系搭建业务流程上,临床试验中受试者的入组是重要节点。整个试验过程,受试者需参与的环节包含签署知情同意书、对受试者按照试验标准进行筛选、受试者入组(即开始服用试验药物)、受试者用药期间进行访视、异常出组、完成研究。         本次参赛我们提取了3个重要节点,分别是:参与筛选、入组、异常出组(即脱落)。相应的核心指标分别为:筛败率(入组率)、达成率(差值)、脱落率。   145014 图1-1:核心指标   145015 图1-2:指标体系思路   这里以达成率(差值)为例,进行核心指标体系的搭建: (1)指标拆解:达成率=实际入组人数/计划入组人数,差值=实际入组人数-计划入组人数。 (2)维度细分:时间维度(年份、月度)、项目维度(产品、项目)、地理纬度(大区、省份、中心) 说明:项目维度里,产品与项目是一对多的关系,即一个产品(药物)可能会针对不同的病症开展多个项目。 (3)数据口径定义。 (4)全面检查复核所有指标的口径和维度,并确定更新周期。 指标体系如下图所示: 145016 图1-3:达成率核心指标体系 同理,可以对筛败率、脱落率进行指标体系搭建。此处不再赘述。        2.3.2 看板模块结构依旧以达成为例:   整个数据看板可以分为6个模块:宏观指标查看、项目级别筛选、一级维度(年度)、二级维度(月度、项目、大区、省份)、三级维度(中心)、明细数据。   145017 图1-4:计划与达成看板架构 本次呈现的数据均为公司XXXX-XXXX年临床试验数据,数据已经过随机值处理和敏感信息处理。 2.4数据处理2.4.1 DM层数据集由ODS层数据、EDW层数据制作用于看板使用的DM层数据集。ODS层存储通过接口程序从多个应用系统抽取基础数据,在EDW层对数据进行清洗、转化、筛选、连接、汇总等操作,汇总成受试者级数据集、中心级数据集、项目级数据集,并专门整理了漏斗图专用数据集。数据处理过程均使用Mysql数据库,编写存储过程,自动化运行生成最终数据集,并存放在数据仓库DM层。        2.4.2 维度与度量值根据上文的数据指标体系,确定明确的数据指标及相关维度。数据指标为:                       差值=实际入组-计划入组;       筛败率=筛败人数/筛选人数;       脱落率=脱落数/入组数。维度最终确定为:       时间维度(年份/月份);       项目维度(项目);       地理纬度(大区、省份、中心)。        通过多个维度的交叉、联动,分析出相关指标的变化趋势,并依据历史数据预测未来一段时间内的数据,从而为相关业务人员制定合理的应对策略,持续、良性地推进相关项目进度。         2.5可视化报告2.5.1 看板整体布局以下内容以计划与入组为例进行梳理:(1)模块1,宏观指标展示。 145020         图2-1:宏观指标模块 宏观指标默认显示为总量,比如总的样本量(预期入组人数),总的产品数,总的项目数等等,会伴随看板其他模块的点击,产生数据联动,展示出相应的数据宏观指标。(2)模块2,项目级别筛选。 145042         图2-2:项目级别筛选模块 此饼状图(公司项目级别)可以将数据分为三类,集团重点、子公司重点、待定。       (3)模块3,一级分析维度(年份) 145021 图2-3:一级分析维度模块 在计划与达成看板中,年份倒序展示,突出最近一年的计划与入组情况,因为领导更看重差值,所以就做了差值这个指标替代达成率,且使用颜色变化体现在入组柱状图中。在数据提示中,用橙色突出显示。       (4)模块4,二级分析维度(月份、项目、大区、省份) 145022         图2-4:二级分析维度模块         使用Tab组件,将二级维度(月份、项目、大区、省份)集成到一起。通过数据联动,能够从多维度进行分析。同时也将差值这个指标,通过颜色体现在入组柱状图中。       (5)模块5,三级分析维度(中心) 145023         图2-5:三级分析维度模块        中心分布作为三级分析维度,放在了最后,因为中心层级已经基本接近于明细数据了。依旧是通过计划入组、实际入组这2个指标来展示,并将差值体现在入组的颜色上。因中心名称较长,故选取中心ID作为横轴标签,中心名称作为提示出现。       (6)模块6,数据明细 145024         图2-6:数据明细         明细数据展示了模块2-5所涉及到的所有维度,并对差值指标做了数据预警,指标(差值)大于等于0,即为达成,使用绿色向上箭头表示;指标(差值)小于0,即为未达成,使用红色向下箭头表示。        通过明细数据的展现,可以明确到各个中心具体进度,责任到人,有针对性地进行工作调整,避免资源重复浪费,提高整个项目的运营效率。        2.5.2 可视化分析        计划与入组看板最为核心的功能为联动分析。        2.5.2.1 概况        宏观数据:30种产品、57个项目、5713样本量、3899计划入组数、3683已入组人数、涉及医院232家。这些宏观指标会伴随年度(一级维度)、月度/大区/省份/项目(二级维度)、中心(三级维度)6个维度,及项目级别(饼状图)的变动产生数据联动。               2.5.2.2 项目类别(饼图)与时间维度-年份(柱状图)        可以对比分析两类项目在各年份的分布: 145027 图3-1:项目对比图1   145028 图3-2:项目对比图2   可以看到子公司重点项目相比集团重点项目,近三年达成情况相对乐观。如果要进一步分析原因,可以下钻到二、三级分析维度进行查看。               2.5.2.3 时间维度-月份、项目维度、地理维度(大区/省份)        (1)单维度分析        我们假定要分析2020年度入组情况,并下钻到低纬度去分析原因。点击2020年度,产生数据联动,分布图如下: 145029 图4-1:单维度分析 由上图可知,2020年度1-4月份入组都不是很理想,均为未达成状态,从5月份开始转好,除去7、10两个月,整体表现良好,并完成2020年度总计划。同理可以查看2020年度各项目的达成情况分布、2020年度各大区的达成情况分布、2020年度各省份达成情况分布。        结合以上情况,总结分析入组未达成的原因、入组转好的原因,找出有参考意义的信息或行为。        (2)双维度分析        我们假定分析前提为:XX年度XX项目,查看其他维度。我们点击2020年度,且点击1112X1项目。        我们可以查看2020年度1112X1项目各月份达成情况: 145030         图5-1:双维度分析1         由上图可知该项目在2020年度计划290,入组452,超额完成162,除去4月份未达成,全年各月份均已达成,且超额完成的贡献前三分别为12,8,9月份。        我们可以查看2020年度1112X1项目各大区达成情况: 145031         图5-2:双维度分析2         由上图可知该项目在2020年度,除去华北大区未达成,其余大区均达成,且超额完成的贡献前三分别为北京大区、华南大区、东北大区。        我们可以查看2020年度1112X1项目各省份达成情况: 145032         图5-3:双维度分析3         由上图可知该项目在2020年度,除去北京市、湖北省未达成,其余省份均达成,且超额完成的贡献前三分别为河北省、湖南省、江西省。        同理可以确定2020年度XX月份,查看各项目、各大区、各省份的达成情况分布。        同理可以确定2020年度XX大区,查看各月份、各项目、各省份的达成情况分布。        此处不再赘述。        结合多个项目在各省区的达成情况,找出是否存在规律性信息,如某类病症在某个大区发病率高,受试者入组情况好;后期如果再开展类似病症的研究,就可以优先考虑在该大区多设置试验中心。       (3)三维度分析        我们假定分析前提为:XX年度XX项目XX月份,查看其他维度。我们点击2020年度,且点击1112X1项目、点击12月份。        可以查看2020年度1112项目12月份各大区达成情况: 145033         图6-1:三维度分析         由上图可知该项目在2020年度12月份,除去华北大区、云南大区未达成,其余大区均达成,且超额完成的贡献前三分别为华南大区、北京大区、华东二区。        可以查看2020年度1112X1项目12月份各省份达成情况:        由上图可知该项目在2020年度,除去北京市、重庆市、云南省、湖北省未达成,其余省份均达成,且超额完成的贡献前三分别为河北省、湖南省、江苏省、江西省。        同理可以确定2020年度XX项目XX大区,查看各月份、各省份的达成情况分布。        同理可以确定2020年度XX项目XX省区,查看各月份达成情况分布。        此处不再赘述。        2.5.2.4 地理纬度-中心        (1)从上到下,可查看XX年度XX月份XX项目,各中心达成情况分布。        比如,我们假定2020年度11月份,1112X1项目,各中心达成情况分布。 145034         图7-1:地理纬度分析1        (2)从下向上,可以查看某中心,参与了哪些项目等信息。        比如,我们查看广东省1122医院参与了哪些项目。 145035         图7-2:地理纬度分析2         由上图所示,本中心参与了8个项目,从达成视角分析,有3各项目表现较好。5个项目未达成,可进一步分析原因。也可以进一步查看XX项目XX年份各月份达成情况。比如,我们查看广东省1122医院,1133-YIII期项目,2019年度各月份达成情况。 145036         图7-3:地理纬度分析3         由上图所示:3,9,10月份未达成,其余月份均达成,且2019年此项目全年度达成。贡献度前三的月份为: 6,5,4,1月份。        其它查询方案,此处不再赘述。        从中心维度,可以查看到某些中心在某一类药物或者病症上的研究优势,为后期中心选定提供参考。      2.5.2.5 明细数据 145037 图8-1:明细数据 由上图所示,明细数据包含了看板所有涉及到的维度,以及所有的指标。并对差值做了预警,未达成使用红色向下箭头标识;达成使用绿色向上箭头标识。      2.5.3 总结        综述,此次制作的看板,涉及地理纬度(大区、省份、中心);时间维度(年份、月份);项目维度(项目)。三大维度,6个细分;按照排列组合,总共有6+15+20+15+6+1=63种查询方案。同时包含6个宏观指标,1个下拉筛选框,1个筛选产品类别(集团重大/事业部重大/待定)。        此次制作的看板结构简单,图表没有过于花哨。但是为公司临床试验运营管理层提供了更为高效且准确的数据查阅与分析平台,通过BI系统实现了从宏观至微观的数据可视化呈现。该看板可以帮助运营团队减少一定的工作压力,但仍有许多的提升空间,希望能在此次大赛中学习到更多的经验去提升团队对BI系统的掌握及制作报告的能力。 最终呈现的页面布局如下图所示,因为使用Tab组件,所以只能显示部分图片。 145071 145124     三、参赛总结 3.1 FineBI 工具 ➢ 觉得比较好用的 BI 亮点功能如下: (1)Tab 组件,能够很好地控制看板的长度。 (2)联动功能,能够很容易的实现各组件之间的数据联动。 (3)复用/复制功能,能够很大程度上节省看板设计的时间。 ➢ 觉得不太人性化的地方如下: (1)Tab 组件中,每个 Tab 页面只能容纳一个组件。 (2)筛选框只能支持一个数据集,如果同一个看板引用了多个数据集来源,不能实现筛 选框的多数据集控制。 ➢ 对数据分析的价值的思考如下: (1)数据分析应用场景:数据监测、数据预测、数据检测。 (2)数据分析四维空间:人、货、场、时间。 (3)四大结论:        维度越低、检测越容易;        高维度的检测就要向低维度去拆解;        检测的方法就是先往下拆分,再左右比对;        要判断检测结果的正确性,需要从低维度,再回到高维度。    3.2 参赛总结 认知新感悟:每张看板图表类型不需要太过复杂、太过花哨,只需要把当前问题说明白即可, 有时候柱状图,饼图,条形图等这些基础图表反而更容易受到用户的欢迎。 作品视频 临床试验与BI结缘 工业制药-临床试验与BI结缘(作品内容).pdf (1.11 M) 编辑于 2021-8-10 10:19
个人成就
内容被浏览133,220
加入社区7年247天
返回顶部