一、选手简介
1.1选手介绍
本人目前从事于临床试验全流程业务数字化、可视化及商业决策数据分析领域,负责事业部临床试验智能决策分析平台构建,是事业部数字化转型项目倡导者与负责人。个人感兴趣方向:为传统制造企业实施数字化转型提供可快速落地方案,涉及数据获取、数据汇聚、数据仓库构建、数据指标体系搭建、数据分析等。
1.2 参赛初衷
传统制造业转型数字化驱动势在必行,临床试验数字化正处于起步阶段。目前只是借助于各应用系统,如IRT、EDC、CTMS等,并未将临床试验整个数据链条整合。事业部成立数据BI团队,以整合临床试验完整数据链条为基础,借助数据仓库,构建临床试验智能决策分析平台,以发挥临床试验数据巨大的商业价值。
二、作品介绍
2.1 业务背景/需求痛点
开展临床试验,需要面临多方面挑战。作为产品负责人需全方面统筹一个产品所涉及的所有临床试验。每一个临床试验涉及研究中心选取、受试者入组、里程碑规划、质量把控、财务风险规避等。产品负责人希望能够将多方面的数据汇总到一张看板,这样能够实时把控临床试验各方面情况,快速定位相关问题,找到相关负责人,进而快速解决问题,使临床试验健康推进。这张看板也因此需求而诞生。
2.2 数据来源
本次参赛,使用企业数据。相关数据已做脱敏处理,最终确定使用DM层10张数据表。涉及:试验基础信息、入组进度、里程碑、质量、财务等。
本参赛作品针对某一个产品开展的所有临床试验,做全方位的信息整合,涉及以下几个方面:
1)临床试验进度(里程碑进度、入组进度);
2)临床试验质量(重点突出稽查);
3)临床试验财务(重点突出研究中心费用)。
2.3 分析思路
2.3.1 分析框架
图1-1:临床试验分析框架
临床试验最为核心的3个模块分别为:进度、资金、质量。如何评测试验进度、财务花费、试验质量最为关键;如何构建临床试验健康度/风险控制两大评测模型也是现阶段的工作重点,此处不深入讲解。本次参赛只涉及简单的数据展示,后边若有机会可深入探讨。
2.3.2分析思路
图1-2:临床试验分析思路
本次参赛分析思路如上图所示,选取了10个层面的数据;因篇幅有限,不再详述应用场景、业务流程、核心指标梳理、指标体系构建等。若有兴趣,可以参考去年参赛作品《临床试验与BI结缘》,网址为:【2021夏季挑战赛】临床试验与BI结缘-帆软社区 (fanruan.com),也可私下共同探讨。
图1-3 临床试验分级管理
临床试验运营管理分为3级,分别为:产品、试验、中心,相关角色分别为:产品负责人、PM、CRA。检测问题需从高维度(试验)向低维度(中心)去拆解,然后再左右比对(试验、中心);再从低维度回到高维度,判断检测结果的正确性。方案执行从下到上。
2.3.3仪表板模块结构
图1-4:仪表板沙盘
本次参赛作品看板共分为2个部分:KPI指标卡7个;正文中章节10个。每个章节涉及相关分析维度、度量值、分析模型,此处不做详述。
2.4 数据处理
2.4.1 DM层数据集
由ODS层数据、EDW层数据制作用于看板使用的DM层数据集。ODS层存储通过接口程序从多个应用系统抽取基础数据,在EDW层对数据进行清洗、转化、筛选、连接、汇总等操作,生成目的数据集。
数据处理过程均使用MySQL数据库,编写存储过程,自动化运行生成目的数据集,并存放在数据仓库DM层。
2.4.2 维度与度量值
根据上文的看板模块构成,确定明确的数据指标及相关维度。
差值=实际入组-计划入组;
金额支付比例=已付金额/总金额;
入组进度=已入组数/合同签订入组数;
质量KPI=例次/发现项数。
合同主体(供应商/医院);
财务风险分析主体(试验/中心/合同);
地理纬度(大区、省份、中心);
里程碑维度(里程碑/关键节点/状态/开始标识/结束标识/耗时标识)。
通过多维度交叉、联动,观察相关指标变化趋势,分析背后原因,为相关人员制定合理的应对策略,快速落地。高效、高质量、成本合理控制,推进临床试验。
2.5 可视化报告
2.5.1 看板整体布局
模块1为看板第1部分
(1)模块1,宏观指标展示
图2-1:宏观指标模块
宏观指标默认显示为总量,比如总中心数、计划入组数,已入组数,总的试验数等。
模块2-11为看板第2部分,从图2-2可以看出,主题为药物临床试验,从Content可以看出正文可分为10个层面,分别为模块2-11。
图2-2:正文目录结构
(2)模块2,试验基础信息
图2-3:试验基础信息
左侧重点关注试验级别与试验分期;右侧突出问题点。
(3)模块3,试验中心信息
图2-4:试验中心信息
左侧重点关注中心所处状态及占比,中心所处地域,单个中心平均分配率;右侧突出问题点。
(4)模块4,试验入组信息
图2-5:试验入组信息
第1部分使用Tab组件,同时使用漏斗分析,展示了筛选-入组-脱落这一流程,以及对应明细数据;第2部分使用波士顿矩阵,将研究中心分为4大类;第3部分使用Tab组件,同时使用TOP10,突出重点关注数据。同时需关注每一部分对应的问题点。
(5)模块5,入组达成信息
图2-6:入组达成信息
本模块是去年参赛获奖作品的核心,维度:所属试验、年度、月度、大区、省份、中心,度量值:计划数、入组数、差值。其中年份倒序展示,突出最近一年计划与入组达成情况;中心分布放在最后,因中心名称较长,故选取中心ID作为横轴标签,中心名称作为提示出现;中心入组达成累计分布图使用帕累托模型;因领导更看重差值,故用差值替代达成率,且使用颜色变化体现在入组柱状图中。各维度间通过数据联动,能够从多维度进行分析,同时需关注右侧问题点。
(6)模块6,单产品当前里程碑分析
图2-7:单产品当前里程碑分析
该模块关注各试验所处里程碑,该里程碑开始标识/结束标识;同时需关注问题点。
(7)模块7,单个试验整体里程碑分析
图2-8:单个试验整体里程碑分析
该模块展示X试验整体里程碑进度、各里程碑开始标识/结束标识/耗时标识,并对各里程碑耗时数据进行展示(瀑布图),同时需关注问题点。
(8)模块8,单产品单关键节点分析
图2-9:单个试验单关键节点分析
该模块展示了X关键节点各试验的完成状态/开始标识/结束标识/耗时标识;各试验计划与实际耗时,使用差值标识是否延时完成,同时需关注问题点。
(9)模块9,单个试验关键节点分析
图2-10:单个试验关键里程碑分析
该模块展示了X试验各关键节点的开始标识/结束标识/耗时标识/明细数据,明细数据设置预警,查看相关节点详情;同时需关注问题点。
(10)模块10,产品稽查质量分析
图2-11:产品稽查质量分析
该模块使用Tab组件,从试验/中心/问题级别维度汇总了发现项;使用散点图对问题主类别/试验维度汇总了发现项、例次;同时需要关注问题点。
(11)模块11,产品财务分析
图2-12-1:产品财务分析
图2-12-2:产品财务分析
该模块从合同主体/试验分期/所属试验维度,展示了合同额/已付金额;从试验/研究中心/合同展示了付款进度风险与已付款金额风险;使用瀑布图展示各中心亏损情况;明细数据预警,查看相关详情;同时需关注问题点。
2.5.2 可视化分析
本次参赛作品几大亮点:
1)信息高度浓缩(去年参赛获奖作品作为本作品一个分析模块出现)
2)模块内(2-11)通过数据联动进行多维度分析
3)问题点提炼(为中高层领导解读仪表板)
4)多种数据分析模型应用(波士顿矩阵、帕累托分析、漏斗分析、描述性分析等)
2.5.2.1 概况
宏观数据:本产品包含13个试验、137个中心、325计划入组数、412已入组数、涉及合同金额6534万,已支付金额3530万、支付比例已达54%。
产品负责人最为关注入组进度与费用,入组与花费均会分摊到各研究中心,故选取以上宏观指标。
2.5.2.2 试验信息
图3-1:试验基础信息
问题点解读了饼状图/堆积柱状图,使用描述性统计分析方法,应关注重点推进实验、暂停试验,且清楚暂停原因。
图3-2:试验中心信息
问题点解读了饼状图/堆积柱状图/中心地域分布地图,使用描述性统计分析方法,应重点关注激活中心数及占比、中心区域分布,考虑入组进度与成本因素,评估样本量与中心数是否合理。
实例分析:点击柱状图中Pro01-ECL试验,通过数据联动可从饼图中看出:激活中心数及占比,同时可从地图中查看各中心分布;核实该实验所需受试者是否与中心分布一致,受试者存量是否充足,以验证中心选取是否合理。
2.5.2.3 试验入组信息
图3-3:试验入组信息
(1)第一部分
依据漏斗分析模型,重点关注各试验筛选量/入组量/脱落量;依据警戒线(平均入组率/平均脱落率),评估各试验情况是否在于期内,并给出相应解决方案;借助第二部分散点图,通过数据联动,可查看X中心在各试验情况对比。
(2)第二部分
依据波士顿矩阵模型,使用入组率均值/脱落率均值将研究中心分成4类,并针对每一类中心提出相关策略解决相应问题(详见问题点),以推进试验整体入组进度。
(3)第三部分
使用TOP10/TOP5对筛选量/入组量/脱落量做了红榜/黑榜展示,以突出需要重点关注的中心;同时使用雷达图展示了筛选量TOP10中心入组率/脱落率,借助警戒线对各中心优劣进行综合评估,并给出改善举措。
实例分析(1-3部分):从柱状图中可直接看出各试验入组率/脱落率,若入组率较低,则需分析原因并落地相关措施,提升受试者质量,以保证入组人数;若脱落率较高,则需分析原因并落地相关措施,防止后续受试者脱落,以降低脱落率,提升试验数据质量。点击柱状图中Pro01-ECL试验,通过数据联动,可从散点图中看到该试验各研究中心被划分为4类。理想状态是第四象限分布较多且气泡较大(高入组率、低脱落率、入组量高),若其它象限分布较多,则需要提出相关措施,来扭转局面。点击散点图中的圆圈,可以通过柱状图查看该中心在各试验的表现,用来分析入组率/脱落率是否稳定,是否可作为新开展其它同类别试验的备选,以降低新试验研究中心选择的风险(资源、时效、花费);通过数据联动,可以实时观察Pro01-ECL试验筛选量/入组量/脱落量TOP排名,对相关负责人予以相应奖励,同时可以根据雷达图,分析各中心的优劣,最终实现该试验整体入组进度。
2.5.2.4 入组达成信息
图3-4:试验达成信息
本部分是去年参赛获奖作品核心,使用Tab组件,将地理纬度(大区/省份/中心);时间维度(年/月);项目维度(试验)。3大维度,6个细分,依据排列组合,共有63种查询方案。最后一个Tab,使用帕累托分析模型,展示累计计划入组/累计实际入组80%所涉及的中心,依据入组进度需求调整对各中心的财务投入。
实例分析:试验维度点击Pro01-P-001,可查看该试验各年度入组达成情况;继续点击2021年,可查看21年各月度达成情况;继续点击04月份,可进一步看该实验21年4月份入组情况,结合大区、省份、中心。重点关注未达成大区、省份、中心。结合其它月份、年度,综合分析未达成原因,是偶然还是已持续很久,是人为原因还是资源不足等。然后落地相关举措,保证试验整体入组进度。
2.5.2.5 里程碑分析
图3-5:单产品当前里程碑分析
使用描述性统计分析方法,问题点解读了饼状图/堆积柱状图;应重点关注各试验当前里程碑,及其开始标识/结束标识,以判断当前里程碑进度是否可控,并给出相关措施。
图3-6:单个试验整体里程碑分析
使用描述性统计分析方法,问题点解读了饼状图/堆积柱状图;应重点关注X试验提前启动/不能正常启动里程碑及原因。及时复盘总结,落地相关策略,推进试验整体进度。
实例分析:Part 6中选取Pro01-P-003试验,从4个饼图中,可查看各里程碑的启动、结束及耗时情况,结合瀑布图综合分析。如点击第2个饼图中延迟启动,有5个里程碑是耗时小于计划,2个耗时等于计划,1个耗时大于计划。可分析出,延迟启动没有对这些里程碑造成大影响,只需要分析延迟启动原因,并做好复盘,应用于其它试验,则可能会提升其它试验的试验进度。
2.5.2.6关键节点分析
图3-7:单个试验关键节点分析
使用描述性统计分析方法,问题点解读了饼状图/柱状图;应重点关注X关键节点中,哪些试验已完成,提前启动/延误启动/提前结束/延误结束/提前完成/延误完成及相关原因;通过柱状图比对各试验计划与实际耗时,对新开展试验评估更加合理的工时消耗。
图3-8:单个试验关键里程碑分析
使用描述性统计分析方法,问题点解读了瀑布图/明细数据;应重点关注X试验提前启动/延误启动/提前结束/延误结束/提前完成/超时完成的关键节点及原因,及时复盘,总结经验教训,为新开展试验制定更为合理的工时。
实例分析:通过Part 7中筛选框变换,从4个饼图中查看每一个关键节点各试验的完成状态/启动状态/结束状态/耗时状态的个数统计,并对每一个关键节点查看各节点耗时,柱状图中,显示第一个关键节点在Pro01-P-001试验中超时,需分析超时原因,以便在其他试验避免同类原因;同时可以借助Part 8查看该试验所有关键节点耗时情况,已完成的2个关键节点均延误,此时产品负责人需找到相关试验负责人了解情况,找出具体原因,同时需要落地一些举措,保证后续关键节点进度,以降低对该试验整体试验进度的影响,避免对临床试验递交CFDA及审批上市造成影响,进而损失市场份额,影响集团收益。
2.5.2.7产品稽查质量分析
图3-9:产品稽查质量分析
使用了描述性统计分析方法,问题点解读了堆积柱状图/气泡图;应重点关注重大/严重发现项及占比;根据数据联动,同一个试验各中心对比,同一中心各试验对比;气泡图中,重点关注大气泡,气泡越大表明该发现项问题应尽快解决。
实例分析:点击试验-发现项,选择Pro01-ECL,通过数据联动,可查看中心-发现项:上海02医院/河南02医院有重要发现项,点击上海02医院,散点图中最大的圆圈表明问题主类8影响比较大,需要重点解决。当然也可从散点图开始,然后通过数据联动,分析中心及试验。
2.5.2.8产品财务分析
图3-10-1:产品财务分析
图3-10-2:产品财务分析
问题点解读了饼状图/柱状图/散点图/瀑布图/明细数据;使用波士顿矩阵分析模型,应重点关注2个财务风险:已支付比例/已支付金额;后期可将这两个风险点与其他风险点共同考虑,加入权重,组合为合理的风险模型,促进财务风险精准把控。
实例分析:通过饼图查看医院费用占据90%以上,I期占比40%,结合试验基础信息,分析出每类分期,单个试验费用值。通过柱状图,可分析各试验费用比重。第一个Tab图,点击最大圆圈(整体不存在已支付比例风险),查看研究中心,发现部分研究中心为红色,存在风险,同时查看相关合同,可看出本试验中,哪些中心、哪些合同存在已支付比例风险。然后跟相关负责人沟通,分析是中心选择原因,还是工作不到位,还是合同金额虚高等,需落地相关举措,解除相关风险,若不能解除,则需报告上级负责人,共同制定后需解决方案。
模块2-11,可单独看每一部分,也可多部分综合查看,分析视角非常丰富;因篇幅有限,上文也仅仅是简单列举几个实例分析,如有兴趣,可在评论区共同探讨。
PDF格式.pdf (2.2 M)
2.5.3 总结
综述,此次制作仪表板,信息高度浓缩,分析层面较多;模块内可实现数据联动,多视角分析;分析模型较为丰富;问题点提炼精准,能够深入解读报告,降低中高层用户学习成本,快速定位问题。
看板结构虽简单,但是为产品负责人提供了实时、准确且全面的数据查阅与分析平台,实现了对某个产品所有临床试验的精准把控。
在中心筛选方面提供数据依据,精准选择最佳研究中心,时效整体缩短15%;针对各类研究中心,原因定位迅速,落地相关策略后,使得入组率提升近20个百分点、脱落率降低5个百分点;针对入组达成,原因定位快且精准,落地相关策略到位,整体达成率相比之前提升了近10个百分点;质量稽查方面,可迅速定位主要问题点,整改目的性较强,进而推至其他研究中心,后续稽查工作量有望降低30%;财务风险方面,可以从试验、中心、合同,逐级定位,迅速查找风险点,进而落地规避措施,粗略统计,规避风险金额可达数百万元。
该看板可以实时为产品负责人提供丰富的数据参考,以便及时从中心筛选、中心管控、入组进度、质量稽查、财务、整体试验进度方面发现问题,分析原因,落地相关策略,最终能够及时完成临床试验向CFDA递交,最终完成上市,为公司产生巨大效益。但仍有许多提升空间,希望能在此次大赛中继续提升个人及团队整体能力,同时为构建临床试验健康度/风险控制评测等模型起到抛砖引玉的功效。
三、参赛总结
3.1 Fine BI工具
(1)Tab组件,能够很好地控制看板的长度。
(2)联动功能,能够很容易实现各组件之间的数据联动。
(3)复用/复制功能,能够很大程度上节省看板设计时间。
(1)警戒线不能自定义函数构造公式,期待后边可实现自定义函数作为警戒线。
(2)简道云(数据工厂)模块可尝试集成到BI,增强BI的ETL功能。
(3)提示信息有覆盖,比如气泡图,大气泡覆盖小气泡,则小气泡提示信息不能展示。
3.2 参赛总结
对数据分析能力的理解:数据分析思维是道,数据分析方法是术,数据分析工具是器;如何感悟自己的道(功法),如何修炼自己的术(招式),如何选择自己的利器(兵器),是我们提升数据分析能力时时刻刻需要思考的问题。
对数据分析的理解:洞察数据背后的问题,用简单的形式表述出来,用能够落地的策略去执行,产生可观的改善效果与价值,能够结合实际情况不断迭代与完善。
牢记:大道至简。 |