一、选手简介
1. 选手介绍
帆软社区用户名Zoe张,目前就职于某交易所,从事数据分析工作。使用FineBI、FineReport、数知鸟、FineDataLink、简道云等软件近4年时间,曾多次参加帆软组织的活动,也曾带领过前公司参加比赛并拿到过2021年夏季挑战赛最佳行业应用奖和2022年中国数据生产力大赛银奖,持有多项帆软高级认证证书,做过课程助教,一直与帆软公司保持良好的沟通,也对软件的建设提出过意见与建议,可以说4年的时间看着帆软软件不断更新迭代优化,同时帆软也伴随了我的职业成长。
2. 参赛初衷
首先,本人接触帆软产品时间久,第一份数据分析工作就是使用FineBI作为工具,从免费版用到企业版,再到集群,可以说经验较为丰富,对于帆软公司和FineBI软件都是有感情的。
其次,现在使用FineBI的人越来越多,大家对于好的作品定位也更高了,继续参加比赛可以了解与各位参赛选手之间的差距,从而发现自身存在的问题,向各位老师学习,明确自己目前职业的市场定位。
第三,本人目前就职的单位在数据分析这方面处于刚起步阶段,后期肯定是需要进行业务方面的推广,所以也需要向大家学习推广经验。
最后,因为已经连续参加了三年比赛,同时报名了本年度MVP竞选,需要通过参赛获取评选的更多可能。
二、作品介绍
1. 业务背景/需求痛点
我司属于技术交易所,主要的工作是对希望进场交易的技术进行确权确价(确定权属和确定价格),然后挂牌交易。目前比较常见的交易类型是专利的转让和售卖,一般通过交易数量和交易金额反映交易情况。
对于卖方来说,首先需要先为自己的产品申请专利,但不是所有的申请都会成功,在申请成功的基础上,才可以进行相关交易。所以对于未进行过交易的专利申请人来说,在进场时最关心的就是专利申请成功率和预估成交总价(预估成交总价=预估成交次数*建议成交单价)。专利申请成功率直接影响产品是否能进行专利交易,预估成交总价通常用来和当前研发投入进行对比,如果预估成交价格过低,那么很可能无法收回成本,也就没有必要继续投入资金和专利申请了。
例如,某家企业制作了一款软件,现在打算申请软著专利并进行交易,软件当前的制作成本为10万元,期望定价2万元一套,那么需要成交至少5次才可以收回成本。现在该企业在还未申请专利的情况下,找到交易所,希望通过交易所对软件是否能成功申请专利、可成交次数和定价做评估,那就需要知道现在市面上是否有相同或者类似功能的软件,这些软件是否成功申请专利,相关专利是否也进行过交易,交易过几次,售卖单价又是多少。
对于交易所来说,则需要将该产品和市面上的其他软件专利来进行相似度匹配,例如从软件涉及的行业、交易类型、买卖方所属地区等多维度来计算专利申请成功率、成交次数和成交价格的平均值,从而给出一个专利申请成功概率、预估成交次数和建议成交单价。
假设计算得出目前该地区软件专利申请成功率为95%,专利平均成交价格为1万元,平均交易次数为20次,那么就可以建议该企业申请专利并降低单价进行交易;假设目前该地区软件专利申请成功率只有70%,专利平均成交价格为3万元,但平均交易次数只有2次,说明很有可能申请了专利进行交易也无法成功或者无法收回成本,需要给该企业风险提示。
所以,对于交易所来说,本次数据分析的目的是:需要针对不同省份、行业、类型、专利类型的专利申请人,通过相关筛选条件,得出专利申请成功率和预估成交总价,出具一份可套用模板的、有说服力的专利交易综合情况报告。
2. 数据来源
国家知识产权局有专利相关数据年鉴可下载,按照分析思路,仅下载按照省份进行汇总的统计值。
交易相关内容的保密性很高,尤其是涉及交易金额的部分,属于商业秘密,所以无法直接使用行业相关数据参赛,只能制造一些虚拟数据,因此设置虚拟行业、虚拟次数和虚拟金额。
2.1. 各地区专利相关数量统计
本次涉及的专利分析数据分为两个层次,分别为:专利申请数和专利授权数。数据均来自国家知识产权局官网,通过数据-统计报告查询-国家知识产权局统计年报进入年报统计界面,从2020年起数据较为完整,且与专利申请时长大致相当,所以收集近三年的数据,并且按照年份、申请人类型和专利类型进行数据下载后整理。
网址链接如下:
2020年年报数据:https://www.cnipa.gov.cn/tjxx/jianbao/year2020/indexy.html
2021年年报数据:https://www.cnipa.gov.cn/tjxx/jianbao/year2021/indexy.html
2022年年报数据:https://www.cnipa.gov.cn/tjxx/jianbao/year2022/indexy.html
下载数据样例如下:
2.2. 各地区各行业交易数量、金额统计
交易相关数据保密要求极高,因为其中涉及许多行业秘密,尤其是交易双方的基本信息、交易次数信息、交易金额信息等,即使是做数据脱敏处理也不可以直接对外披露,只能通过国家相关统计年鉴查询汇总值。所以为了方便起见,直接虚拟了行业、成交次数和成交单价信息。
一般来说,专利数量高的省份交易也更为活跃,所以交易相关数据使用各地区专利相关数量统计中的专利授权数作为基数,进行一些数据再加工后得到。具体再加工步骤参见数据处理模块。
3. 分析思路
首先明确专利交易综合情况分析需要得出以下两个结论:一是专利申请成功率,二是预估成交总价,其中,预估成交总价又是通过预估成交次数乘以建议成交单价得出的,所以需要分为三个方向进行计算。并且结论一定要清晰的在最上方进行展示,同时和全国平均值进行对比。
结构脑图如下:
其次,得出结论后,对于专利申请人来说,可以考虑换一个专利成功率更高的地区进行专利申请,或者去其他预估成交总价更高的地方进行交易,从而获得更高收益,那么也需要在下方展示整体数据,适当标注一些TOP分析,这样也是为申请人提供一些更好的方案。
界面设计脑图如下:
3.1. 专利申请成功率
专利申请成功率=专利授权数/专利申请数(按地区)
专利分为发明专利、实用新型专利和外观设计专利三种类型,由于不同专利的申请人类型、审核过程、所需材料不同,专利的申请时长在6个月-3年都有可能,通过率也各不相同。所以,需要获得各年份、各地区、各专利类型和申请人类型四个维度的专利授权数和申请数数据。
从全国总体专利申请成功情况来看,一般在60%-90%之间,某些年份地区可能存在授权数大于申请数的情况,也就是申请成功率可能超过100%,这也是正常的,不同申请类型的申请时长不一样,还有很多时候会需要补充材料重新申请,所以从申请到授权很有可能不在同一年内发生,就会导致某年或者某地区的成功率浮动。
从近三年的平均申请数和授权数来看,总体申请成功率大约在80%,这也是大致符合当前专利授权情况的。因此,使用专利授权数/专利申请数可以大概算出专利申请成功率。
3.2. 预估成交总价
预估成交总价=预估成交次数*建议成交单价(按地区/按行业)
预估成交总价可以直接反馈交易是否赚钱,如果价格高于成本价,那就说明专利申请并成交是有意义的,如果低于成本价,尤其是在市场上已经有大量类似专利的情况下,很可能亏本,此时对于专利申请人来说,需要谨慎考虑,毕竟专利申请也需要投入时间成本。
3.2.1. 预估成交次数
预估成交次数=平均成交次数(按地区/按行业)
预估成交次数如果高于全国该行业平均值,说明在该地区进行交易成功率较高,可以大力在该地区推广交易,如果低于全国该行业平均值,可以考虑是否可以去其他省份进行交易,列举其他交易次数TOP的省份以作参考。
3.2.2. 建议成交单价
建议成交单价=平均成交价格(按地区/按行业)
建议成交价格如果高于全国该行业平均值,说明在该地区成交价格较高,可以结合预估成交次数看成交总价,原理同上。
4. 数据处理
4.1. 各地区专利相关数量统计数据处理
各年份、地区、专利类型、申请人类型的专利申请数、授权数是关键指标,该指标直接从网站下载后整理得到。之后的所有数据处理都基于该表进行。
4.2. 各地区各行业交易数量、金额统计数据处理
由于交易相关数据保密性极高,专利数量和交易频次一般都是正相关,所以关于各地区各行业的交易数量、交易金额都使用各地区专利相关数量统计中的专利授权数作为基数,进行了数据再加工。
4.2.1. 逻辑确认
以下均为虚拟行业、交易数量和交易单价的定义:
l 虚拟行业
国民经济行业分类是由国家统计局起草的,国家质量监督检验检疫总局、国家标准化管理委员会批准发布的国家标准,使用线分类法,一共分为20个门类,其中又分为大类中类小类。由于行业数量较多,现虚拟5个行业:分别命名为行业A、行业B、行业C、行业D、行业E。
由于专利数量没有行业,所以将专利申请数和授权数都取平均值,使得总值相同。
例如:某地区某年专利授权总数量为10000,行业平均授权数量为2000。
l 虚拟成交数量(预估成交次数)
成交数量按照地区(专利授权数量*1.76+8213)/59.8-74后取整。再根据行业按比例进行分配,分配比例如下:
行业
|
行业A
|
行业B
|
行业C
|
行业D
|
行业E
|
分配比例
|
10%
|
15%
|
30%
|
20%
|
25%
|
例如:某地区某年专利授权总数量为10000,虚拟成交数量为(10000*1.76+8213)/59.8-74=357.65,按照比例分配后取整分别为:36,54,107,72,90。最后,再根据三年平均值作为预估成交数量。
l 虚拟成交单价(建议成交单价)
成交单价按照地区(专利授权数量*1.38+76432)/2.97*0.42-635后取两位小数。再根据行业按比例进行分配,分配比例如下:
行业
|
行业A
|
行业B
|
行业C
|
行业D
|
行业E
|
分配比例
|
13%
|
11%
|
36%
|
18%
|
22%
|
例如:某地区某年专利授权数量为10000,虚拟成交单价为(10000*1.38+76432)/2.97*0.42-635=12125.08,按照比例分配后取两位小数分别为:1576.26,1333.76,4365.03,2182.51,2667.52。最后,再根据三年平均值作为建议成交单价。
使用年份、虚拟行业、成交数量和成交单价的比例表格,命名为【对接excel】,为未来做左右合并提供便捷条件:
4.2.2. 数据处理步骤
由于行业是虚拟的,所以先对所有年份、地区、专利类型和申请人类型的专利申请数量和授权数量做平均值处理,即所有的值/5:
接下来与【对接excel】做左右合并,插入5个虚拟行业分类,实现每个年份、地区、专利类型、申请人类型和行业的1:5对应:
接下来根据之前的计算逻辑,新增预估成交次数和建议成交单价字段:
最终,仅保留与报告相关的字段:
4.2.3. 仪表板添加计算字段
由于专利申请成功率和预估成交总价是需要汇总后再计算的,需要使用SUM_AGG和AVG_AGG函数,所以放在仪表板中添加计算字段。
5. 可视化报告
5.1. 筛选条件
筛选条件主要分为省份行政区划、所属行业、申请人类型和专利类型四种,根据专利申请人所属地、行业和专利类型进行筛选,筛选结果需要控制下方各组件。
具体控制组件名如下:
【省份行政区划】不控制全国相关组件;【所属行业】不控制行业相关组件;【申请人类型】不控制申请人相关组件;【专利类型】不控制专利类型相关组件。
5.2. 关键指标展示与解读
关键指标主要由专利申请成功率、建议成交单价、预估成交次数和预估成交总价构成。使用KPI指标卡置于最上方。
5.2.1. 地区关键指标
使用所有筛选条件控制以下四个指标卡,用于展示地区关键指标。
5.2.2. 全国关键指标
使用除了省份行政区划以外的筛选条件控制以下四个指标卡,用于与地区关键指标进行对比。
5.2.3. 全国专利申请成功率TOP5
使用除了省份行政区划以外的筛选条件控制,展示申请成功率最高的五个地区,用于参考。
5.2.4. 全国预估成交总价热力地图
使用除了省份行政区划以外的筛选条件控制,展示预估成交总价最高的三个地区,热力图形式用于参考。
5.2.5. 全国预估成交总价排名
使用除了省份行政区划以外的筛选条件控制,展示全部省份地区的预估成交总价,高于100万的笑脸标注,用于参考。
5.2.6. 关键指标解读
在最左侧插入文本用于解读关键指标,自动带入数值,对所选地区的指标标绿,全国指标标红,方便专利申请人自行对比。
5.3. 趋势分析
按照年份对专利申请情况与预估成交情况进行线形图和组合图综合展示,以反馈近三年的趋势情况。
5.4. 行业分析
由于行业是虚拟的,所以专利申请成功率都相同,只能对其进行预估成交情况的分析和流向分析,流向分为申请人-行业流向和专利类型-行业流向。
对比柱状图可以看出成交次数与成交单价之间的大致关系,例如图中行业B成交次数高但单价低,行业A成交次数低但单价高,其他行业成交次数和单价基本成正比。
流向图可以看出申请人类型和专利类型向行业的流向,例如图中企业和实用型专利流向行业C的金额是最高的。
5.5. 申请人类型分析
按照专利申请人类型进行成功率和预估成交分析。
雷达图可以看出哪种申请人的申请成功率最高,一般来说高校科研院所和事业单位都较高,企业最低,这与我们认知是相同的。
点图可以看出,一般企业的专利成交次数和价格是最高的,与专利申请成功率恰好相反。
所以对于专利申请人来说,专利申请成功率和预估专利成交情况一般成反比。
5.6. 专利类型分析
按照专利类型进行成功率和预估成交分析。
三种专利类型中,实用型专利和外观设计专利的申请成功率较高,发明专利因为审查时间久、要求高等特性,导致普遍申请成功率较低。
实用型专利一般成交次数和成交金额都较高。
对于专利类型来说,专利申请成功率和预估专利成交情况一般成正比。
5.7. 地区分析
按照地区进行成功率和预估成交分析。
从专利申请情况来看,港澳和西藏等偏远地区的成功率较高,发达省市如北京、上海、江苏、浙江等,都处于中等序列。
从成交次数和单价来看,广东、浙江、江苏、上海等都是排在前列的,这与现在各省市的发展情况和经济状况相符。
5.8. 最终页面效果
公共链接:https://bisolutions.fanruan.com/webroot/decision/link/2zDv
以下是两种筛选条件下的页面:
1. 上海-行业A-企业-外观专利设计
2. 四川-行业D-事业单位-实用型专利
三、参赛总结
1. FineBI工具
本人使用FineBI已有近四年时间,之前一直使用的5.0版本,今年四月份才从5.0升级到6.0版本,两个版本的界面有很多不同之处。比如不再区分处理用户和分析用户、取消了分析性质的自助数据集、公共数据集和我的分析完全分开等等。但其实究其根源逻辑,是想要对公共数据集统一集中管理,对于管理员来说更加方便统一管理,对数据的抽取和权限进行及时监控处理。
刚开始上手,说实话有点懵,毕竟仪表板界面等于全部修改了,一点开我的分析,就是选择数据集进行处理的原数据集界面,底下的tab页刚开始没注意也是找不到做仪表板的地方,但是试用之后感觉还是不错的,尤其是对于一个需要大量原数据集进行左右合并等处理的仪表板,在找数据集的时候不需要重复的去二次选择了。当然,对于普通用户来说,是需要重新了解制作过程的,当然,帆软也贴心的整理了6.0版本详细的帮助文档和视频教程。
在这一两个月的使用过程中,我已基本掌握6.0的使用方法,当然因为也使用过帆软的其他产品,所以对于几个产品的适用场景都比较了解。对于FineBI来说,更加适合自助分析,尤其是业务部门的自主分析,能够快速得到统计结果并进行展现,基本公式和excel大同小异,所以上手很快,也很容易向下推广。当然,FineBI也有一些无法满足的场景,比如展示不够灵活,在不同显示器不同分辨率的情况下,还是容易出现展示内容不全或者过长过宽的问题,也无法做预测分析,仪表板想要做到较为自动化的文字型输出较为困难,只能通过固定模板固定内容进行填写。
对于我本人来说,数据分析是一份工作,所以分析思路会更加清晰一些,但是对于把数据分析作为辅助工作内容的业务同事来说,想要直接上手FineBI是需要一些时间的,刚开始可能只会简单的汇总统计,也不想花时间花精力去专门研究,所以推广起来还是有些难度的。
2. 参赛总结
本次参赛其实在制作方面并没有什么特别之处,因为使用很长时间了,也总结出了一套比较合适的模板和样式,所以在组件制作或者文本书写方面没有太多问题。
但对我来说,最困难的是找数据和分析思路的确定。因为数据保密性要求,无法使用行业数据参赛,但是很多内容又必须通过行业内容进行展现,我先后尝试了很多种方法:全部使用公开数据的话,可分析内容太少;用行业脱敏数据的话,不合规;行业分类太多的话,计算复杂,展示也乱。在多次尝试后,最终决定放弃过多的行业分类,使用虚拟行业、虚拟交易次数和虚拟交易金额进行数据分析。
另外,如何计算虚拟交易次数和虚拟交易金额也是个大难题,虽然是虚拟的数据,但是成交次数和金额要和我们平时的认知基本相同,比如技术交易市场中,长三角、珠三角、京津冀这几个片区一般都是交易数量和金额最大的地区,公式也不能太过于简单,如果只有乘法和除法,次数和金额一定是成正比的,但是在日常交易中,肯定有交易次数少但金额高的行业,比如生物医药行业,也肯定有交易次数多但金额低的行业,比如计算机软件行业。所以,需要兼顾到基本认知,经过多次计算方法调整,才决定了最终版本。
其实,真正计算成交金额和成交数量需要大量的交易数据做支持,每个类型的平均专利申请时长也是完全不同的,基本都无法在同一年完成申请和授权,所以最优的情况下,可以拿到每个专利的申请时间和授权时间,计算两者之间的时间差,再进行分类,例如按每60天为一档,再进行专利申请成功率的统计。而成交金额和成交数量,也需要交易的全部数据,按照行业、合同类别等进行统计。
所以,如果使用真实专利和交易数据进行展示,报告的价值会更高也更具有说服力。
|