【2022BI数据分析大赛】跨市场股价运行监测与分析
Your browser does not support video tags.
一、选手简介
(一)选手介绍
李文卓(队长),在读硕士研究生,中国地质大学(武汉)经管学院应用统计专业。个人感兴趣的研究方向是金融领域的数据挖掘分析。主要负责数据采集以及利用FineBI工具进行数据处理和分析。
李轩(组员),在国内某证券市场监管机构从业,具有多年的证券市场数据分析工作经验。主要负责业务背景、业务需求和痛点分析等,为数据分析功能界面的设计和布局提供思路。
(二)参赛初衷
第一,目前我们身处大数据时代,每天都有海量的数据在增加,无论对于企业还是个人,都迫切需要对数据进行不断地监测和分析,快速获得对业务开展或领导决策有价值的信息,提升竞争力。因此,掌握一种数据分析和可视化工具尤为重要。
第二,前期对FineReport使用较多,在定期的数据报表方面具有很大优势,但对FineBI接触较少,对其功能使用不够系统和深入。因此希望通过本次比赛进一步加强对FineBI的学习,并通过与实际业务场景相结合的方式,来验证FineBI在数据可视化分析方面的优势,为未来持续开展数据可视化分析奠定基础。
第三,拓展自己在数据可视化分析方面的眼界,包括了解更多数据可视化方法、经验、案例等,以及结识更多同道中人。
二、作品介绍
(一)背景介绍
1.业务背景
近年来我国多层次股票市场加快发展,目前形成了上海、深圳、北京“三足鼎立”的三大股票市场,上市公司合计超过4500家,股票市值合计超过80万亿元。“股市是实体经济的晴雨表”,市场的平稳运行对金融、经济和资本市场稳定都具有十分重要的意义,防止股市大起大落、暴涨暴跌是监管部门最重要的日常工作职能之一。
在日常的监管工作中,监管人员需要每天动态掌握股价的变化情况(即“盯盘”),以保持较高的市场敏锐性,以便在市场出现大涨或大跌时及时开展形势分析和研判,必要时可能需要研究相关稳市措施。
2.需求痛点
业务需求痛点主要有以下三个方面:
第一,日常工作中监管人员的时间有限,每天不可能花过多时间寻找数据来了解市场运行变化情况,迫切需要一目了然或者操作非常简单且很实用的数据监测分析工具。
第二,国内各金融资讯信息商(如东财、万得、同花顺等)均推出了各自的金融终端(含PC端和移动端),汇集了各类数据信息,但主要以面向投资者用户为主,难以满足市场监管人员的个性化需求,在了解不同市场的运行情况时往往需要进入不同界面,不便于快速了解跨市场股价变化运行情况。
第三,监管机构内部建立了市场监察系统,具备股价监测分析功能,但一般部署在监管机构的内部网络中,受固定场地和网络环境限制,监管人员难以便捷地观察分析股价变化走势情况。
(二)数据来源
本次参赛所使用的数据主要来自东方财富Choice金融终端、聚宽(JoinQuant)量化交易平台、申万指数官网,相关数据均可通过公开渠道获取,即本次参赛所使用数据均为已公开数据。初始数据情况如下表所示:
表1 初始数据情况
序号
数据文件名称
数据类型
数据频次
数据含义
1
0401_index
MySql表
2022年4月1日每分钟数据
沪、深、京市场指数行情数据
2
0401_Asia_index
MySql表
2022年4月1日每分钟数据
亚太地区主要市场指数行情数据
3
0401_Europe_index
MySql表
2022年3月31日数据
欧美地区主要市场指数收盘价
4
0401_industry
MySql表
2022年4月1日每分钟数据
申万行业指数行情数据
5
0401_sh_main
MySql表
2022年4月1日每分钟数据
上海主板个股行情数据
6
0401_sh_kc
MySql表
2022年4月1日每分钟数据
科创板个股行情数据
7
0401_sz_main
MySql表
2022年4月1日每分钟数据
深圳主板个股行情数据
8
0401_sz_cy
MySql表
2022年4月1日每分钟数据
创业板个股行情数据
9
0401_bj_main
MySql表
2022年4月1日每分钟数据
北京交易所个股行情数据
10
0401_base_info
MySql表
2022年4月1日数据
所有A股股票的基本信息
11
每日各市场指数
excel文件
2021年12月1日以来每日数据
境内外主要市场指数行情数据
12
每日申万行业指数
excel文件
2021年12月1日以来每日数据
申万行业指数的收盘行情数据
(三)分析思路
总体思路可以概况为:从实际业务需求和痛点出发,明确分析重点并对任务进行拆分,围绕子任务并结合实践经验选取合适的分析维度和指标;同时,进一步学习FineBI的数据加工和可视化功能,匹配结合需要分析的业务问题,进行可视化设计和布局,最后验证可视化结果的业务应用价值。
图1 数据可视化分析总体思路
1.提出问题
需解决以下三个实际问题:第一,如何让监管人员实时地掌握境内外各市场股价运行总体情况?第二,如何让监管人员直观地了解近期境内外各市场股价整体走势?第三,如何让监管人员便捷地分析引起市场涨跌的结构性原因?
2.分析目标
目标一:掌握境内外市场股价变化总体情况。对境内外主要股票市场的股价运行进行整体分析,便于监管人员进行横向比较,一目了然地掌握全球股票市场整体运行情况,快速做到心中有数。
目标二:了解境内市场股价变化的结构性因素。在市场出现大涨大跌或需要进一步深入分析时,为监管人员提供结构化的分析维度,便于了解当前市场涨跌或近期以来的运行走势可能是什么原因导致的,比如具体是由哪些行业板块涨跌引起的、哪些个股表现最突出,以及主力资金的买卖行为等。
3.任务拆解
围绕上述问题目标,我们将总任务拆分为以下三个子任务:
任务一:对当日盘中股价进行实时监测:聚焦境内市场,实时动态展示A股市场(包括沪市、深市、京市)的股票价格总体变化情况;同时进行结构性分析,实时展示各行业股票价格整体变化情况,以便快速了解哪些行业对大盘影响较大;此外,进一步对活跃的头部股票进行展示,以便了解具体哪些股票对行业影响较大。
任务二:对当日盘中个股信息进行多维分析:满足监管人员在“盯盘”时对其感兴趣的个股进行灵活查询和分析,及时了解相关股票的量价变化情况。
任务三:对近期市场股价运行走势进行分析:由于当前的股价变化很可能是近期趋势的延续,因此在监测分析当日实时股价变化的同时,还需对近期的市场历史走势进行分析。比如对近期境内外市场的走势进行横向比较,以评估各市场是否具有联动效应;对近期各行业板块的价格走势进行横向比较,了解各行业板块的价格变化的结构性特征;以及对近期的资金行为进行分析,了解投资者的资金动向,进一步研判市场情绪等。
图2 总任务拆分为三个子任务
4.具体指标选取
聚焦上述目标任务,需要从股票市场的大量指标中选取合适、重要的指标,使得数据指标对业务需求形成有效支撑,满足监管人员通过观察这些指标,就能在短时间内大体掌握境内外股票市场的实时价格变化情况和历史走势分析。
(1)价格指标
价格指标是监管人员重点关注的指标,也是我们需要重点筛选和加工分析的指标。有三个层面:从市场层面来看,目前境内外各股票市场均编制了大量的股票价格指数,以反映该市场股票整体价格变化和走势情况,境内关注度最高的股票指数有:上证综指、深圳成指等。从行业板块层面来看,境内相关证券公司和金融资讯信息商推出了上市公司行业分类体系,如申万行业分类、中信行业分类、万得行业分类等,并以此为基础编制了各行业板块的股票价格指数,以整体反映相关行业板块的股价变化情况。从个股层面来看,对于单只股票,反映其价格变化的重要指标有涨跌幅、振幅等。
设计开发新的指标:北交所由于成立时间较短(于2021年11月15日正式开市运行),目前监管机构尚未推出市场指数。为了模拟反映北交所市场整体股价情况,我们参考中证指数公司和国证指数公司的指数编制方法,初步编制了北交所股票指数(简称为“北证指数”),以此作为度量北交所市场股票价格指标。北证指数的选样标准为在北交所上市的全部A股,以2021年11月15日为基日,基日指数为1000点,计算方法采用可流通股本数加权,采用以下公式逐日连锁计算:
表2 境内外主要市场指数价格类指标
跨市场
一级指标
二级指标选取
具体指标
境内市场
沪市
上证指数、科创50
昨日收盘点位、今日开盘点位、今日最高点位、今日最低点位、当前点位、涨跌幅
深市
深证成指、创业板指
京市
北证指数
欧美市场
美国
道琼斯工业指数、纳斯达克指数标普500
英国
英国富时100
法国
法国CAC40
德国
德国DAX
亚太市场
韩国
韩国综合指数
日本
日经225
香港
恒生指数
台湾
台湾加权
新加坡
富时新加坡海峡时报
表3 单只股票的价格类指标
指标分类
具体指标
计算口径
基础指标
证券代码、证券简称、所属行业、昨收价、最低价、最高价、当前价、总股本、流通股本、市盈率
——
衍生指标
涨跌幅、振幅、换手率、总市值、流通市值
1.涨跌幅=当前价/昨日收盘价-12.振幅=最高价/最低价-13.换手率=当前累计成交股数/流通股本4.总市值=当前价*总股本5.流通市值=当前价*流通股本
(2)成交量指标
从日常监管工作实践来看,监管人员在重点关注市场价格变化和走势情况的同时,有时还需要了解市场成交量情况,一般为全市场或个股的成交金额。
(3)其他指标
(1)市场情绪指标:为了便于监管人员迅速掌握当前A股市场的总体运行情况,我们引入市场情绪指标。该指标可以采用股票涨跌比来度量,即上涨的股票较多时,表明市场情绪高涨;下跌股票较多时,表明市场情绪低落。
(2)资金行为指标:资金的买卖行为是股市涨跌的幕后推手,是监管人员关心的核心指标之一。具体看,我们选取关注度高、影响力大的北向资金净流入额、主力资金净流入额这两个指标。其中,北向资金被誉为A股市场的“聪明钱”,即来自香港和国际投资者的买卖A股相关股票的资金。主力资金由超大单和大单组成,即大于等于10万股或者20万元的成交单。
(3)时间区间指标:对近期以来的市场涨跌走势进行分析,是监管人员进行数据分析的重要视角,即从历史角度研判市场形势。根据日常监管经验,同时参考各金融资讯商的金融终端指标设计,我们将“近期”具体划分为:“近5日”“近20日”“近60日”“今年以来”等4个时间区间。
5.可视化设计与布局
为了便于监管人员快速了解市场运行情况,便捷地进行数据观察和分析,经反复思考和实验,我们考虑针对上述3个子任务,分别设计3个对应的可视化界面来承载数据监测分析功能。3个界面之间需要设置跳转,便于监管人员在不同分析场景中进行切换,实现全视角综合性分析。
第一个界面设计,用于盘中实时市场监测分析。按照数据分析的先后顺序,从上而下放置组件,上方用于对境内市场进行分析,下方用于观察境外市场。其中,重点对于境内市场,从上而下依次用于市场分析、行业分析和个股分析,层层细分。设计图如下所示:
图3 盘中实时监测分析界面示意图
第二个界面设计,用于盘中实时个股监测分析。监管人员在“盯盘”时,可能需要对感兴趣的个股或某些特定类别的股票进行分析,因此需要专门提供用于个股分析的界面。对个股分析的维度众多,这里我们选取板块、行业、股价、市值、估值等5个常用的分析维度,其中股价、市值、估值将事先进行分组处理,便于监管人员筛选出特定类别股票。设计图如下所示:
图4 个股实时行情分析界面示意图
第三个界面设计,用于近期走势情况分析。对近期走势进行分析,是从历史的角度对股票价格变化趋势及其原因进行的深入分析。具体而言,一方面,需要方便地对境内外主要股票市场的股价走势进行横向对比,便于监管人员分析了解总体情况;另一方面,需要对境内市场的股价走势原因进行结构性分析,包括行业板块和投资者资金行为两大因素。设计图如下所示:
图5 近期走势监测分析界面示意图
(四)数据处理
数据处理工作主要有三个部分:
1.利用Python等方式获取初始数据
利用Python获取时间序列数据并存储至MySql数据库中。第一,利用Python编程通过东方财富Choice量化接口,获取2021年11月15日至2022年4月1日北交所每只股票的历史收盘价、流通股本、成交金额等数据,并在程序中计算出北证指数每天的指数点位。此外,还获取了境外相关指数的日频数据。第二,利用Python编程通过聚宽API中get_price()函数,获取A股市场指数和个股的每分钟价格和成交金额数据,数据时间区间为2022年4月1日上午9点30至下午15点。
图6 Python程序计算北证指数
2.实现盘中定时刷新数据
对当日盘中市场价格变动情况进行实时监测时,需要对指数的点位、涨跌幅以及成交额数据进行动态刷新。为了模拟实时效果,我们每分钟向数据库中插入新的数据,然后仪表板上实现每5秒钟刷新一次数据。仪表板实时刷新数据有两种方法,第一种是引入refresh.js、修改fine-bi-adapter-5.0.jar;第二种方法是安装插件“BI预览自动刷新模板”。经过尝试,我们发现第一种方法在刷新数据时会出现加载图标,在图表较多时不够美观自然,因此我们选择使用第二种定时刷新数据的方法。
图7 实现每5秒钟无感定时刷新数据
3.利用自助数据集加工数据
初始数据一般难以直接用于可视化分析,还需对数据进行二次加工。下面我们主要以加工得到各行业主力资金净流入数据为例,对通过FineBI自助数据集进行数据加工的思路和主要操作进行介绍,使用到的功能有:选字段、新增列、左右合并、上下合并、分组汇总、过滤、排序等。
(1)手头的基础数据
两个数据文件:第一个是每只股票的申万行业分类数据(excel文件),具体字段为:股票代码、公司简称、申万一级行业,数据条数为4430条。第二个是2021年12月1日以来每天每只股票主力资金金流入金额(excel文件),具体字段为:代码、主力净流入额(元)、日期,数据条数为384826条。两个初始数据样式截图如下:
图8 基础数据样式
(2)最终想要的数据结果
需通过自助数据集对上述两个初始数据文件进行加工,得到近期各行业主力资金净流入情况,字段包括:申万一级行业、区间(取值为“近5日”“近20日”“近60日”“今年以来”)、主力资金净流入额、主力资金净流入额排序(按绝对值大小排序)。
(3)主要的数据加工操作步骤
左右合并:创建业务包后,通过“添加表”中的“excel数据集”,导入两个初始的excel文件。基于主力资金净流入数据创建自助数据集,全选三个字段(代码、主力净流入额、日期),然后通过左右合并功能,对每只股票添加行业分类信息:
图9 左右合并操作界面
过滤:对获取的初始数据进行观察发现,可能由于Choice金融终端底层数据问题原因,个别股票缺失申万行业分类信息(共有2只股票),因此需要进行过滤处理(这2只股票市值较小,剔除后对于我们分析主力资金流入A股情况整体影响很小)。上述操作得到的数据集粒度为每只股票,需要进行汇总处理,得到每个行业每天的主力资金净流入额:
图10 分组汇总操作界面
排序:为了观察上述加工后的数据准确性,我们利用排序功能对行业、日期等指标进行排序处理:
图11 排序功能操作界面
新增列:为了加工得到不同时间区间(包括“近5日”“近20日”“近60日”“今年以来”)各行业的资金净流入额情况,我们新增以下指标列:“年份”“当年最早时间”“最晚时间”“日期序号”“区间”等5个字段。上述新增字段是必要的,后续新增数据后将自动计算得到不同的时间区间,因此未通过设定固定的条件来筛选数据,比如通过“2022年1月1日”来判断是否为“今年以来”。
图12 新增列操作界面
分组汇总:得到时间区间后,将“区间”取值为0的数据过滤掉,即剔除不在所需区间内的其他冗余数据;然后按照行业、区间对主力资金净流入金额进行汇总,得到各行业在各时间区间里的主力资金净流入情况:
图13 分组汇总操作界面
保存中间结果:利用自助数据集中的abs函数,得到主力资金净流入额的绝对值;然后进行排序,再通过过滤功能,得到相应时间区间内主力资金净流入绝对值最大的前15个行业(在后续可视化展示中,将利用不同颜色来区分主力资金净流入的方向,即流出为绿色,流入为红色)。我们对不同的时间区间,包括“近20日”“近60”“今年以来”的数据分别进行保存,得到3个中间结果数据。
上下合并:基于时间区间为“近5日”的数据集,对上述得到的另外3个时间区间的数据进行上下合并,从而得到最终所需的数据结果。
图14 上下合并操作界面
(五)可视化报告
1.市场情绪监测(盘中实时)
市场情绪用于反映当前A股市场整体运行情况,具体通过股票涨跌比指标来度量,该指标的取值区间为。计算公式如下:
在FineBI编辑组件时,可通过“添加计算字段”来实现:
图15 计算市场情绪指标
该指标数据可以通过仪表盘进行展示,便于监管人员一目了然看出目前整个A股市场表现(覆盖沪市、深市、京市三个市场)。通过颜色来表示涨跌幅度大小,其中红色表示市场情绪高涨,绿色表示市场情绪低落。该配色方式与各证券交易所官网、各金融资讯商的金融终端对上涨和下跌股票的配色方案保持一致(红色RGB为:220、40、50,绿色RGB为:22、188、80)。
图16 市场情绪指标配色及效果
通过上图右侧的仪表盘,监管人员可以一眼看出,当前整个A股市场情绪较为低落,表明下跌股票较多,市场处于情绪中性和最低之间的状态。
2.市场量价走势监测(盘中实时)
在了解市场整体情绪后,监管人员一般需要进一步了解各个市场的量价变化情况。为了直观易懂,通过两种方式展示:一方面,采用kpi指标卡组件展示当前的指数点位、涨跌幅以及累计成交金额;另一方面,通过组合图(柱状图+折线图)对指数盘中每分钟点位和成交额进行展示,坐标轴根据当前指数点位大小进行动态设置;为了有效观察数据变化,我们将指数点位的最小值设置为当日开盘以来指数最小价格下浮1%,最大值设置为当日开盘以来指数最高价格上浮1%。
图17 根据实时点位设置Y轴最大值、最小值、间隔
可以看出,虽然当前A股市场整体情绪低迷,但是沪市主板表现较好,指数上涨0.44%,而且从开盘以后一直处于平稳上涨状态,但是在10:20左右指数开始回落,表明后续可能呈平盘震荡或者震荡下行走势。
图18 上证综指盘中实时走势图
3.各行业板块联动分析(盘中实时)
为了快速掌握涨跌幅居前的行业板块,我们采用矩形块图来进行可视化分析,通过设置自定义组件的矩形块的大小和颜色区分涨跌幅的大小及方向,并且设置了图形属性中的标签和提示显示出行业名称及具体涨跌幅。从下图的可视化结果可知,当前申万31个一级行业中,涨幅较高的是商业贸易、食品饮料和交通运输,上涨幅度均高于下跌行业,涨幅都超过2%;当前下跌较大的行业是医药生物、建筑装饰、煤炭,跌幅均超过1%(其他行业板块涨跌幅较小,可以不直接显示数值,具体数据在鼠标移动到色块上时进行提示)。
图19 各行业板块涨跌情况
为了更进一步对某行业里重要的个股进行分析,以便了解哪些股票对所属行业涨跌影响较大,我们利用组件联动对该行业中表现突出的个股进行展示,包括该行业下成交金额、成交数量、总市值前20名的头部股票,通过词云图展示股票名称,文本大小表示头部股票排名,文本颜色反映股票的涨跌情况。
图20 通过“细粒度”筛选出前20只活跃股票
如下图所示,选择目前跌幅最大的“医疗生物”板块后,右侧相应展示出该行业中总市值最大的前20只股票的涨跌情况,可以很明显地看出,当前“医疗生物”行业中迈瑞医疗、药明康德、恒瑞医药等头部大市值股票均处于下跌状态(绿色),是影响行业下跌的主要原因(考虑篇幅原因,成交额前20只股票、成交量前20只股票的联动涨跌情况未截图展示)。
图21 点击医疗生物行业后与词云图进行联动
4.各板块活跃个股情况(盘中实时)
从数据分析角度看,个股是最小粒度的分析单位,因此从上而下看,在掌握整个市场、各行业板块的价格变化情况后,监管人员有时还需要穿透到个股层面,了解各板块里最活跃的股票(一般为排名靠前的5只个股)。市场板块包括:全部A股、沪市主板、科创板、深市主板、创业板、北交所等6个,为了将所有数据展示在一个屏幕中进行分析,无需监管人员翻滚页面进行查看,我们利用Tab组件对各市场板块个股数据进行展示。
图22 建立Tab组件用于展示各市场板块活跃股票
图23 各市场板块最为活跃的前5只股票
如上图所示,默认展示的是全部A股中当前最为活跃的前5只股票,从价格情况看,可以很快看出当前涨幅最高、跌幅最大的前5只股票,比如目前海希通讯涨幅最大,杭州园林跌幅最大;从成交量情况看,可以看出成交金额最大的股票是酒鬼酒,换手率最高的股票是金财互联。同理,可以在Tab中点击其他板块的名称,查看该板块当前最为活跃的个股情况。
5.个股多维度筛选分析(盘中实时)
在盘中“盯盘”过程中,监管人员可能需要及时查看某只感兴趣的个股或者某一批特定股票的相关情况。为此,通过文本下拉组件来提供常用的分析维度,具体包括:板块、行业、股价、市值、估值等5个重要维度。前期已在自助数据集中对初始数据进行分组赋值处理,分组阈值的设置主要来自日常数据分析经验。
图24 在自助数据集对个股价格进行分组赋值
图25 使用过滤组件来筛选不同维度股票
图26 个股多维分析示例
通过上图可见,当前房地产行业总市值在1000亿元以上的股票有3只,一只在上涨且涨跌较大(3.9%),另外两只在下跌且跌幅相对较小。实时展示出来的个股信息还包括:振幅、成交额、成交量、换手率、市盈率等指标。由于指标较多,我们对左侧的证券代码、证券简称、行业这前三列进行了冻结处理,便于监管人员向右滑动时查看对应股票的信息。
6.各市场指数近期走势横向对比
对境内外主要市场的指数走势进行横向对比,便于监管人员了解近期境内外市场整体变化趋势情况,共有16条指数,“近期”区间包括:近5日、近20日、近60日、今年以来。为了便于监管人员快速分析出趋势变化情况,同时考虑到屏幕大小限制,将按行放置各市场指数,按列放置时间区间,便于了解单市场指数在近期的变化情况,以及对不同市场指数在某一时间区间的变化情况进行比较。
图27 近期境内外各市场指数变化情况
通过上图可以很快分析得到以下结论:纵向看,近5日,境内外各市场主要以上涨为主,其中涨幅靠前的市场为香港、法国和上海;但今年以来,境内外各市场绝大多数处于下跌状态,跌幅最大的是境内的科创板和创业板,只有新加坡和英国市场在上涨。横向看,今年以来、近60日、包括近20日,境内各市场都处于下跌状态,仅在近5日出现回调,部分市场指数开始翻红。此外,境外的英国市场和新加坡,在各个时间区间均为红色,表明均处于上涨行情。全局看,无论各时间区间,欧美市场表现要好于亚太市场和境内市场;今年以来科创板的跌幅超过其他市场,跌超22%;近20日法国和德国市场的涨幅遥遥领先,均涨超10%。
为了进一步了解相关市场指数在近期的具体走势变化情况,我们建立了组合图(柱状图+折线图)来展示相关指数每天的点位情况和成交额情况;并将区间指数矩形树图与之建立关联,监管人员在点击指数色块时,将联动展示该指数在相关时间区间的每日走势情况。如下图所示,点击今年以来上证指数的色块时,右侧对应显示该指数今年以来每天的变化情况,可以看出,从今年初到3月初,上证指数一直呈现出平稳震荡的走势;但从3月份开始便快速下跌,点位从3500点一直跌到近3000点;3月中旬开始,上证指数有所回调,又快速上涨到3200点附近,之后处于震荡走势。以上,便可清晰地分析出上证综指今年以来下跌9.8%背后的具体走势情况。
图28 各市场指数区间表现与单日变化情况联动分析
7.各行业板块近期走势情况分析
对于境内市场,监管人员在了解全市场整体价格走势后,一般还需要进行结构性分析,即进一步了解近期各行业板块的股票走势变化情况,以发现一些结构性的亮点或特征。与展示境内外各市场指数的近期变化情况类似,我们仍然采用矩形树图的方式来展示申万一级行业的股价走势情况,默认展示时以各行业近5日涨跌幅从高到低进行排序。
如下图所示,可以迅速分析得出结论:横向看,各行业在近5日开始好转,上涨的行业个数增多,与下跌行业个数基本相当,其中房地产行业涨幅最高;近20日、近60日、今年以来,上涨行业寥寥无几。纵向看,只有房地产、煤炭、综合类等三个行业板块在各个时间区间内均处于上涨状态,表明其近期行情最好;电子、国防军工等行业跌幅最大(绿色最深),表明该类行业近期不被投资者看好。
图29 各行业指数近期表现情况
8.近期投资者资金买卖行为分析
通过柱状图的方式展示北向资金净买入金额和主力资金净买入金额的走势变化情况,并建立文本下拉过滤组件,对时间区间进行选取。对于柱状图的颜色,当净买入资金大于0时显示为红色,小于0时显示为绿色。
图30设置净买入资金柱形图的颜色
从以下2个图可知,分析结论为:北向资金在近20日先卖后买,表明近期外资对境内市场看多;从境内投资者看,主力在近20日主要以卖出A股为主,净卖出金额最大的行业为医药生物。但是近5日里,主力资金对个别行业转变了投资策略,对房地产、银行、以及非银金融等行业实现了由卖转买(颜色从近20日的绿色变为近5日的红色)。
图31 近20日北向资金和主力资金净流入情况
图32 近5日北向资金和主力资金净流入情况
9.实时监测与近期走势之间跳转
为了便于监管人员在不同数据分析界面进行切换,针对前述拆分的三个子任务,为每个任务创建一个独立的仪表板,默认以展示实时监测股价总体情况的仪表板为中心,分别在标题左右两侧设置两个跳转组件,可以直接跳转至个股详情仪表板和近期运行走势仪表板。
图33 仪表板之间设置跳转
10.最终结果呈现的页面布局
对不同业务分析点建立可视化分析模块,极大提升了监管人员的数据监测和分析效率,能够在短时间内甚至一眼就能看出市场价格变化情况,直观、便捷地实现了对个股的多维分析,以及对近期境内外各市场股价走势、行业轮动以及投资者资金行为的深入分析。
为了突出价格变化信息,进一步提高监管人员的信息获取效率,我们将所有页面的背景颜色统一设置为黑色,并将相关文字调为灰白色或白色。最终界面包括3个,具体如下:
图34 盘中实时监测分析界面(默认界面)
图35 个股实时详情分析界面(往左进入盘中监测界面)
图36 近期走势分析界面(往右进入盘中监测界面)
三、参赛总结
(一)FineBI工具
1.总体看法
通过本次参赛,我们进一步体会到FineBI工具具有强大的数据加工和可视化分析功能,工具本身设计也比较人性化,使用起来比较方便;同时配套的文字、视频等学习资料也很丰富,描述地很详细,便于查找和学习。
2.主要亮点
第一,自助数据集在数据处理上的优越性,可以对导入的Excel或者SQL数据等通过新增列、过滤、分组汇总、合并等方式进一步加工处理,并且提供了日期、文本、数值类的函数方便使用。第二,设置组件时灵活的个性化定制功能,对于组件中字体的颜色、大小、标签的位置、轴线的显示范围、组件的背景和颜色都可以根据需要进行选择。第三,数据分析结果可以动态分享给更多人员使用,进一步提升了数据分析结果的应用价值。
3.细节功能点建议
在使用自助数据集更新Excel文件时,可以实现数据内容本身的更新,好像不能选择是否对表结构进行更新。在绘制时序图时,暂时无法实现在横轴(时间轴)自定义选择只显示一部分关键的时间点,只能通过改变时间的显示大小或者倾斜角度两种方式,可能导致时间轴的文字堆积和重叠。
(二)参赛总结
通过参加本次比赛,我们主要有以下三点体会:第一,开展数据可视化工作对个人的综合能力要求较高,需要将业务理解、分析方法、图表设计与布局、工具使用等融会贯通,才能创造出好的数据可视化作品。第二,进一步掌握了使用FineBI工具进行数据加工和可视化分析的具体方法和流程,开阔了自己在数据分析及可视化方面的视野,必将有助于提高今后的工作效率和质量。第三,FineBI工具提供的功能远不止本次比赛使用到的相关功能,还有一些功能我们未用到或使用不够充分,比如移动端等,后续很有必要进一步探索使用。
数据截至2022年4月1日收盘,来自上交所、深交所、北交所官网。 ↑
本次参赛使用的实时数据为2022年4月1日相关股票市场盘中的分钟序列数据;历史数据为2021年12月1日以来的数据,能够支持近5日、近20日、近60日、今年以来等时间区间的股价走势分析。 ↑
采用申万行业分类。原因是市场认可度高,日常工作中多参考使用该行业分类。申万行业分类体系将所有A股股票分为四个层级,其中一级分类有31个行业,比如商业贸易、食品饮料、交通运输等。 ↑