每次参加这种大会其实都蛮有压力的,因为我是草根创业者,研究生没读完就创业了。我今天要跟大家分享的是数据可视化在中国的发展。
—— 帆软软件联合创始人 陈炎
2015年10月17日,中国商业智能软件领军企业帆软软件有限公司受邀参加了江苏省第二届大数据高峰论坛,帆软公司联合创始人陈炎先生在大会上分享了《数据可视化在中国的发展》的演讲。
演讲原文:
吴晓波有两本书特别畅销《激荡三十年》《大败局》,这两本书为什么畅销,我也思考了一下,可能读史可以预测未来,还有这书里面有中国特色的企业干货。
我们IT史的发展里面有一本好书,就是吴钧写的《浪潮之巅》,但是里面更多都是国外巨头的发展,我们国内读到的只有BAT。但是自从有了崔牛会之后,就可以读到一些2B企业的辛酸历程。
今天给大家分享的题目叫做《数据可视化在中国的发展》,作为创业者,希望自己约的炮,不要自己含着泪打完。数据可视化在中国分为四个阶段。
第一是先计算机时代,中国在数据可视化领域其实落后世界很远,直到20世纪初出来一个先驱陈正祥,他一生致力于绘图,主张用地图说话,用地图反映历史,利用地图对政治、经济、文化、生态、环境等现象进行描绘和阐述。由于历史原因,他只能长期被迫生活海外,很多书在国内没有出版。他有一个非常知名的作品就是中国文化地图,大家可以搜一搜。
我这里分享他做的两个经典案例,一个是中国诗人分布图。左边是唐代诗人分布图,可以看到主要集中在黄河流域。宋代诗人主要集中在长江流域,其主要集中在华东。从图中可以发现,中国经济自从唐代之后慢慢开始向从黄河流域转移到长江流域。发生这样变迁的有两个原因,一个是北方长期战乱,二是南方种植水稻,可以养活更多人。
这是蝗神庙的分布图。蝗虫多的地方蝗神庙就建的多,从图中可以看出来中国蝗虫发生最严重的是发生在华北,实线是可能十年发生一次蝗虫灾害,虚线是每十到十五年就发生一次蝗虫灾害。
下面就进入到计算机时代,最先数据可视化就是表格,这个时候最先登场的就是水晶报表,随着微SO、C++就走向了全球,但是到了中国就遭遇了水土不服。水晶报表这款产品被BO收购了,BO后来被SAP收购了。
第二个本土厂商登场的是华表,1999年开始研发,华表是要求用微VC++把excel重新写一遍,它有两个创新点。一个是解决了中国式复杂报表。第二个创新点是解决了,买一次无限分发。但是它存在一个缺陷,就是大量写代码,华表被用友收购之后,2008年基本就不维护了。
还有是思达报表,这是1999年左右两位美籍华人从贝尔实验室离职之后创建一家公司,在2000年左右在国内成立研发公司,是第一款纯java报表和web报表工具,但是这个公司创业者可能不知道做公司最重要是人员分配,基本上人员不断动荡,一度退出了中国市场,但是现在国内还是有部分用户。
到2001年左右国内出来两个厂商,一个是润乾报表,一个是帆软报表。润乾创新用了SQL理论与EXCEL格子扩展结合起来,解决中国式的复杂报表,最新产品是V5,原来的报表工具是在CS端开发,在BS端查看,但是V5把设计器移植到了Web端,但是感觉发展变慢了。我们帆软也是2001年成立的,主要是依靠南京大学力量来做的,我们迅速跟进,基本上国内第一家只卖产品,把销售额带到接近1亿的厂商,其实这个时候就产生了,我们被当地主斗,有的友商直接反编译我们代码变成自己产品到处卖,网站也移植过去,有的基于我们帆软关键字做“取代帆软的***工具”竞价广告,有的合作伙伴开始和我们合作,后来也自己模仿开发,这里面包含国内OA领域领先厂商。最后帆软还在,模仿不在了。前些天马云总算帮我们说了,告诉了大家一个道理。不把村里地主斗死,农民也能富起来。
表格可视化分支,一个是即席报表,但是用的人很少,因为它的用户是业务分析人员,业务人员更喜欢用Excel。还有一个是OLAP,国内代表是广州尚南和上海炎鼎。
下面进入了读图时代,数据图形可视化有三种方案解决。一种是传统表格可视化软件厂商提供的图表控件,这种基本上能解决大家的核心需求,饼图、柱状图、折线图。第二种方式是独立图表控件,它需要基本代码集成到企业信息系统里面去。早期在java国内做得最多的是jfreechart,到了flash时代,用的最多是fusioncharts。进入html5的时候,国内出现了echarts。第三种是图表可视化软件,代表软件tableau和我们的FineBI。
其实从这个发展趋势来看得出来,图形的可视化成为数据可视化中间越来越重要的一部分,这里厂商要思考两个问题,如果你的产品是集成开源图表控件进行可视化,万一开源收费怎么办。
大数据时代对企业数据可视化提出来两个挑战。
一是可视化大数据。原来是在长江中航行,现在要在大海中航行。自然要求高了。传统小数据变成传统小数据+现代的大记录;结构化数据变成了结构化化数据+非结构化数据;新的技术解决方案诞生了,内存计算和分布式计算取代原来ROLAP和MOLAP。
二是可视化多样性。大数据会造成中央集权模式下统一数据可视化消化不良,势必下放部分数据可视化制作权限,同事管理模式在从金字塔模式向扁平化转移于是更多中层有更多决策权,用人权,分配权,就产生了很多个性化的数据可视化分析。于是数据可视化制作部门工作也从信息部门为中心,变成信息制作规划和业务部门自助共同承担。
数据可视化厂商也需要及时调整产品特点满足性能和自助需求。
美国的Tableau,这个两个公司改进了水晶报表的设计方式,用dashboard的布局,实现了让业务人员对大数据进行自助分析。从百度指数来看,搜索热度比较高。指数在七百多。
在企业数据可视化方面,并没有出现那个时代彻底取代那个时代,目前来看是长期交叉共存。中基员工偏向表格,高层领导偏向图表。互联网网企业偏向自助,传统企业偏向IT主导。
现在应该是长期交叉共存的,并没有颠覆或替代哪个时代。
我们中基层人员更喜欢式可视化,高层人员更喜欢图形可视化。互联网企业可能更多是希望以自助方式,业务人员自助方式进行可视化。这就是我今天的分享,谢谢大家!