找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,极速登录

请上传宽度大于 1200px,高度大于 164px 的封面图片
    调整图片尺寸与位置
    滚轮可以放大缩小图片尺寸,按住图片拖动可调整位置,多余的会自动被裁剪掉
取消
athlonk7(uid:95442)
这个人不太懒,写了一点东西 职业资格认证:FCRP | FCBP | FCJA | FCAP
【数据运营官】数据与业务同行,我在水务企业数字化转型上的探索
概述 水务行业作为典型的传统行业,在数字化转型上起步较晚,信息化程度也略微落后于其他行业。在实施数据运营的过程中,遇到了很多转型期的阻力,包括人员因素、管理因素、环境因素等等。但先进数据理念的提升,无疑是信息化改造的催化剂,有效梳理各层级需求的同时,也为日后的数据治理打下良好的先行基础。 面临的主要业务难点(需求分析): 业务难点1 最基础的是我们的数据采集。公司除了有大量的自动化远传仪器仪表,还是需要人工值守来完成大量的生产过程。每个生产单位,我们都需要几名值守人员,实行三班倒的方式,24小时查看设备的运行情况,并把主要的数据定期填写到纸质报表或excel表格中,并汇总交于生产管理人员,层层统计审核。 早期我们有过一套纯asp写的表格展示,随着管理的要求不断提升,也难以满足现行业务。过去,报表的使用者更倾向盯着一大串的数字来寻找异常,其中不乏火眼金睛的同事,但始终人眼并不是那么擅长阵列式检索,同样遗漏率也很高,同样的工作还需要安排多一个人来校核。 业务难点2 供水管网管理平台核心是以管网GIS系统为基础,对其进行如SCADA、外勤、工程、水质、DMA、热线、水力模型、二次供水、生产调度、视频监控等相关系统集成。但在实际的建设中,这些功能分散在各业务系统中,管网工作的数据化管理一直缺乏有效的支撑。集团已有非常详细的GIS管理制度,但由于执行不到位,导致基础数据缺失。 业务难点3 在营销管理的过程中,存在许多跨部门的业务流程以及与之伴随的业务信息交互,营收与热线、报装均有接口,并且可以实时调用数据。然而,目前一些跨部门的业务流程在执行过程中,由于信息不共享,给流程的运转和业务的管理带来不便。 同时,伴随供水量的激增,产销差率也在不断上升,给企业造成了很大损失。为了优化服务质量,高度履行社会责任,树立良好的社会形象,同时降低产销差率,提高水费回收率,确保企业的经济效益和社会效益,营销管理工作要求逐步做到精细化,对用户用水的信息及时准确地掌握。 需求分析整理 根据数据运营官课程的理论,我们借助数知鸟平台对业务逻辑进行了如下的详细梳理: 就企业关心的重要指标,以产销差率为例,根据鱼骨图,对各层归因分析如下: 图表, 图示

描述已自动生成 根据业务部门的描述,我们统一了指标的描述方式和统计口径,对每个层级的指标描述都使用平台进行记录,并能有效共享给相关人员,以确保大家对指标的理解能达成一致: 生产管理层面的指标参考如下: 应用需求分类整理如下: 详细需求文档展开如下图: 可视化落地阶段 传统填报改造 针对传统的填报收集数据需求,使用finereport用填报功能制作的模版,清晰地呈现出每一个需要录入的指标,方便工作人员录入。同时,每个单元格都附加了数据校验,单元格间可以通过类似excel的函数进行计算,极大降低了上报的错误率。 生产分析改造 我们给业务部门的第一份甜点,就是每个部门的生产日报替换成图形化的样式,这样直观地展现了这些重要指标如机组电量,压力,单位能耗的情况。横向比较每个部门的单位能耗,我们可以很快地了解到哪些单位在哪个环节出现了异常,明显的能耗提升和下降,业务部门都会以此为依据分析原因。 生产能耗分析 这张表专门用来显示抽水泵站的耗电情况,在我们的供水管网中,每个单位的抽水电耗成本是一个不小的数字,甚至专门有一个学科水经济学来分析这个方案,当然,分析制水成本是一套很复杂的数学模型,还需要考虑经济因素,我们只提供最直观的数据,交与业务人员。 生产水质分析 这里统计了某水厂处理浊度的分布情况。四种颜色代表四个工艺,分别是原水,滤前水,滤后水,净化水。正常的处理,浊度是会逐步降低的,最终在出厂水环节达到国家的标准。通过分布分析,能很快找到分布不合理的异常值,这些都可能是生产环节或仪器仪表发生了意外情况。 管网分析 通过读取GIS系统内的基础信息,把管网资产进行数字化展现。此外,对各所工单GIS管理的考核、巡检里程的考核也加入到了BI的看板中,各单位可以及时了解工作完成情况。 横轴是用户数,纵轴是管网长度,每一个点代表一个营业所,点的大小表示它接受热线诉求的数量。这样就划分了四个象限,用户多管网长的,这些应该是高密度住宅区,需要配备较多的工作人员。用户多管网少的,这是我们设计不合理,从图上看还不算太明显,有一个所可能需要进行扩建改造。用户少管网也少的,这些大概是低密度区,通常分布在珠海的边缘地带,可以适当少配备些人员。用户少管网多的,这些应该是工业区域。 营销管理分析 在分析营销数据时,首先通过行业分类来进行对比,查看每个区域、每个行业的趋势,很多时候,用水量也能判断一些企业或行业的兴衰情况。其次,每个区域的重点客户都会显示在下方的位置,这里使用了对比图来呈现同期的用水情况。变化较大的单位,营销人员会主动沟通,把相应结果录入并且显示在右边的表格中。营销人员通过对重点客户管理数据进行多维分析,省去了原本大量的老式文字分析汇报工作。 价值: 充分利用这些数据,分析历年的水价数据和用户发展情况,合理分析水价走势和结构特征,为研究水价制定机制提供支持。与此同时,对数据资源进行多维度的挖掘和综合利用,将支撑整个营销管理决策走向科学化、精细化,通过分析各类用的用水特征,制定不同周期的抄表计划;通过观察用水量的变化情况,帮助管理人员进一步分析造成水量突变的原因,以采取有针对性的解决措施,对控制产销差率,提高水费回收率有很大增益 综合大屏展示 建设智慧管控信息平台,将先进的信息技术与集团管理结合起来,紧密围绕集团战略与管控目标,实现管理协同化和决策科学化,打造智慧管控链,实施战略指导监督下的企业运营模式,提升集团“横向到边、纵向到底”管控能力。通过智慧管控信息平台的建设,掌握各单位核心业务的经营状况,有力控制集团整体经营风险,实现集团内资源有效配置,强化集团经营管理,提高经济效益,确保集团运营的可持续发展。 对课程的评价: 通过数据运营官的学习,我系统地了解到了企业级的数据理论,这份经历与我之前在IT部门埋头解决信息系统问题是完全不同的。工具与技术只是信息化的实现手段,而运营理论才能真正把数据的理念与企业管理理论有机结合到一起,形成适合自身并实用的数据工作方法论,进一步推进企业数字化转型工作。 学习过程的感受: 课程除了传统的在线授课、答疑的方式,还组织了案例讲解和群体讨论,这种多样性的方式丰富了大家的思维碰撞,让自己能感觉到,你不是一个人在战斗。同期的学员都来自不同的行业,互相交流一下,有时会发现很多很有意思的现象,很多我认为遥不可及的目标,在某些行业里看上去似乎唾手可得;相反,我们早就实现的一些管理理念,在一些看似发达的行业里,反而实践效果很差。 学完需求分析理论后,我更注重与业务部门的沟通与相处,关键的指标都需要靠他们的经验来提供,并且还有很多很多隐性的需求需要我们自己深入观察来发现。 学习完数据可视化的理论后,我重写了当年初学期做的“青涩”的可视化图表,转而实用更成熟的方式呈现,看着自己改造后的效果,心中莫名欣慰,这也是一种成长吧。 学习完统计分析理论后,我对统计学产生了浓厚的兴趣,希望日后可以将更多精力放在数据挖掘上,从数据中发现企业的潜在知识。 而最后学完了整体理论后,我才逐渐意识到,作为企业的IT管理人员,不应该只把眼光放在眼前的业务信息系统的兴衰,而要站在更宏观的角度考虑问题。 今后数据工作的展望: 系统虽然完成了阶段性任务,但前方依然任重道远。现有系统在设计初期,因对产品本身了解有限,同样也做了很多不太成熟的设计。未来还需要逐步接入营业收费、管网管理、工程管理、财务管理、人事管理等多项内容,形成真正意义的数据中心。同时,稳步搭建企业数据仓库,制作更多自助式可视化展现的业务模型,采取自下而上的推广方式,继续提升企业的数据化管理水平。
使用FineBI绘制七夕表白心形线
大家好啊,随着各地防疫的收紧,都在居家办公还是冒着生命危险加班呢?要注意安全喔。 不过忙归忙,下周有一个重要的日子,可千万不能忘了,那就是七夕。 然后我们自然地要来一串夺命连问:对象找了吗?收入多高啊?在哪工作啊?啥时候结婚啊?还是单身狗啊?一把年纪怎么还不结婚啊?有目标了吗?啥时候表白啊?礼物准备好了吗? emmm,说到表白嘛,用传统的方式显然比较俗套。作为理工男,自然有人会别出心裁,像这样: 不过,我们作为数据可视化玩家,显然要有更浪漫的表达方式:用图表的语言。 热播剧《隐秘的角落》里,剧中的天才杀人犯、少年宫代课数学老师张东升(秦昊饰演),给同学们讲的是这么一个故事: 这个故事是关于笛卡尔的,对,就是下方这个人生开挂的备胎. 笛卡尔嘛,大家应该都不陌生,还是学生的时候,在数学课物理课都被他的理论凌虐过,我们今天生成图表的直角坐标系正是他发明的,通常被称作"笛卡尔坐标系".他还在哲学上有句名言"我思故我在",十足的全能选手. 相传笛卡尔曾流落到瑞典,邂逅美丽的瑞典公主克里斯蒂娜,成了公主的数学老师。 随着公主的数学成绩越来越好,他们之间的纯粹、美好的爱情也萌芽了。国王知道了这件事后,强行拆散了他们。 不幸的笛卡尔回到法国后,还染上了可怕的黑死病。然而出于对公主的一往情深,他还是连续给公主写了12封信,但无一例外都被国王销毁。 但这怎么能难倒天才的笛卡尔,在生命弥留之际他寄出了最后一封情书。 国王拿到这封情书有点懵,因为上面只有一行字:r=a(1-sinθ)。虽然国王找遍了全城的数学家,但所有人都对这式子不明所以。于是放松警惕的国王也就把这封信交给了公主。 公主在纸上画下方程的点,终于解开了这行字的秘密——这就是美丽的心形线。 虽然故事编的还真是那么回事,但基本是虚构的,某矿泉水品牌还借这故事拍了个广告,想看的自己去搜吧. 而且编剧似乎没有深究这个函数,它真实的图形是这样的: 可能是我思想比较歪,这图怎么看都更像是个屁股.虽说心形的起源也有人认为是来自女性的臀部,但如果今天给心仪的妹纸发这个,很容易被当成LSP。 尤其再用美学分解透视一下,啧啧…… 为了避免误解,我们来画一个更好看的,引入我们的主角公式: x=16(sint)3y=13cost–5cos2t–2cos3t–cos4t 我们直接用FineBI画出来吧。 1.数据准备 数据集非常简单,一列数据,从1-360即可,一共360行,代表角度,我们把它导入BI(懒得自己弄数据集的可以点击文末下载): 2.新增列,对唯一的那列数据取【排名】,设置为文本,用作标签: 3.三角函数需要输入弧度,使用函数RADIANS转换: 4.计算x的坐标: 5.计算y的坐标,公式稍微长点,不过也还好啦: 6.开始画图,新建仪表板,选择自定义图表,把x拖入横轴,y拖入纵轴,维度的【排名】拖入细粒度(不同版本的BI可能看到的预览图不太一样): 7.调整为线图,把颜色设置为红色,线宽根据喜好调整: 8.调整显示比例,我们的心形就完成啦: 线宽调大以后,就会看到一个填充的心形(因为FineBI不支持这类曲线的面积填充): 最后的总结: 1.构图原理非常简单,本篇就算个灌水的彩蛋的,祝大家表白成功。 2.心形线还有很多种表示函数,可以尝试一下呢: 3.笛卡尔心形线用BI画是下面这个样子: 4.有人提到想有个更浪漫的出场效果,这样加一个过滤条会不会很惊喜:   最后的最后。表白失败的,送你一个分手函数吧,相信伤心欲绝的你,一定可以很好地画出来: 文中数据集点此下载:360.xlsx (11.27 K) 编辑于 2021-8-13 14:46
使用FineBI绘制阿基米德螺旋线图
大家好啊,失踪人口回归了,惊不惊喜,意不意外。在嘉年华现场提完对FineBI的新增个性化图表需求后,终于如愿收到了“一年内不考虑”的答复,而早就黔驴技穷的我,也因此陷入了沉积。 中途回了趟老家湖北,自然是去胡吃海喝,湖北的美食确实能吃一周不重样,而且无意中看到了这张图: 146615 阿基米德螺线(Archimedean spiral),亦称“等速螺线”。当一点P沿动射线OP以等速率运动的同时,这射线又以等角速度绕点O旋转,点P的轨迹称为“阿基米德螺线”。它在我们身边随处可见,比如这个: 146658 噢,不好意思,拿错图了,我是想说这个: 146659 星云锁链是日本动漫《圣斗士星矢》中青铜圣斗士五小强之一的仙女座瞬所拥有的防御性武器。用来抵挡外界的一切攻击,以及进攻时使用的武器。其中圆锁用来防御,而角锁用来进攻。星云锁链能抵挡住很多攻击,但遇到小宇宙超强的人,就会被敌人反控制住…… 噢,等等,好像偏题了,我说的是阿基米德螺旋线。 作者是我的偶像阿基米德: 阿基米德(希腊语:′Αρχιμήδης;前287年-前212年),希腊化时代的数学家、物理学家、发明家、工程师、天文学家。出生于西西里岛的锡拉库扎,据说他在亚历山大求学时期,发明了阿基米德式螺旋抽水机,今天的埃及仍在使用。第二次布匿战争时,罗马大军围攻锡拉库扎,阿基米德死于罗马士兵之手。阿基米德对数学和物理学的影响极为深远,被视为古希腊最杰出的科学家。美国数学史学家埃里克·坦普尔·贝尔在其《数学大师》一书中将阿基米德与牛顿和高斯并列为有史以来最伟大的三位数学家。 而他藉由此原理发明的阿基米德式螺旋抽水机(英语:Archimedes screw 或screw pump)是一种水泵,应用螺旋机制,借着螺旋曲面绕着旋转轴做旋转运动,将水从低处传输至高处。它也是历史上第一个将水从低处传往高处,用于灌溉的机械。 146635 emmm,不过,要论极坐标的图,BI绘制能力其实很弱,我们熟悉的饼图,甚至都是在直角坐标系下生成的,这个图到底该怎么做呢。 其实也不难,要知道,极坐标系和直角坐标系是可以转换的(论坛没法显示希腊字母,我直接截图吧): 146636 而阿基米德螺旋线图的公式如下: 146637 我们只需要把想生成极坐标方式转换成笛卡尔坐标,理论上就可以画出来,下面看我直接动手吧。 1.构建数据集: 数据集毕竟简单,随便编了两列,一列名称,一列数量,非常清晰对吧(我这里表格的行数是36的倍数,这样的话计算角度时是整数,比较容易理解,但其实任意数量都支持的): 146616想下载的点这里: 146633 2.上传至FineBI,选择全部字段: 146617 3.新增一列计算排名: 146618 4.为了计算角度方便,我们希望排名从0开始,再新增一列,对排名-1,取名为【排名修正】: 146619 5.对排名取最大值,这样是为了计算数据集的行数: 146620 6.新增列,取名为【角度】: 146621 7.对角度字段取模:计算公式如下,把大于360的角度变成0-360的数值: 146622 8.三角函数只能计算弧度,因此我们使用radians函数,计算角度对应的弧度值: 146623 9.根据阿基米德螺旋线的公式,分别计算X和Y的坐标: 这里的公式做个简单的解释,x=(α+βθ)*cos(θ),θ表示角度,在此处显示的是弧度;参数α用来控制螺线的旋转,是一个递增的等差数列,此处我们为方便理解,使用了排名的数值 ;而参数β用来控制螺线之间的间隔,此处我们取1,公式中进行的乘法计算,因此省略书写。 146624146625 10.好了,数据准备完毕,接下来就是水到渠成了,选择自定义图表,把X拖入横轴,Y拖入纵轴,数量拖入颜色和大小,名称拖入连线。是不是很乱,不用害怕,很快就完成了: 146626 11.把名称按照数量升序排列一下,惊不惊喜,意不意外? 146628 12.调整一下标签和颜色等细节,大功告成:146629 补充: 1.通过这次尝试,解锁了极坐标系的大门,接下来我可能会继续研究一些更奇特的玩意儿。 2.本主题使用了一种可复用的模式,用户只需调整起始角度、线圈数量便可自行绘制出个性化的螺旋图。 3.x=(α+βθ)*cos(θ)是转换的核心,不同的参数用于调整螺旋线的形状。 4.不是谁都喜欢这样的图形,比如某位大家熟悉的帆软员工(为了本人人身安全隐去她的头像)。实际使用中可以搭配其他配色: 146630 而用散点图也可以达到不错的效果: 146639 5.这个图用曲线显示会很丑,弧线居然只能内旋,希望帆软的图表组能考虑这个需求: 146631 6.finebi的产品经理们不再考虑一下我提的其他图表需求吗……? 7.欢迎大家都来我的故乡湖北玩。 思考题: 1.斐波那契螺旋线图有人想挑战一下吗 146632 2.FineReport做会不会更好看? 编辑于 2021-7-5 15:51
【2021夏季挑战赛】疫情期间的水务数据分析
恭喜本作品荣获“2021帆软BI可视化夏季挑战赛-最佳行业应用奖” 1、点击浏览在线作品 2、点击查看/编辑在线模板(完成问卷即可获取平台账号)   帆软专家点评: 一个成功的数据可视化要满足两要素: 1、提供足够的社会价值/商业价值:本作品的“群体性事件”分析带来的重大社会价值,体现了国企的强烈的社会责任感。 (1)独居用户用水异常挖掘:社会老龄化的问题日益严重,独居老人的安危牵动人心。通过智能水表,按照既定的数据特征识别出水表可能的用水异常,能够对独居老人实行智能守护。 (2)区域群体性事件异常挖掘:通过水量预知群体性社会事件,能够做到比如精准打击传销组织   2、帮助读者快速理解信息:本作品无论是内容的信噪比、数据表达的准确度,还是突出洞察信息的标识,都达到了一个极高的水平。同时本作品还别出心裁的制作出日历图、对比杠铃图、环形分析图等等创意图表。告别千篇一律的传统图表,引起读者的好奇心,简明有效的传达数据价值。     一、选手简介   1、选手介绍        团队选手版        团队名称:水务加BI数据联队                        队长介绍:社区id:athlonk7,本名徐毅力,某企业信息主管,某大学数据科学专业在读研究生;一位疯狂的帆软产品粉丝,一位匪夷所思的数据工作初学者,一位丧心病狂的数据可视化爱好者。 团队职责:团队吉祥物、数据源提供、数据清洗及处理、数据可视化 成员介绍: 武昆峰,珠海卓邦科技有限公司技术总监,大数据专业硕士,十年数据工作从业者。致力于格数致知,走向对世界的深度认知。本次比赛负责资源协调和技术支持工作。 周忠清,珠海卓邦科技有限公司在职数据挖掘工程师,致力于挖掘数据潜在价值,热爱学习。本次比赛负责数据开发和算法开发工作。 谢诗琪,珠海卓邦科技有限公司在职产品运营,致力于将产品做得更好,追求极致的完美主义者。本次比赛负责运营相关工作。 李丽琦,珠海卓邦科技有限公司在职UI设计师,热爱生活,热爱设计(设计源于生活,细节成就品质)。本次比赛负责UI设计。 参赛初衷:                   不为获奖,就交个朋友, 演练数据团队的分工协作能力 准备在部门内推广BI工具,先来学习了解 和更多FineBI大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞 检阅目前已整理的结构化数据                                                   二、作品介绍 疫情的发生潜移默化地改变着真个世界格局,而水务企业作为承担社会基础保障重要的单位,除了做好本职工作,更要使用好自身宝贵的数据资产,来发挥企业的社会责任感。 1、业务背景:疫情对各行各业带来巨大影响,对水务行业的影响也是比较明显,直观就能感受到热线业务量增加,工业用水波动很大等问题。但是水务企业很少有数据部门或者专注研究数据的人,去进行数据分析挖掘定量的分析疫情的工作的影响程度,导致很多工作不能科学的决策,比如热线排班,供水调度等。希望我们的研究成果能给业界同行带来参考价值。 2、数据来源:企业数据:本次一共用到23个数据集,均取自企业各大系统真实数据并脱敏处理,总数据量超1000万行,涵盖全市疫情前后一年内的数据。营业收费系统:145392其他:本次使用到的数据集1453943、分析思路 早期的讨论里,我们希望能展现自己完整的数据集和强大的分析能力,通过头脑风暴商议主题如下: 145396 经过裁剪后,去除了一些关联度不高并很难表达的主题,将范围缩小至疫情期间的用水分析: 1453954、数据处理   数据对齐:整理不规范的时间数据,统一对齐为标准时间制,并按月分类汇总: 数据清洗:提取的数据表中有大量的空值,在原系统中用于统计查询,对本次可视化分析并无直接帮助,因此需直接过滤掉: 汇总整理:对各指标按照需要的维度进行汇总统计: 5、数据挖掘   独居用户用水异常:随着社会老龄化不断加快,一些独居用户面临照料问题。将智能水表进行分析管理,按照既定的数据特征识别出水表可能的用水异常:管道水回流、持续用水、长期零水量等,对独居用户实行智能守护,能节省人力,也提高了效率。 某用户用水波动情况:145397 用户在下午14:00:00时间范围用水分布:   用水性质异常:供水管网漏损是供水行业普遍存在的严重现象。传统的防止管网漏损方法主要通 过定期巡查、定期校检水表、用户举报商业偷水等手段来发现漏水或计量装置故障。但这种方法对人的依赖性太强,抓住漏损的目标不明确。决策树是一种有监督的常用数据挖掘定位工具,使用该算法首先要计算所有特征变量的信息熵,由此确定变量的优先级,对用户用水量、地址、抄表周期等数据进行特征提取并进行处理,对处理好的特征使用XGBoost算法进行分类。被识别出疑似异常的用户,以高亮的方式在图表中呈现,便于巡检人员重点定向排查。145400 XGBoost分类模型中的1棵树结构: 区域群体性事件异常:对热线的类型、地址等信息进行分析,识别在一定时间、区域范围内群体事件发生。 6、可视化报告分析疫情期间热线话务量的变化   色块颜色深浅表示当日话务量的大小,可见疫情期间(2020全年)热线话务量的日均数据均超过了前后年的同期水平,广大居民在对用水的焦虑是一直持续的。我们绘制的"热线十二时辰",数据生成取自工作日的全天时段,多数诉求来自水管设备的维护,疫情期间,巡检外勤人员巡检次数相对变少,间接导致了管网问题的增多。 分析热线工单类别的变化对比、分析企业处理热线工单的及时率   从诉求频率的环形分析图看出,2020年的频率要高于其他两年,诉求的数量高于平均值,也多次超出了高频警戒线。而通过对比2020年与其他2年的工单趋势,位于2020年1月-2月,同比显著下降,这也是疫情发作最严重的时期。而右侧的销单频率直方图中可以看出,2019年的斜率显著高于其他年份,而2020年还未恢复回疫情前水平,这一定程度上与企业的管理方式变更有关联。营业收费与用户用水量分析 分析 疫情期间受影响最大的企业恐怕就是经营服务行业,一度下跌到33%以下,疫情后随报复式增长了14%,整体却仍未完全恢复元气。而行政事业用水持续低迷,很多学校采取了远程教育的模式。 居民住宅的用水量占据了本市最高位置,其次是工业用水,疫情期间的餐饮、娱乐行业用水几近消失,甚至低于消费用水。而商业金融方面复苏较快。同时,本市正在大量加强基建工作,基建用水也逐年提升。在杠铃图中,我们能清晰地看到各用水组成及其最高/最低值与中位数。145407大用户的变化分析 分析重点用户受疫情的影响程度 我们提前了重点大用户的数据进行对比,数据随时间变化的趋势与整体基本一致,20%的大用户占据了全市近80%的用水量,商业、工厂、市政出现了短暂负增长,但很快也恢复了生机;与餐饮业的整体低迷不同,全市体量较大的餐饮企业并未受到很大影响,疫情之后仍然表现出强悍的生命力。 分析不同营业厅管理用户的波动 145448用户数据挖掘 供水管网漏损是供水行业普遍存在的严重现象。传统的防止管网漏损方法主要通 过定期巡查、定期校检水表、用户举报商业偷水等手段来发现漏水或计量装置故障。但这种方法对人的依赖性太强,抓住漏损的目标不明确。决策树是一种有监督的常用数据挖掘定位工具,使用该算法首先要计算所有特征变量的信息熵,由此确定变量的优先级,对用户用水量、地址、抄表周期等数据进行特征提取并进行处理,对处理好的特征使用XGBoost算法进行分类。被识别出疑似异常的用户,以高亮的方式在图表中呈现,便于巡检人员重点定向排查。 随着社会老龄化不断加快,一些独居用户面临照料问题。将智能水表进行分析管理,按照既定的数据特征识别出水表可能的用水异常:管道水回流、持续用水、长期零水量等,对独居用户实行智能守护,能节省人力,也提高了效率。 通过水量预知群体性社会事件,是供水企业的重要的社会责任。对热线中产生的区域查表投诉、区域水质通俗的数据进行挖掘,结合以发生事件的类型、地址等信息进行分析,可以有效识别在一定时间、区域范围内群体事件发生的风险,便于采取进一步措施。1454092、参赛总结 有幸得到了专业数据挖掘团队的支持,虽然最后结果受限于数据本身的特征不够全面,还借助算法还是成功地达成了一直以来都想做的分析,也挖掘出了很有价值的结论,相信这些都能为日后的数据工作提供帮助。 Deadline是第一生产力,不管制作作品的时间有多长,一旦你开始准备,工作量就会自动填满你的业余时间,让你沉浸得不能自拔,痛并快乐… 我真的不擅长颜色调优,自己制作的版本被众人唾弃,已经全部改掉了… 数据集取得太多,个人电脑也崩掉了,感谢帆软售后支持,帮我换到了服务器版… 衷心感谢我的队友,集体的分工协作的感觉真的很好…我还是不太喜欢在图表里写描述文字,data has better words 不会还有冬季吧,我精疲力竭了… 下次求个组织收留,我不想当队长了… 新冠疫情期间的水务数据分析.pdf (1.96 M)       编辑于 2021-8-9 19:53
【产品测评】FineBI5.1.8功能测评报告(新背景地图)
bg1.png测评功能1:地图图层新增标准高德地图 测评维度 维度说明 业务场景使用*1、新增前:BI的地图很难摆脱刻板的印象,常规的主题在多年的使用间也难免审美疲劳,缺乏变数与多样化)2、新增后:多了一些新颖的可视化玩法,整个分为背景层、GIS层、图表层,显示更洋气,一目了然143659143660143661 功能交互体验*操作非常直观便捷,容易理解 产品功能建议*更高的自由度,更丰富的背景选择,配置更为简单化(如加载自定义mapbox) 其他测评维度(可自由发挥对于此项功能的其他测评) 综合满意/推荐度*满意度:4颗星;推荐度:4颗星(评价理由:自由度,我还需要更高的自由度) 注:标* 为必测维度,未标*可选测 编辑于 2021-5-11 21:12
使用FineBI绘制温度区间图
大家好,元宵刚过,我先给各位拜个晚年。距离上次发帖好像过去快半年了…一方面去年年底在备考PMP,最后花了一天时间参加冬季可视化大赛匆匆收场;另外嘛,本人的创意也有点枯竭,毕竟BI的图表类型也一直没更新嘛,几种常见的图表排列组合一下也穷举了很多了,一直等着番薯嘉年华现场去吐槽产品经理…好啦,该水帖的时候也得现身刷刷存在感,今天带来的图形是:温度区间图(Temperature interval chart)。 142257 一、图表背景 好啦,我承认刚那个词是我瞎编的,不要太认真。本创意来自《网易数读》的一篇文案: 没来南方前,北方人也不相信自己会在南方的室内被冻哭:“气温真的是10℃ 吗?温度计坏了吧?我怎么这么冷?为什么穿这么多都没有用?为什么10℃ 比我经历过的零下10℃ 还冷这么多?” 这个温度感觉的差异实际上是体感温度与实际气温的不同,体感温度是我们能感知的温度,而湿度会直接影响体感温度。 中国南方主要城市冬季的相对湿度一般在70% 以上,根据中央气象台展示的体感温度换算表,在5℃ 时,相对湿度达到70% 时,我们的体感温度是2.6 ℃,一般来说体感温度如果在8℃ 以下,就已经感觉很冷了。 (网易数读原文) 142258 由此就诞生了这张实际体感对照表,清晰地呈现了不同湿度下体感温度的变化,我们今天就来仿制一下。 二、制作分析 数据非常简单,两个维度一个指标,结构清晰可见。数据集如下:142261 142263 不难看出,图形由矩阵图和代表数值的条形图组成,毫无疑问,我们要做的是一个拼接组合图。 三、图表制作 1.导入excel数据集,记得把温度、湿度设置为文本,体感设置为数值。 2.选择自定义图形(这里用的是最新版FineBI,旧版界面可能有些区别),图形属性选择“矩形块”,分别将温度、湿度分别拖入横、纵轴,体感拖入颜色轴。 142265 3.为矩形块设置区域渐变颜色,为了保持跟原文一致,我们使用每5℃作为一个区间: 142267 4.为温度、湿度字段分别设置自定义排序,确保数值按照指定顺序排列: 142271 5.预览仪表板,复制我们刚才制作的图形 142272 6.将复制后的图形改为仪表盘,选择最右边的温度计仪表,将体感字段分别置于指针值、颜色、标签: 142274 7.设置仪表盘的颜色属性,将刻度值和刻度槽设置为透明,颜色区间按照正负值赋值: 142275 8.取消本图表的所有背景色,取消显示各轴标签和标题: 142276 9.最后一步你肯定猜到了,将新图表设置为悬浮,前置在矩形块图表上,调整边框使两个图表组合起来: 142277 好了,大功告成,是不是很简单?嗯,在下的帖子一直就是这么水……: 142278 四、后记 没啥想记的,有很多话想对FineBI的图表开发说,不过也一言难尽,留到今年嘉年华现场吧。 数据可视化中如果没有图层对象属性,所有展现可能都要停留在基础图形的拼接组合阶段啦,长此以往,审美总会有些疲劳嘛。 最后,继续一人血书求BI更新箱形图啊,再不更新我就跳去玩FR啦!
【2020冬季挑战赛】似水之形,用水之法,水务行业发展报告
1.选手简介1.1.选手介绍 帆软社区用户名:athlonk7,一个喜欢瞎折腾FineBI的、做可视化老偏题的、做分析不爱写字的、做啥都不喜欢按套路出牌的虚假的数据分析师。 某企业信息主管,本来是个业务部门的人,后来意外转换职业后做了一年FR开发,然后又转岗现在主要用BI 照片以前发过,大众脸就不重发啦 1.2.参赛初衷 获奖不是目的,来参赛就为交个朋友 希望了解更多不同行业的业务知识 希望秀一下自己的骚操作 希望展示一下自己掌握的独到的数据 希望让大家看看我奇葩的脑洞 学习一下其他小伙伴分析问题的角度或特殊的脑洞,完善自己的思维逻辑性 我从来不是为了奖励,本人只爱学习 当然,能有奖励那就更好了 2.场景介绍 城镇水务行业是重要的市政公用事业,关系到城镇环境生态、居民安居乐业、社会经济的持续健康发展。中华人民共和国成立伊始,城镇水务事业姗姗起步;改革开放之后,进入迅猛发展阶段;水务行业积极贯彻落实生态文明建设历年,以“节水优先、空间均衡、系统治理、两手发力”“以水定城、以水定地、以水定人、以水定产”治水方略,进一步推动了行业绿色转型与系统、均衡、多元化的发展。 本分析主要汇总了水务行业的一部分发展现状与水平。取材于第一本以水协编撰的行业发展报告。 2.1.业务背景介绍&数据来源 简述业务背景 拿到了全国城镇水务行业的2001~2018的数据(统计工作的延迟性,其实是最新的数据了) 简述需求背景: 城镇水务行业是重要的公用事业,关系到城镇环境生态、居民安居乐业、社会经济的持续健康发展。 数据来源: 行业内部,城镇水务行业发展统计数据 2.2.分析思路拿到数据后你的分析思考的过程:分析了4个部分: a.城市供水分布分析主要展示当前全国供水现状,水资源分布: 使用自创图表——双环万花筒饼图,展现每个城市的供水能力对比 139615 使用自创图表——热力柱形地图,展现全国区域供水能力分布。叠加热力地图与点地图效果。 139617 第一板块呈现效果如图: 139572 b.城市县城供水普及率分析分析城市与县镇供水情况发展的变化 使用自创图表——双层对立组合图(这个好像有点牵强?) 139619 使用自创图表——勋章图,展现城市与县镇供水普及率的发展与对比,每个点用仪表盘展示,整体使用类似杠铃图的组合方式。 139620 第二板块呈现如下图: 139573 c.城市供水能力分析分析当前水资源与供水能力配比的情况 使用自创图表——跳动的水花。展现在两侧,分布对比当前城市的水资源和供水能力配比。 139621 使用自创图表——乐符图。将每个维度上下对立显示,形状很像音乐乐符,用于对比显示两个指标,突出对比效果。 139622 第三板块效果如下图: 139574 d.城镇供水用水分类比例分析分析用水比例构成的变化与受国家政策环境的影响 使用雷达图。(画外音:嘁,你接着自创啊?)分析各用水分类占比结构与组成。 139623 使用自创图表——组合面积柱形图(画外音:这个我用excel随便做),展示各时期用水比例的分布与演化。 139624 第四板块内容如下图: 139576 2.3.数据整理可视化分析之前你进行了哪些数据处理,在FineBI中是如何操作的,不一定要每一步都描述详细,挑重点、比较复杂的描述,配上截图,方便读者学习本部分主要整理的现成数据,由其他人使用excel整理代劳,finebi主要做可视化呈现和在线分析。 2.4.完成分析报告这个部分主要3点:图表的选择和设置、通过分析得出的结论、最终结果呈现的页面布局 2.4.1可视化图表的选择和制作步骤选择的图表偏重花式展示,本人比较爱好做多样性的可视化呈现。Q:通过图表的分析,你得出了哪些结论?A:结论见可视化报告。Q:简单描述你是如何排版布局,设置颜色的?A水的颜色默认为蓝色,使用这个暗示色作为本篇的主题。与之对比的维度颜色选择了亮绿色,通篇强调低调朴素。 附上最终作品(带鱼屏截图老是上传失败,就用这个压缩版吧)139586 2.5.总结 拖延症害死人,一直忙着备考PMP,最后几天才开始动手。准备数据想了很久,直到最后一天才开始做,迫于时间和精力草草收尾,留下了很多遗憾…… 还有些详细数据限于篇幅暂时未能加入;部分主题的可视化分析未能与主题归纳统一,本部分暂时去除;部分风骚的可视化做的时候遇到FineBI的未知bug,临时无法处理,改用其他方式实现。 配色、排版、美化、边框、字体等因时间不足未能尽如人意。 结论:Deadline 是第一生产力。完整pdf下载:139581 140383
使用FineBI绘制拿破仑行军图
大家好,你们是不是都去看智数大会直播啦?正好,趁着管理员没空审帖,其他人也没注意,我就再跑来水一帖吧。 前面确实想了一些带闹到的创意图表,不过本人才(qian)疏(lv)学(ji)浅(qiong),加上平时实在太忙(lan),一时半会也没想出啥花样,今天就来致敬一下经典,复刻一个可视化故事吧。 一、图表背景136108 今天我们的主角是《1812-1813对俄战争中法军人力持续损失示意图》,也有叫拿破仑行军图的,作者查尔斯·约瑟夫·米纳德(法语:Charles Joseph Minard;发音:;1781年3月27日-1870年10月24日),法国土木工程师,以其对资讯图表在土木工程与统计上的应用闻名;另外,米纳德也以其以地图呈现量化资料的方法闻名。 136109 该图描绘了拿破仑的军队自离开波兰-俄罗斯边界后军力损失的状况,图中透过两个维度呈现了六种资料:拿破仑军的人数、距离、温度、经纬度、移动方向、以及时-地关系。这类的带状图被后人称为“桑基图”(Sankey Diagram),尽管桑基晚了米纳德30年,且只将图用以解释能量流动。 在这张图中,人数由带宽表示,一毫米代表一万人;这些也写在区域间。红色代表军队往俄国行进,黑色则代表自俄国撤退。为了方便视觉对军队缩减的判读,作者假设在Prince Jèrôme以及Davoust元帅指挥下,被派往明斯克与莫比洛的部队,以及自奥尔沙、维特布斯克重新加入主要队伍的军力,是一直与主要队伍一起行军的。 出征时军队人数42.2万人,到达莫斯科时还有10余万人,而活着返回法国的只有1万余人,足以见得拿破仑东征俄国遭受的灾难性损失。 观察黄黑两线交汇处,可以发现活下来的士兵大都中途走岔路返回,前进的大部分都牺牲了。 二、制作分析 FineBI目前还不能直接制作桑基图,有兴趣的可以看看@枫城 的球队排名变更类桑基图。 观察这幅图不难发现,虽然作者用的是各行军据点直接的联系,但自始至终使用了一条连线图来展示,我们便可以通过流向地图来模拟它的效果。 首先,上数据集:136113 。 数据来自:http://www.datavis.ca/gallery/re-minard.php 部分信息有缺失,有需要的可以自行研究。 手动整理数据集如下: 136114 三、图表制作 1.数据集并不复杂,记得把no(序号)、group(部队组别)、direction(行军目标)改为文本: 136115 2.将lat、lng分别设置为纬度和经度: 136117 3.经纬度拖入横纵轴,direction拖入颜色,选择流向地图: 136119 4.把group和no拖入细粒度,survivors(存活人数)拖入大小和标签,雏形已经形成: 136121 5.修改GIS地图底图为清新样式,模仿原图调整颜色,去掉图例,就大功告成啦: 136123 四、后记 图表本身的制作很简单,利用流向地图展示数据段,把指标大小套入连线的粗细,借助维度direction的分组维度展示不同的颜色,顺利模拟出了原图的效果。 但同时,还有一些问题没完美解决: 获取到的数据与原图有些出入,连线的方式还是有一定的区别,需要进一步处理数据集。 图表还欠缺温度、城市名称等字段不能很好地显示,待进一步补完。
使用FineBI绘制K线图
大家好啊,最近有没炒股啊,有没套牢啊,有没赔本啊,有没补仓啊,有没……唔,再聊下去怕没人看了,其实近期故事还是不错的,尤其经济逐渐复苏,年初入市的现在都有10%以上的小赚吧,好,趁大家心情不错,我又来刷刷存在感画个股市的K线图: 股票的数据嘛,我们论坛就有现成的,早在遥远的2019年,我们就有一次BI可视化大赛:2019年A股走势分析,@bear9939 熊大的分析让我们记忆犹新,还没看过的同学记得先去回顾一下喔~135799 今天我们就借这个数据,来做一个逼真的K线图。 一、图形背景知识 先来一段简单科普吧,K线图(Candlestick chart)又称“阴阳烛”、“蜡烛线”,是反映价格走势的一种图线,其特色在于一个线段内记录了多项讯息,相当易读易懂且实用有效,广泛用于股票、期货、贵金属、数字货币等行情的技术分析,称为K线分析。 135817 1. 最上方的一条细线称为上影线,中间的一条粗线为实体,下面的一条细线为下影线。 2. 当收盘价高于开盘价,也就是股价走势呈上升趋势时,我们称这种情况下的 K 线为阳线,中部的实体以空白或红色表示。反之称为阴线用黑色实体或绿色表示。 3. 上影线的长度表示最高价和收盘价之间的价差,实体的长短代表收盘价与开盘价之间的价差,下影线的长度则代表开盘价和最低价之间的差距。 二、作图前分析 K线图看上去稍显复杂,但仔细分析,本质其实是个瀑布图,无论影线还是阴阳线,都是使用的数值大小作为长度,因此: 1.我们需要找到开盘价、收盘价、最高价、最低价,这四个字段; 2.我们需要找到涨跌额,来作为反映阴阳的颜色显示; 三、作图开始 1.上传数据、新建仪表板,在此不再赘述: 135800 2.数据中已经有计算好的涨跌额,新增计算字段,取名为“涨跌绝对值”,计算公式:ABS(涨跌额): 135804 3.计算最高价和最低价的差价,这个也不用多说:最高价-最低价 (股市小白表示:这个值应该不会有负值吧?) 135806 4.将日期拖入横轴,价和涨跌绝对值拖入纵轴: 135809 5.选择瀑布图,雏形出现啦: 135810 6.把最低价拖入纵轴,计算字段 拖入图形属性的最低价的大小栏(千万别弄错喔): 135811 7.调整价的大小到最小: 135812 8.取消图例显示;选择自适应显示,看出来了吧~~: 135813 9.把涨跌额拖入到图形属性“全部”的颜色栏,设置区域渐变,把小于0的颜色设置为绿油油的原谅色,其他设置为姨妈红: 135814 四、后记 作图暂告一段落,看上去有点小,是因为数据量比较大导致,我们可以选择过滤掉部分日期或者只选择其中一支股票,可视效果就好很多啦:135815还有一些比较理想的表现数据: 135820 移动端效果看这里:135819 K线图的画法还有很多种,今天先告一段落,我们实战股票分析里除了这个,还有各种趋势分析等等,在下还是个金融小白,有待大神们继续研究探索啦~ 135816 编辑于 2020-9-3 16:13
使用FineBI绘制上海美食地图
大家好,我又不定期出来刷存在感了,考虑到最近有可能又要到上海出差,对于一个常年只吃KFC的伪吃货,出门前多少还是要做一些简单的攻略的。哪里有大都市特有的网红火锅,哪里又可以吃到只有本地人才知道的人气小店,作为数据人,自然地想做一些简单的可视化。 翻出了手头上大佬帮我爬取的数据集:135440,基于本表来做一个水帖吧。嗯,预览是这样的: 135431本来搜到的都是这样的图,不过这类信息图总有一定的个人主观性,咱这次只从评分的数据来考虑: 135432 数据集长这样的,类别表示餐饮企业主营的菜系,另外还有点评数、口味、环境、服务等多个指标便于我们综合考虑。同时为避免消费误导,此处隐去了具体餐厅名称: 135433 1.导入自助数据集,记得把【序号】一列设置为文本: 1354342.将指标字段中的lat设置为纬度,lng设置为经度,经纬度拖入到横纵轴后,选择点地图: 135435 3.把图表类型设置为【文本】(是不是除了词云图就再没有过其他文本图表啦?)把类别字段拖入颜色和文本,点评数拖入大小(这样我们可以过滤掉部分靠特殊方式获得高分评价的店铺),另将行政区和序号拖入细粒度,为展现全区数据备用: 135436 4.将口味、环境、服务拖入到过滤栏,分别设置过滤,只显示前100家,这样三个过滤项一同作用,剩下的应该都是万里挑一了吧? 135437 5.浅色地图显示效果很差,我们把GIS底图换成深蓝: 135438 6.数据点好像有点少?没关系,因为只显示了前5000行,我们的数据集有10万呢,预览仪表板就能看到全部啦: 135439 好家伙,火锅似乎是大家共同热爱的,哪个区都有人气极高的店;想吃本菜,就只有区徐汇和闵行了;海鲜餐厅似乎受欢迎度不是那么高,只看到一家特别出众的。 好啦,数据都有时效性,本帖仅供娱乐,疫情期间餐饮行业也遭受了一波冲击,大家及时行乐,该吃吃该喝喝啊~ 编辑于 2020-8-17 13:54
使用FineBI绘制末日之钟
编辑于 2020-7-29 09:57 大家早上好,有多少人是被我的标题吓到点进来看的?好了,不用惊慌,本帖只是个水贴。 随着中美关系的恶化,刷新闻时无意中看到这个好玩的概念,又嫌官方的图太丑,于是使用了一些常规的图形叠起来改画了一下,效果图如下。 135200 先来说说末日之钟是什么,以下内容引自wikipedia: 末日钟,又叫末日时钟(英语:Doomsday Clock)是一虚构钟面,由芝加哥大学的《原子科学家公报》杂志于1947年设立,每年一月进行一次评估,标示出世界距离毁灭的距离:午夜零时象征世界末日来临。杂志社因应世界局势将分针拨近或拨离子夜,以此提醒各界正视问题。当前影响末日钟拨动的主要因素是核战争和全球变暖(气候变化)。最近一次调整在2020年1月23日,末日钟被拨近子夜20秒,距离子夜只有100秒,是末日钟自设立以来最接近午夜0时的一次。时钟设立之初正值冷战,当时分针距离子夜仅7分钟。其后《原子科学家公报》杂志委员会会根据世界局势及爆发核战的可能而变动;惟时钟有时未能及时反映实况,如1962年古巴导弹危机时濒临爆发核战,当时委员会却没有拨动时钟。 1991年因美苏两大核武强权签署第一阶段削减战略武器条约而拨慢7分钟,分针离子夜达17分钟,为末日之钟设立以来离午夜最远的一次。 2007年1月13日,该杂志宣布将于2007年1月17日拨动时钟,以反映全球核威胁增加的情况。委员会将气候转变的因素一并考虑,因为他们相信气候转变会助长核能应用。其中一个推测为气候转变导致饮用水短缺,从而引发战争,由此间接增加使用核武的机会。 2015年1月22日,该杂志拨快末日钟2分钟,以反映世界仍缺乏应对全球气候变迁以及核武的全球性政治行动,加上美俄两国于乌克兰危机的紧张情势加剧。 2018年1月25日,该杂志拨快末日钟30秒 离子夜仅2分钟,平了1953年的纪录。 2020年1月23日,该杂志拨快末日钟20秒 离子夜仅1分40秒,为离午夜最近的一次。 然后发了一张很普通的图,没错,就是个垂直折线图: 135199 虽有第三方改画过其他形式,像下方图片这样,运用瀑布图加克利夫兰点图结合的方式呈现近些年时钟的增减,更有创意了点,但能不能把两者结合起来简单优化一下呢? 135201 我们使用FineBI的话,需要做的就只是建立三个绘图:瀑布图、散点图、连线图,再拼接到一起就是啦。 先下载源数据135202,初始数据参见末日之钟(需自行解决不能访问的问题)。 1.数据导入 直接上传即可,把年份字段改为文本,因为在此处它是不连续的。 135203 2.创建仪表板 2.1 我们把年份拖到横轴,拖放剩余时间和调整到纵轴: 135205 2.2 创建瀑布图,我们的基础雏形就靠它了。 135206 2.3 把剩余时间拖放两个到纵轴,一个改成散点图,一个改成线图,做好准备: 135207 2.4 把调整拖入瀑布图的颜色栏,正值调血红色,负值调暗黑色,凸显末日感: 135208 2.5 修改线图的方式为垂直,取消标记点,线宽调到最低,叠加显示方式为高亮: 135209 2.6 给点图设置一下形状、大小,标签用来显示剩余时间: 135211 2.7 把原因拖到细粒度,再到点图的剩余时间中显示注释,随便选几条把原因显示在图上,填充图片的空白: 135212 2.8 加个官方图片悬浮一下,再调个字体、标题、坐标轴,大功告成啦: 135213135214 总结,末日钟的设立更像个行为艺术,川建国的存在可能本身就在加快末日钟的速度吧…… 抛开这些,数据的表达方式也有很多种,我们更多时候可以运用创意不断探索,选中我们最想传达的信息。 好了,水贴完毕!
使用FineBI绘制另类克利夫兰点图
大家好,有一阵没出来冒泡了,是不是想对我说想死你了?(画外音:想你死了) 最近倒也没闲着,除了把周历一口气翻完外,又玩了一个很真实的steam游戏《中国式家长》,这不刚看到个让我很感同身受的信息图: 134990 嗯,从小到大,笔者最讨厌的好像还是“别人家的孩子……”之类的啊,那今天就来仿制一下这个玩意儿。 从外观上看,这是个克利夫兰点图(Cleveland's dot plot),也有人亲切称作棒棒糖图(lollipop chart),使用线型和散点图组合的方式表达多重信息,强调数据的排序展示以及数据之间的差距,点图一般是横向展示,所以y轴为类别型变量,x轴为需要展示的数据值。 但,这张图片上并没有留给我们除了数字以外的指标,我们要如何构建出这样形状的图形呢?小意思,FineBI轻松搞定。 首先我们看一下数据预览,OCR工具太烂,我手敲的: 134991 (画外音:怎么好像混进了奇怪的东西?我:怎么可能,绝对没有。) 1.数据预处理: 1.1 新增排名列-基于【数量】的升序排名 134992 1.2 新增列-求排名平均数 134993 1.3 新增辅助列 插入公式:if(​排名​>=​平均数​,​排名​,​平均数​-​排名​+​平均数​-0.5) 公式本身是为了构筑一条折线效果的坐标轴,其中0.5是偏移量,用来规避横轴重叠,可以根据个人喜好设置。 134994 数据预处理完毕,开始作图吧: 2 绘图阶段 2.1 复制指标字段【排名】,生成【排名1】,转化为维度,并拖入纵轴;然后讲辅助列拖入双份到横轴,记录数拖入最后。顺利的话你会看到这样的画面: 134995 2.2 设置第一个辅助列的图形为点图,拖入【数量】到大小中,把点的形状设置为方形: 134996 2.3 设置第二个辅助列为柱形图,再把柱宽调到最低: 134997 2.4 设置记录数图形为点图,把文字内容拖到标签里显示: 134998 2.5 对【排名1】进行降序排列: 134999 2.6 对横轴进行逆刻度,把一切都逆转过来! 135000 2.7 调整颜色、比例、自适应、透明度等等: 135004 本文的描述风格由@Leo.Tsai 调教而成。 好了,最终效果如下,原图作者应该对数据进行了比例缩放,所以我也计算了一次对数值,这样看起来显示的效果要好很多。 等等,你问我图片最后一行文字是什么?? 我怎么知道,它是什么时候跑进去的呢?好奇怪啊…135005 135003移动端效果预览: 135006 编辑于 2020-7-15 14:05
使用FineBI绘制子弹图
几天不见,一晃就要年中考核啦,忙着写总结的同时,自然也不能少了对KPI的装X展示,于是乎有请今天的主角登场(图片与介绍均来自网络):134349 子弹图(Bullet Graph),是由可视化大神Stephen Few所发明的。考虑到线性的子弹图可以在一个很小的空间里表达相对丰富的数据信息,它的设计初衷便是要取代常在仪表盘中出现的各类指针和仪表,它的特点如下: 每一个单元的子弹图只能显示单一的数据信息源 通过添加合理的度量标尺可以显示更精确的阶段性数据信息 通过优化设计还能够用于表达多项同类数据的对比 可以表达一项数据与不同目标的校对结果 https://bbs.fanruan.com/data/attachment/forum/201712/19/153801njjjtimw6jcfvl14.png 大家应该并不陌生,FR区早就有一款插件,售价2000F币:https://bbs.fanruan.com/thread-100587-1-1.html我们今天就拿BI来重现一遍它的效果。 首先,数据表非常简单,主要指标为当前值和目标值,其他几列为考核的标准,可以自行设置 134350 第一步:导入数据,打开仪表板设计界面,将维度指标全部拖到位,再点选【堆积柱形图】: 134351 第二步:将【及格】、【良好】、【优秀】这些考核的指标保持为“开启堆积”,其他两个指标取消堆积,这样我们就得到了一张花花绿绿的混合柱形图: 134352 第三步:把柱图的整体大小拉宽,再把“当前值”的柱形拉窄一点,虽然有点歪,但已经是最理想的效果了…… 134353 第四步:把“目标值”的图形设置为仪表盘(为什么要这么做,因为其他形状没法调成条形啊…): 134354 第五步:基本大功告成,我们调整一下颜色以及比例,最终效果如下: 134355 虽然实在有点歪,但FineBI的图形描点是这样设计的,不考虑图形组合的情况下,差不多也能表现出想要的效果啦。 数据表在此:134356,还请大家指正。 编辑于 2020-5-27 10:37
使用FineBI绘制相关矩阵图
大家好,好久不见我又来刷存在感了。 有一阵没出周历图系列了,哎,最近实在太忙(lǎn),深陷一起离奇的法庭纠纷(画外音:滚!不就玩个逆转裁判吗) 好了,话不多说,来看我们今天的主角——相关矩阵图: 134227 —嗯?不就是矩形块吗?就这都敢来招摇撞骗? —且等等,这个图里还有玄机啊…… 相关系数矩阵图常用于多变量的数据分析,当变量较多时,我们很难从一堆庞大的数字中快速获取信息。正因为如此,相关阵的可视化应运而生。图中的横纵坐标表示不同的变量,而中间的值表示两个变量间的相关度,位于对角线的值等于1。从矩阵图中,可以快速地看出不同变量的相关性,便于我们快速地了解数据集中的关联。 这个图在FR里有个付费的插件,嗯,就是付费的。叫马赛克图:https://help.finereport.com/doc-view-3173.html 我们使用BI学习班中最经典的案例之一:超市购物篮分析的数据集。还不熟悉这个案例的朋友可以去了解下,听听@bear9939 老师的精彩讲解,如何计算置信度、提升度、支持度。 不过,我们今天计算的是相关度,步骤有些不一样: 第一步,我们打开数据集,这是个超市购物篮数据集,每个订单id表示一笔订单,我们的目标是要找出订单内商品出现的关联性: 134214 第二步,跟学习班的方法一样,我们把这个数据集复制一次,跟自身进行左右并集合并,连接字段为“订单ID” 134215 第三步:将商品维度拖入分组,把“订单ID”求去重计数(嗯,是不是跟BI学习班的一模一样): 134216 第四步:相关矩阵中一般要求数据显示百分比,我们需要将数据归一化(normalization)处理,在这我们采用最常用的归一化算法,将所有数据缩放至,计算公式为:(观测值 - 最小值)/ (最大值 - 最小值) 我们分别新建一列求关于商品维度的最小值、最大值 134217134218 然后新增一列取名为归一化值,输入公式 (订单ID-最小)/(最大-最小) 134219 第五步:后面就很简单了,新建仪表板,安装制作矩形块图的方式,把商品的两个商品维度分别拖入横纵轴,并都按商品名称降序排列,然后把归一化值拖入颜色和标签,这样就大功告成啦: 134226 最后,本案例没有涉及负相关的情况,矩阵颜色因而略显单调,实际中我们碰到的数据集通常都比较复杂,构建的矩阵图往往是这样的: 134222 照例附上数据集文件134224,欢迎吐槽拍砖交流探讨。 然后,一人血书求FineBI出纵向图例、上方坐标轴…… 编辑于 2020-5-13 14:05
使用FineBI绘制周历杠铃图
早上好,我又出来灌水了。一想到离遥远的五一长假还有漫长的两周,我就食不甘味睡不安寝,于是开始翻周历…嗯?这是个什么图,有点意思。再来折腾一下吧。 133534 引自外部资料: 哑铃图(Dumbbell Chart)就像它的名字一样,长得像一个哑铃。当然当你有多个节点的时候,它们还有点像DNA,所以也有人把这种图形称为DNA图。 哑铃图是一种很好的可视化方式,比如你想要表征不同指标的不同组的情况你可以用多个“哑铃”表示。另外,你想要表示某一组在外界刺激后的变化情况也可以用这种方式。 好,不多废话,敲完数据开工。数据表有几个字段:城市(维度)、抢人前(指标)、抢人后(指标) 第一步,我们新增一个指标:变化量,用抢人后减去抢人前,留到后面使用。 133535 第二步,一眼望去很像个瀑布图,就套着瀑布的方式做吧。把城市拖入纵轴,两个指标放到横轴。 133536 第三步,抢人前、抢人后再次拖入横轴,这样我们有了三个组合的图表。 133537 第四步,把矩形块的大小设置为“变化量”,调整“抢人前”、“抢人后”为点图。 133538 第五步,调整颜色、透明度,使之接近目标主题。 133539 好啦,最终结果如下:(怎么样,模仿相似度高不高) 133540 最后:杠铃图也是我很喜欢的图表类型,用来表示数据的分布非常直观,可以通过对比配色调出非常美观的图形。 附上本人手敲的数据表:133543 133541 https://plotnine.readthedocs.io/en/stable/_images/geom_segment_17_0.png
使用FineBI绘制元素周期表
大家好,三天小长假不能出门,我又来瞎折腾了。以下内容引自维基百科: 化学元素周期表是根据质子数从小至大排序的化学元素列表。列表大体呈长方形,某些元素周期中留有空格,使化学性质相似的元素处在同一族中,如卤素及惰性气体。这使周期表中形成元素分区。由于周期表能够准确地预测各种元素的特性及其之间的关系,因此它在化学及其他科学范畴中被广泛使用,作为分析化学行为时十分有用的框架。好了,说白了也就是简单的矩阵图,上元素周期表下载一个,放进FineBI里试试…… 嗯,怎么一次就成功了?好吧,那本帖只能算灌水了。 133443 emmm,设置比较简单啦,图表配置如下,宇宙还有很多未知的元素,尽情地探索吧: 133444 目前未知新的元素是否会延续周期表的格式,成为第8周期元素,还是需要更改排列方式。格伦·西奥多·西博格预计第8周期有两个s区块元素Uue(119)和Ubn(120)、其后18个g区块元素以及30个额外元素,延续已有的f、d和p区块。另一方面,如Pekka Pyykkö等的某些物理学家提出,这些新的元素并不符合构造原理,并有着不同的电子排布原理,因此会影响在周期表中的排列方式。 数据源文件可以点击这里下载: 133445 编辑于 2020-4-5 15:25
使用FineBI实现简单日历图
3月26日更新: 为了更贴合示例里的数据,我重新生成了全年的数据,依照相同的办法做成了下图的样式。 日历图中是要有月份的,我又加上了month函数,将它放到横轴上,emmm,自认为比较接近了。 133273 全部图形设置如下图所示,原始数据我也附在下方吧。有兴趣的一起改进、探讨啊。 133274 133275 static/image/hrline/4.gif 3月25日原帖: 日历图对各位相比都不陌生,时常我们都会看到,讲数据的信息塞入到日历中,展现随日期的变化趋势,常见的可能有这种:133246133247 在疫情期间闲得发慌时,难免又想折腾一下,现有的FineBI暂时没有现成的日历图,能否通过其他方式实现呢? 话不多说,先随便生成个数据,取整个三月的日期,利用数值rand函数随机生成数值: 133248 导入自助数据集,新增两列,分别使用week和weekday函数计算当前日期属于第几周、星期几。然后将结果选择为文本,确保它进入维度字段。 133249133250 制作仪表板,把星期和周分别拖入横纵轴,数值拖入到颜色,大功告成。 133252 最终成果如下,还可以变形为其他图形,效果感觉也过得去。不过手写日历还是会遇到各种奇奇怪怪的问题,有兴趣的可以自己试试。 我们还是期待官方能够开发出这个功能。 133261 编辑于 2020-3-26 09:56
FineBI模拟第三周周历图表(纵向面积图?)
大家好,趁着年前时间松散一点,爱(xian)折(de)腾(huang)的我又来了。尝试第二周周历铩羽而归的我,这次挑第三周的软柿子捏一下。本周的图是这样的,描述了我国自2000年以来博士的招生和毕业人数对比,虽然招生人数稳步上升,但毕业率一直都不太乐观。图表采用了“立式”的面积图,将值轴摆在下方,可以更加凸显出数字的表现力。 周历是这样的,还算是比较初级的图表,原图如下: 131982 第一步,分析一下图形,两个面积图的组合,问题不大。直接打开FineBI,导入数据,拖拽年份、招生人数、毕业人数分别到横纵轴,点选面积图。再将招生人数、毕业人数分别拖拽到对应图形的标签。 131983 第二步,直接切换横纵轴,把图立起来,赞一个FineBI,这功能让人异常舒适。 131984 好像跟原图还不太一样是吧,标签上少了圆圈形的数据点,这个也不难。 第三步,再次拖拽招生人数、毕业人数到横轴,这样一共有了四个图形,将新加入的两个图形切换为点图,并把形状改为空心圆。 131985 第四步,调整下图形的颜色和比例,大功告成。 131986 好了,BI做这个基本手到擒来。文件数据集继续附在下方,有兴趣的可以玩一下或者拿FR试试。 131987
尝试用FR和FineBI做个周历的图表(“花瓣雷达图”?)
1月14日夜间更新: 下午跟小伙伴们在群里讨论了一阵如何实现花瓣,虽然想出了一些非常极端的做法,但这样为了效果而效果,确实有点钻牛角尖了。 夜间我又仔(dan)细(teng)地思考了一下,同样的数据,其实我们只需要借助我们擅长的工具,将要讲述的数据内容、想表达的效果用最适合自身特点的呈现出来,同样也能体现自身的创意。 于是乎,又掏出BI折腾了半柱香,最终较为满意的效果如下图所示,既全面展示了数据,也能与原图一样叙说着数据里故事。 拼出来还是蛮有意思的,实现方式跟初次尝试差不多,没啥技术难点,有兴趣的也可以试试。 最后,瞎取个名字吧,就叫——花瓣雷达图? 131921 static/image/hrline/4.gif 前几天在群里聊天,大家都觉得周历的图表蛮有意思的,便寻思着能否自己实现一下,比如上周的是这个:131907 第一步:找不到数据来源,于是自己手敲了一遍… 然后把明星的名字拖入finebi中,掏空圆心,做个外圈 131908 第二步:把明星名字与主演次数拖进去,做个玫瑰图。 131909 第三步:把玫瑰图改成悬浮,去掉背景,拖到圆环图中央,调整比例,居中对齐。emmm,俨然有点模样了。 131910 第四步:好像颜色还不太对,一个个调整下吧,最终成果如下。 请原谅我的色弱…… 131911 目前还没想到如何实现的,恳请指点、探讨: 1.内部环形底纹 2.外圈的半圆比例图 在星大建议下,补充了个FR做的,也挺好看的,颜色我就不调了,有兴趣的可以拿我的半成品把它做完…… 131915 附:个人手敲的文件数据集: 131912 FR模板: 131916 编辑于 2020-1-14 22:42
【数据追梦人】年过30老菜鸟,独自挑战全公司报表建设,感言道:数据是男人的浪漫!
定期机构改革,年近30的迷茫菜鸟跨界搞数据报表建设 2017年的春天,一个恬静得不能再恬静的海滨小城,某企业也开始了平常得不能再平常的周期性折腾——定期机构改革,我也像很多普通得不能再普通的员工一样,借新老交替之际机休了个平时不会批的探亲长假。然而,一个让我几近绝望的改变正悄然而至…… 130462 我叫徐毅力,是一个三十出头有些无所事事的国企职工。我虽计算机本科毕业,但多年没遇到专业对口的岗位,凭借点小聪明、靠着娴熟的excel技能和略超他人的PPT审美、客串成男秘混(da)迹(za)于业务部门,早把专业课知识抛之脑后。休假期间,我也遭受着中年危机的困惑,承受着与日俱增的生活压力,总觉得自己虚度了过去十载光阴,却也不知该往哪个方向转型。 带着迷茫我咨询了很多前辈、同学,有建议考证的、有建议搞网络的,也有建议裸辞出来闯的,而我甚至不知自己适合什么,该何去何从…… 但我休完假回来,一切全都不一样了。机构变动这次有点彻底,原部门没了,原岗位也改头换面。这次稍微有点变化的是,把信息部门从总部中拆散,由各大分公司自身进行信息化建设,当我一脸懵逼地跑到IT部门报道时,早已分好任务的同事们笑容可掬地告诉我:其他项目都有人领了,还剩个全公司数据报表建设,你正好科班出身工作经验又这么丰富,就你来吧。 想不到徐某一世英名,躲了十来年不想搞本行,最后竟还是找上门了。 然后我还收到一些幸灾乐祸式的问候:这个工作量有点大、内容比较枯燥,你要加油喔! 不接受,意味着当着公司所有同行的面承认自己是个混子,以后在这的几年内也得不到什么好脸色;接受呢,对于这点技术积累的我,无疑也九死一生,但或许能逼自己一下,还有一线生机。 人都是逼出来的,别的可以输,气势不能输,哪怕死也要死得华丽点,我轻蔑一笑潇洒转身,淡淡甩下一句: 你们不会懂的,数据是男人的浪漫。 自行开发,让我陷入了绝望和恐惧…… 嘴硬归嘴硬,工作还是要开始的。 俗话说得好:万事开头难,然后中间难,最后结尾难。我清点了下手头可用的资源,资金只有其他项目采购剩下来的一点点预算,不到一年的工期,没有硬件没有人员,留给我的可能只有自行开发一条路可走了。 恶补基础是非常痛苦的过程,以下是我的尝试记录: 第一个星期,我开始学SQL,三天学安装,一天学语法…… 第二个星期,我开始学html 第三个星期,我开始学JavaScript 第四个星期,我放弃了 130447 或许技术积累太浅,或许心态过于急功近利,或许自身的认知能力还未达到流畅自学,总之,我遭遇了第一次瓶颈期,学着自己也不相信能学好的技术,写着自己也不知道怎么才能写好的代码。 三个月过去了,项目没有任何技术上的进展,我只能茫然地游走于各单位间做业务调研。望着三四十个子单位累计上千类数据报表,我陷入了绝望和恐惧…… 领导和同事们不定期也会询问下我的成果,看我是否需要帮助,同样让我倍感压力。有人殷切期待,有人冷眼旁观,也有人等着看笑话。 同行交流学习,遇见救星——帆软finereport 不得不说,冥冥之中总有些偶然性。年中的一次同行交流学习,我得以拜访常熟中法(现名江苏中法),其中一名技术骨干向我介绍,我们有一套报表工具,依靠它我们只需要几名研发就完成了全公司的数据中心开发。 我心中一阵窃喜,若能全盘照搬,部分外包,或许能有些希望。遂索取了工具名称和部分系统截图,立马回营研究。拨通了电话后,第二天一位笑靥如花的售前就来到我面前。他告诉我,这套工具叫finereport,并不难学,可以为我提供细致的技术支持。 当晚我便打开了说明文档,一条一条练习,第一周便通过了FCRA。 但我从来都是不务正业的,学了点皮毛后,我第一眼便盯上了效果非常突出的大屏功能。作为一个非常牛逼非常娴熟的PPT专员,大屏是比PPT更有逼格的展示。我立刻量了下中心调度室的大屏尺寸,翻开论坛视频教程照葫芦画瓢,取了去年年终汇报的数据做成文件数据集,在摸爬滚打调试效果分辨率等折腾了一整天后,这套界面终于得以问世。 129923 请来老板和同事观看这个“阶段成果”后,果然得到了一致赞扬。有了领导层的支持,工具的采购顺利完成,跟业务部门配合起来也得心应手,很快我又收到了一台其他项目多出来的服务器,虽预算已经花完,但架上Linux+MySQL,我的项目终于走上正轨。 对于一直有些抗拒写代码的我,零代码加直接沿用excel函数的finereport开发实在是非常友好,哪怕它学到后面还是挺复杂,但我还是硬着头皮啃了下去,我只有这一条路可走了。 一个月后,我通过了FCRP。 论坛很多大神们的案例套路,也给了我重要的借鉴和参考。建好了全部基础数据表和单元格映射后,数据填报功能已然上线。凭借着平台自带的数据校验、权限分配、excel导入、手机填报等高度定制化人性化的功能,系统也受到了业务人员的普遍欢迎。 129924 为了取得业务部门更多的信任,我开始作死地舍弃了很多底线来实现他们的需求。于是乎,我也如愿收到了一大堆离谱到难以理喻的需求(如点一下字体变色,用左手的时候一套快捷键,右手用另外一套等等),也答应了很多部门直接帮他们处理好成品数据报表,工作量几乎是过去十年的总和…… 然而先进生产力就是一切,掌握了更多技能的我,处理起这些低维度的需求效率基本是指数型上升。我所要做的是每天翻出《程序员暴揍产品经理》的视频重温一遍,便再次带着饱含激情的状态进入下一段开发。 慢慢地,我每天的主要工作也变成了处理数据库设计缺陷带来的问题和对过程及界面的优化,但这阶段带来的成就感已让我信心爆棚,每日工作到十一点也乐在其中。为了提升效率,我从隔壁硬件组借来了一套显示器和一台旧笔记本,组成了一套小工作站,一边调报表,一边记编码;一台写存储,一台跑后台。一箱泡面、一卷铺盖便成了我日常的陪伴。 130460 做完基础报表,我更多开始尝试更多的可视化呈现,展示各部门枯燥的行列数据,图形就是最好的语言。 129925 从Finereport到FineBI,从数据可视化到数据分析 系统进入稳定运行后,我日渐沉迷于数据可视化展示,力求把我做的每一个决策报表都写好钻取、联动、折叠等,直到帆软售后过来调研情况时告诉我:你这样用BI做会简单很多啊。看完他对BI的演示,轻松拖拽间就实现了我的联动分析要求,简直文艺得让我有些嫌弃Report了,回到家二话不说,直接打开教程开始研习。 回想起自学Report的痛苦经历,这次我直接报了BI工程师培训班,老司机带路还是能避开很多坑吧。 事实证明,这次的选择是无比正确的,罗老师在讲解基础功能的同时,也准备了一堆把我虐到生活无法自理却又实用得欲罢不能的习题,原来数据是可以这样用的,也把我带进了这个全新的领域:数据分析。 为了把这些知识点弄懂,我逐字研究了罗老师讲义上的知识点:置信区间、RFM模型、相关分析、二八分析、波士顿矩阵…也自己买来教材恶补统计学知识。 过去十年打杂的经验在这也变废为宝,常年为业务部门做报表也让我得以无比熟悉日常的业务模型,把这些配上罗老师传授的套路,我的可视化分析也慢慢像模像样了。 129926 罗老师的课程给我的帮助,还有企业数据应用的推广:自上而下和自下而上。 这之前,我却从未站在企业的宏观层面思考这个问题。 从我的大屏获得领导层的支持,项目得以全面推进,这不就是自上而下吗。 而可视化展示获得业务部门的配合,数据分析帮助基层人员直接解决了业务问题,这不就是自下而上吗。而将两者推进结合汇聚起来,这不就是数据应用真正落到实处的最优解吗? 129927 后面的日子,我主动为业务部门制作了大量的填报、展示报表,也顺理成章地获取到了所有的数据库管理权限。虽然还没能掌握搭建数据仓库的技术,但借助spider引擎,勉强满足了数据集市的标准。 面对任何需要数据分析的业务需求,我这一个人的团队也能迅速找出数据,给予可视化的决策参考。同时,我的系统也是其他所有业务系统的功能补充,全部的数据得以集中输出、分析、汇总,这些也慢慢改变着传统的业务流程与人员习惯。 在最近的一次更新中,我手持双剑合璧,把整合后的两套系统改了一个更具野心的名字:数据中心。 130458 “数据是男人的浪漫” 数据给行业带来的变更是无法阻挡的,而我做得,或许只是偶然地站到浪口,用了一个最简单直接的方式,完成了一次助推。而这次助推,也只是冰山一角,但对于我们这类传统行业,也算迈出了坚实的一步。 或许是同事们对我的拼搏和成果的认可,我也在系统全面推广后不久得到了职务晋升,也得以将更多的资源与精力进一步投入到数据化转型的建设中。 在今年的智数大会上,我很开心地分享了这段经历,也见到了仰慕已久的罗老师及各位论坛网红小哥哥小姐姐。罗老师也鼓励我:继续走下去,帆软在和我一同成长。 129928 “莫问前程,勇往直前”,这句罗老师在每个讲解视频的结尾都会提及的鸡汤,不经意间,它却成了我坚持下来的一剂良药。随着项目成果的逐渐显现,我慢慢找回了丢失已久的自信,心中的迷茫也逐渐消散,在数据的领域越往前走,你会发现越来越多的魅力。 或许我无从知道未来会怎样,但在数据的道路上,我希望能一直走下去。 颇具讽刺的是,数据给了我对专业的热爱,为了更深入地学习数据科学,我竞拾起了我一直不屑一顾的课本,重回码农之路…… 129929 回想起我那句脱口而出的略带中二病的台词: “数据是男人的浪漫。” 谁敢说不是呢。 我是徐毅力,一名普通得不能再普通的数据追梦人,数据伴我走出焦虑和迷茫,指引了我方向。这,就是我的故事。 (附上我在最焦虑绝望期间的严(er)肃(bi)照片,谨以自勉) 129930
12下一页
个人成就
社区核心粉丝
内容被浏览140,341
加入社区4年36天
贡献:11495

联系社区管理员|联系帆软|《帆软社区协议》|手机版|帆软社区|Copyright © 帆软软件有限公司 ( 苏ICP备18065767号-7 )

GMT+8, 2021-10-26 14:11 , Processed in 0.457034 second(s), 104 queries , Gzip On.

返回顶部