标题:
豆瓣经典读书Top156排名分析
1、团队介绍
帆软社区用户名:yzm289367
身为高校电子商务专业的一名大三学子,我对数据可视化非常感兴趣,恰好选的电商发展方向是商务大数据分析,这些年数据可视化分析变得越来越火热,可见对于各行各业因业务所产生的源源不断的数据来说,制作数据可视化报表对进行商业数据决策分析,结果汇总,市场预测,计划指明有着很大优势,在比赛期间我系统认真学习了Fine BI的知识,希望在以后毕业,如果有需要分析公司业务情况这样的机会,我可以尝试一种新的工作总结的方式—用Fine BI 进行数据可视化分析。
我参加这次比赛的目的有以下几点:
1、想借着这次比赛,通过实践提升BI工具学习和使用的技能。
2、了解更多优秀的BI实践案例,以及大神是如果利用该工具进行数据分析的。
3、了解、学习BI更多的可能性。
2、作品背景
作品原因:
考虑到数据经过组合处理分析会对接下来的公司业务影响很大,数据可以提供市场预测量,通过总结上一次业务开展情况,可以很直观看出业务的成效以及需要改进的地方,同时数据还对制定目标有很强的导向性,数据经过处理也可以很好很直观的展现给他人看,所以这次我选择对豆瓣经典读书Top156的排名进行分析,以小见大,我认为所有的业务分析都是一样,都是为了取得一个很好的结果,达到这种目的必然伴随着各方面的影响因素,另外在分析的过程中也可以提高自己分析探索问题的能力。
通过这次Fine BI实战,我研究出了豆瓣经典读书Top156排名是怎么来的,这为其他书怎么能冲进Top156提供了借鉴的思路。另外豆瓣经典读书推荐也会给商家或者各大平台带来经济效应,会给广大读者一些经典书籍推荐,读者可以在平台上浏览或者网上或线下实体店购买书籍,所以选择研究豆瓣经典读书Top156的排名原因分析意义重大。
作品解决问题:
本次作品分析出了豆瓣经典书籍Top156成功入榜的原因,得出了喜欢阅读经典书籍的用户画像,并且把握住了经典书籍畅销的关键点,为下次更多的经典书籍入榜豆瓣Top榜提供很好的借鉴思路。并可能会给其他在线阅读平台或者网上书店,线下书店带来经营策略。
作品局限:
由于自身知识储备不够,获取数据能力有限,数据没有及时动态更新,相当于操作有点繁琐,每天研究需要自己重新把数据粘贴到表格中,然后自助数据分析进行研究。下一阶段自己会好好学习如何获取数据的内容,并进一步提高对获取数据处理分析的能力,增强数据解读能力与呈现数据视觉美感。
作品切入点:
通过自己一步一步的进阶分析,顺藤摸瓜,先找到一个切入点,继而针对各种可能的因素进行有针对性分析,并结合指标看到各因素所发挥的作用,进而产生本次数据分析的巨大潜力。
3、制作流程
数据来源:https://book.douban.com/tag/%E7%BB%8F%E5%85%B8
我先通过八爪鱼数据采集软件获取到了豆瓣经典书籍Top156网站页面的书籍相关信息,并且自己所用的数据在使用前已进行了一些基本的处理,使用过程中我的数据大多是以EXCEL数据集和自助数据集的方式进行收集并加以处理分析的。
拿到数据后我的分析思考过程如下:
找好本次数据分析研究对象后,我先搜集了所要研究对象的大量相关数据信息,并思考了这些数据之间存在的关联关系,针对现有数据情况与预期目标,我先从如何实现,接着数据引入,然后数据加工处理,最后对数据结果给出展示图形这些流程开展本次的数据可视化作品制作。
准确分为:
1.本次选取了豆瓣经典读书Top156的所有书籍,根据豆瓣平台上的信息,将进行数据整理,分析出其成功入榜的原因,经典书籍的用户画像,经典书籍畅销的关键点,下面是豆瓣平台上156本书籍的基本信息。
2.在掌握书籍基本信息的情况下,我们开始了豆瓣读书经典书籍排名因素的探索,首先参看了Top156豆瓣经典书籍的豆瓣评分区间与评价人数区间上的书籍数目分布情况,这两个数据汇总是最直接切中要害的,其一是平台对书籍的扶持,其二是用户对书的评价。
3.我们先分析第一个影响书籍排名的因素—作者,针对其,我们查看了豆瓣评分,好评人数,得出了Top156豆瓣经典书籍的受欢迎信息。
4.接着我们分析第二个影响书籍排名的因素—国家,针对其,我们统计了Top156豆瓣经典书籍的作者国籍,借着豆瓣评分与评价人数两个结果指标,分析出了国家这个影响排名因素。
5.再接着我们分析第三个影响书籍排名的因素—出版时间,针对其,我们汇总了不同出版时间Top156豆瓣经典书籍的豆瓣评分与评价人数,借着豆瓣评分与评价人数两个结果指标,分析出了出版时间这个影响排名因素。
4、成果展示
我们根据作者,国家,出版时间这三个因素分析得出了豆瓣经典读书Top156的排名原因,据此,我们可以得出读者经典书籍的用户画像,为各大平台或者书店商家提供书籍布局与销售思路,把现有的数据发挥出了巨大价值。
4.1 模块一
第一个影响书籍排名的因素—作者
有些读者可能喜欢某个作家,而作家都会有几个经典的代表作,本次通过豆瓣平台对排名上榜的书籍评分进而间接得出每个作者的豆瓣评分,并结合书籍的大众评价人数,汇总得出某一个作者的受欢迎度,进而两个因素综合判断得出那一个作家最受欢迎,从而推断出他的一些经典作品将会受到更多读者的热捧。
4.2 模块二
第二个影响书籍排名的因素—国家
由于经典书籍的优秀创作者来自于不同国家,很明显,哪一国家的书籍最为畅销,最受读者欢迎,作品来源于哪一国家这一因素正是我们不容忽视的,我先从排名上榜的156本经典书籍进行按国家分类,汇总出数量,然后再分析此国家的书籍受大众喜欢程度,按国家分上榜的书籍的平均得分,进而推断出哪几个国家的书最受欢迎。
4.3模块三
第三个影响书籍排名的因素—出版时间
喜欢经典书籍的读者,他们的阅历和年龄可能各不相同,继而会对不同出版时间的书籍略为喜爱,每个时代创作的书籍都有他当时的时代背景,时代特色,而每种时代,总会给读者不同的感受,相比较大多数书籍,某个时代下的书籍可能更具有魅力,所以此次研究分析了排名上榜的书籍的出版时间,根据每个出版年进行书籍分类汇总,进而得到该年下的读者喜爱程度,并求出该年于上榜书籍平均观众喜爱的趋势分析,得出年份大体书籍的变动趋势,再通过豆瓣评分指标来进行捕获最受读者欢迎书籍的出版时间。
4.4模块四
作品展示:
5、总结与分享
所遇困难:
在整体完成作品的过程中,我遇到了许多困难,因为我是第一次接触Fine BI,我也没有其他数据可视化的基础,比如在Fine BI 中怎样用自助数据集来汇总、连接数据从而展示自己想要的数据结果和指标、怎样选择合适的图表来展示数据、怎样进行仪表盘颜色的搭配和选择、怎样按照自己的设想和需要计算指标等等,里面很多操作方法也是自己一步步跟着视频案例学习、从社区帮助文档查找或者需求指导老师帮助从而知道的。
学习收获:
通过Fine BI的学习,我最大的收获是用数据分析方法解决一些业务上的问题,并能制作图表采用联动效应使分析的数据可视化的展现出来。目前我还可以搭建起来基础的数据可视化大屏/驾驶舱,可以独立讲述数据背后的数据故事。并且,通过Fine BI我也可以分析日常生活中所产生的数据,向周围的人介绍数据背后所蕴藏着的巨大价值,以及FineBI的优势。
通过这次学习比赛,自己在数据分析的道路又走进了一步,希望日后能在工作更好的发挥FineBI的功能。最后再次感谢帆软大赛官方的大力支持、悉心筹备和工作人员的辛苦付出,通过这次比赛,我学习感触很深,技能也提高了很多,并见证了数据可视化分析的巨大魅力与数据背后蕴藏着的巨大价值。 |