请上传宽度大于 1200px,高度大于 164px 的封面图片
    调整图片尺寸与位置
    滚轮可以放大缩小图片尺寸,按住图片拖动可调整位置,多余的会自动被裁剪掉
取消
时亚东(uid:266033)
职业资格认证:FCP-报表开发工程师 | FCA-FineBI | FCP-FineBI
【2023BI数据分析大赛】小红书笔记不会写?头部博主来教你
一、选手简介 1、选手介绍 团队名称:Sunday 队长介绍:我叫时亚东,帆软社区用户名也是时亚东,目前就职于杭州容创荣新信息咨询有限公司,我司目前从事教育培训行业,以标杆企业学习和数字化转型咨询服务为主,为正在寻求数智化转型的中小企业提供解决方案和人才培养。目前岗位角色是“数智化人才培养项目经理”,同时我也是一名商业数据分析师,对帆软公司下的FineBI和FineReport两款产品已有四年的使用经验了,分别获得FCP-FineBI认证和FCP-报表工程师认证。个人非常看好FineBI在企业数字化转型过程中“江湖地位”,目前很多大中型企业在数字化转型过程中都愿意与帆软合作,提供直击业务痛点,打破数据孤岛等企业数据治理问题的解决方案。同时个人非常愿意利用FineBI解决工作中的数据分析问题,积极向身边的同事和客户推荐FineBI,合理利用帆软社区提供的知识库和借鉴行业案例。 成员介绍: 孔国成,目前就职于杭州容创荣新信息咨询有限公司,当前岗位角色是“数智化人才培养项目经理”,同时负责杭州标杆企业学习项目策划与现场交付。拥有丰富的数智化人才培养项目的管理经验,在与客户交流过程中能够迅速把握住业务痛点、人才能力缺失点。能够顺应社会热点,迅速设计数智化人才课程,比如AIGC方面的人工智能训练师课程等。 王文豪,目前就职于杭州容创荣新信息咨询有限公司,当前岗位角色是“标杆企业学习项目交付经理”,对数据分析拥有深厚的兴趣,具有敏捷的数据思维和数据感知力。目前在从事某国企“数据驱动业务”数智化转型项目的管理工作,接触到大量的实战案例,接触过FineBI、QuickBI和PowerBI等数据分析工具。 团队组成: 我们三人来自同一个公司,作为数据分析师的我刚进入公司便以企业数据分析咨询师的身份帮助大家认识数据分析,学习数据分析思维和方法。由于之前自己参加过三次帆软团队举办的FineBI数据分析大赛,获得了一些成绩,便向同事们介绍了这个比赛和规则。为了更好的提升团队的数据分析能力,借助本次举办的【2023年第四届FineBI数据分析大赛】机会,带领我们团队积极参与到这次比赛中,希望能够获取优异的成绩,和来自各行各业的数据分析高手们共同交流学习。 2、参赛初衷 培养团队的数据分析能力,增进团队合作默契。 目前在做课程运营推广时遇到一些瓶颈,在解决问题的同时掌握FineBI的数据分析功能。 能够与各行各业的数据分析高手们共同交流学习,获取一些案例和经验。 二、作品介绍 1、业务背景/需求痛点 业务背景: 今年我们公司希望能够通过小红书、抖音、今日头条或知乎上对我们的学习项目产品以及主营业务进行介绍,但是我们团队是初次运营此类平台,所以领导希望我们多收集一些平台上关于“数据分析”相关的笔记信息和博主信息,找到一些规律和方法,指导我们自己的推广内容运营,提高用户转化率。 需求痛点: 如何撰写推广内容,在平台上发布内容时需要注意哪些细节? 如何运营平台账号,平台上的博主画像是怎样的? 如何模仿头部的博主,布局公司的账号,抓住客户需求,制作新颖的内容。 2、数据来源 自选数据:来源小红书平台。 笔记内容统计 笔记关联话题 用户信息统计 用户标签词 优秀博主笔记布局 优秀博主笔记内容统计 3、分析思路 4、数据处理 在数据处理环节我们创建了2个新的指标“笔记关注度”和“博主热度”,借助FineBI的数据清洗功能先获取点赞数、收藏数和评论数的最大值和最小值,然后利用极值进行归一化,最终通过给予不同指标的基础权重计算笔记关注度指标。 “笔记关注度”计算过程 “博主热度”计算过程 5、可视化报告 (1) 第一个Tab页:哪些笔记关注度高 数据故事: 小红书平台属于用户生成内容(UGC)的平台之一,主要内容类型分为2种,分别为视频和图文。 本次项目为探究关于“数据分析”主题下哪些笔记最受用户喜欢,收集了150篇小红书笔记,分别由来自26个地区的89名优秀博主发布,共有5种笔记类型,其中干货推荐83篇,课程推广29篇,经验分享21篇,技能教学13篇,效果演示4篇。 基于这些笔记的点赞数、收藏数和评论数,我们构建了一个新的指标,笔记关注度,计算公式为:笔记关注度=20×归一化后点赞数+30×归一化后收藏数+50×归一化后评论数。 数据结论: 1. 所收集的150篇笔记平均点赞数1511次,平均收藏数2135次,平均评论数136次,平均关联话题数6个。 2. 关联话题集中在“数据分析”、“数据分析有窍门”、“数据分析我在行”等。 3. 其中84.67%的笔记属于图文类,15.33%的笔记属于视频类。以干货推荐类的笔记占主体。 4. 广东地区此类笔记发布次数最多。 5. 关联话题在10个以下,笔记关注度相对较高。 6. 收集到的150篇笔记中笔记关注度在5分以上的笔记数仅有36篇,其余均为5分以下的关注度。 (2) 第二个Tab页:哪些博主热度高 数据故事: 为进一步探究关于“数据分析”主题下的小红书笔记内容运营的细节,我们采集了来自33个地区的212位小红书平台发布数据分析相关笔记的博主信息,进行小红书博主的画像分析。 其中男性博主人数略低与女性博主人数,92.45%的博主来自国内,仅7.55%的博主来自于国外。博主首页的标签关键词主要有“数据分析”、“知识”、“分享”、“Excel”、“学习”等。 为更好体现博主的受欢迎程度,我们结合粉丝人数和获赞与收藏数指标,新建了博主热度指标,计算公式为:博主热度=60×归一化后的粉丝人数+40×归一化后的获赞与收藏数。 数据结论: 1. 212位分享数据分析相关知识的博主发布的笔记内容获得大家的追捧,平均粉丝人数1902人,平均获赞与收藏数达6875次,平均博主热度为5.11。 2. 博主热度最高的IP属地在河北省,但是我们观察到广东省的博主人数是最多的。 3. 男性博主的平均博主热度为8.10,远大于女性博主的平均博主热度2.86。 4. 我们根据博主热度指标最终筛选出以下3位博主进行研究:“数据分析精选”、“Shawn数据分析”、“数据分析看Stone”。 (3) 第三个Tab页:头部博主如何运营小红书 数据故事: 基于上一环节我们聚焦到小红书博主热度最高的三位优秀博主“数据分析精选”、“Shawn数据分析”和“数据分析看Stone”,采集了每位博主近期50篇小红书笔记信息进行统计分析。 三位博主都在自己的主页设置了专栏,将自己的作品分类收藏在不同的专栏内,以便粉丝们学习查找。统计博主专栏笔记数发现数据分析精选的笔记数最高达到309篇,属于高产博主。但是开设的专栏数最少。 “Shawn数据分析”博主最近发布的作品在2022年11月份,已停更近一年了,非常可惜,但是他在平台的干货贡献广泛受到粉丝们的追捧和收藏,再次说明内容的价值才是“王道”。 数据结论: 1. 基于每位博主的近期作品点赞数、收藏数和评论数,新建笔记关注度指标,其中“ 数据分析看Stone”的平均笔记关注度最高。我们发现其有篇笔记收到1792个评论,大家可以通过筛选控件找到这边笔记。 2. 可以通过筛选控件查询感兴趣的博主信息,三位博主的赛道有共同点都是在分享数据分析类的知识,但也存在差异。Stone注重数据分析面试经验分享,Shawn注重数据分析干货分享,数据分析精选则侧重数据分析技能提高。 3. 在运营小红书类平台账号的时候需要选择适合自己的赛道,分享的知识或内容是大家感兴趣的,抓住粉丝的需求。通过起合适的标题吸引,关联热度最高的关键词主题。 6、最终作品效果图 作品链接:https://bisolutions.fanruan.com/webroot/decision/link/BDGv 三、参赛总结 1、FineBI工具 在从事数据分析工作近三年了接触了不少数据分析工具,但始终对FineBI情有独钟,从FineBI 5.0版本到FineBI 6.0版本,一直是忠实的“番薯”,站在使用者的角度感觉交互感越来越好,尤其是对自助数据集的优化更是提高了平时的工作效率。本次借助FineBI 6.0第四次参加数据分析大赛,从数据加载到数据清洗,再到最后的可视化图表制作,一系列操作非常丝滑,祝愿FineBI在后期的优化过程中越来越好。 2、参赛总结 本次参赛最耗时的过程是对小红书平台数据的采集,每一篇笔记和每一位博主都进行点击查看,收集他们的重要字段信息,我们团队也是夜以继日地进行采集工作。 本次参赛主题一方面是对公司实际需求的解决和验证,另一方面也让我们更了解了小红书平台的运营规则,同时我们采用了Tab页控件,以主题方式分模块展现我们的数据故事。为后期提高小红书笔记的撰写能力和主题赛道的内容产出有了重要的指导作用。 同时也参观了社区内各行各业数据分析师的作业,得到了很多启发,也发现了差距,我们利用FineBI在数据分析的道路上越来越优秀,星光不负赶路人,再接再厉。
FineReport-数字农业:我国农业发展现状
数字农业:我国农业发展现状 大屏制作目的 个人对我国农业发展一直拥有深深的兴趣,在数字经济的潮流中,趁此机会想致力于数字农业的发展。通过对官方数据的收集,探究当前我国农业发展的现状,对此有个直观认识。通过对我国农业现状的多维度拆解,依次分为“人”、“货”,“场”三个维度展现农业现状,并得出相应结论。 前言 什么是数字农业? 提出者:1997年由美国科学院、工程院两院院士正式提出。指在地学空间和信息技术支撑下的集约化和信息化的农业技术。 数字农业是将遥感、地理信息系统、计算机技术等高新技术与地理学、农学、生态学等基础学科有机地结合起来,实现在农业生产过程中对农作物、土壤从宏观到微观的实时监测,以实现对农作物生长、发育状况、病虫害、水肥状况以及相应的环境进行定期信息获取,生成动态空间信息系统,对农业生产中的现象、过程进行模拟,达到合理利用农业资源,降低生产成本,改善生态环境,提高农作物产品和质量的目的。 数字农业是将信息作为农业生产要素,用现代信息技术对农业对象、环境和全过程进行可视化表达、数字化设计。信息化管理的现代农业。数字化使信息技术与农业各个环节实现有效融合,对改造传统农业、转变农业生产方式具有重要意义。 数字农业还包括利用信息技术和数字化手段在农产品生产、流通、运营环节的融合和利用,实现提高农产品产量和质量,提升农产品的附加值和市场品牌影响力,利用数字化手段拓展农产品的营销能力,降低市场运营成本,提升农产品的溢价能力和竞争力。 数字农业组成 农业物联网、农业大数据、精准农业、智慧农业 数字农业特点 农业生产高度专业化、规模化、企业化 农业生产体系完善 农业教育、科研和推广“三位一体” 我国数字农业发展现状 在农业数字信息标准体系、农业信息采集技术、农作物生长模型、动植物数字化虚拟设计技术和农业专家系统与决策支持系统等方面的研究应用上,中国企事业科研单位都取得了丰富的成果,通过不同类型地区应用师范,初步形成了我国数字农业技术框架和数字农业技术体系、应用体系和运行管理体系,促进了我国农业信息化和农业现代化进程。 案例:陕西省“国家苹果产业大数据中心”、浙江省智慧农业云平台 数据分析在数字农业的应用场景 场景1:农作物生长信息的数据挖掘及可视化分析 场景2:土壤、环境等采集信息的数据挖掘及可视化分析 场景3:农产品质量控制数据采集及分析处理 场景4:农产品生产、流通、销售等环节数据可视化分析与决策 数据收集 国家统计局2021年中国统计年鉴 指标拆解 人 人口信息 七次人口普查数据:乡村人口数和城镇化率 城镇化率 = 城镇人口 / (城镇人口 + 乡村人口) 就业信息 第一产业(农业)就业情况 农业就业率 = 农业就业人数 / 三大产业就业总人数 乡村就业情况 乡村就业率 = 乡村就业人数 / 城乡就业总人数 私营和非私营单位平均水平工资和农业工资情况 货 农产品种植面积 农作物种植面积 农产品总产值 农林牧渔总产值 农产品产量 农林牧渔主要产品产量 人均农产品产量 场 地域分析 全球农业生产指数 全国农作物种植面积分布 全国农林牧渔产值排序情况 图表展现 大屏设计 利用PowerPoint对相关组件和大屏布局进行设计。 大屏制作 前期的学习已经将决策报表的每个组件的设计详细的介绍了,在本次作业中对细节的描述全部省略,关注于大屏的设计流程、大屏整体布局和色彩一致性等展示效果。 大屏的数据集采用以文件数据集的方式关联,具有便携性,方便复现。 不足之处:操作交互性较差。 大屏总览 总结: 我国农业发展水平在全球范围内位列中上游。根据我国的实际发展情况,三大产业协调发展,以前我们强调自己的农业大国,未来我们更希望自己是农业强国,加快三大产业融合发展。 2008年我国人均粮食产量以403公斤超过联合国粮农组织规定的人均粮食400公斤的温饱线。随后2015年人均粮食产量达479公斤,为近年来最高值,目前我国人均粮食产量维持在470公斤水平。 2010年-2020年我国城镇化发展迅速,2010年城镇人口和乡村人口几乎持平,随后至2020年我国城镇化率高达63.89%;但是随之带来的农业从业人数连年递减,农业未来将面临着用工难,无人可用的境遇。同时也开始促进农业进行产业调整,大力发展数字农业、智慧农业来抵消农业劳动力不断缺失的问题。 近20年来,我国农林牧渔总产值逐年上升,种植业产值始终处于绝对优势。 标题 实现方式 报表块 展示内容 大屏主题和副标题 数据来源信息 公司logo 指标卡 实现方式 报表块 展示内容 2020年农作物播种面积 2020年农林牧渔总产值 2020年粮食作物产量 2020年粮食作物人均产量 2020年乡村人口数 2020年城镇化率 2020年农业就业率 2020年乡村就业率 地图 实现方式 世界地图 中国地图 展示内容 2019年全球农业生产指数 2020年全国农作物播种面积分布 条形图 实现方式 类别轴逆序条形图 展示内容 2020年农林牧渔产值前十省份 组合图 实现方式 折线图和对比柱形图 折线图和堆积柱形图 展示内容 七次人口普查城镇化趋势图 近12年私营和非私营单位农业工资水平对比 近20年农作物播种面积趋势图 近20年农林牧渔总产值趋势图 近20年粮食产量及人均粮食产量趋势图 柱形图 实现方式 百分比堆积柱形图 展示内容 近20年三大产业就业分布趋势图 近20年城乡就业分布趋势图 明细表 实现方式 报表块 跑马灯效果 展示内容 2020年主要农林牧渔产品产量明细表 结论 1. 2019年全球农业生产指数显示蒙古农业生产指数以140.3排于首位,中国农业生产指数104.1,位列23名。 2. 2020年全国农作物播种面积显示,黑龙江省以14910.1千公顷位列全国第一,河南省和山东省紧排其后;北京市则以98.2千公顷排于末位。 3. 2020年全国农林牧渔产值前十省份显示,山东省和河南省分别以10190.6亿元和9956.3亿元位居第一名和第二名;云南省则以5920.5亿元位于第十名。 4. 2020年农作物播种面积16487千公顷;近20年农作物播种总面积及各农作物播种面积趋势波动平稳,总体波动不明显,粮食作物始终播种面积最大。 5. 2020年农林牧渔总产值达71748.2亿元;近20年农林牧渔总产值逐年上升,农林牧渔业产值也呈现逐年上升,农业产值始终保持最高产值。 6. 2020年农产品粮食产量达66949.2万吨;2020年畜产品肉类产量达7748.4万吨;2020年水产品总产量6549.0万吨;2020年林产品木材10257万立方米。 7. 2020年粮食作物人均产量474公斤;2015年之前人均粮食产量呈现逐年上升趋势,2008年以人均粮食403公斤越过联合国粮农组织规定人均粮食400公斤的温饱线;2015年之后人均粮食产量维持在470公斤上下;结合2015年之后粮食产量也维持在66000万吨左右,我国对粮食的需求已基本满足。 8. 2020年第七次人口普查结果显示,乡村人口数达50979万人,城镇化率达63.89%;2010年及之前乡村人口始终高于城镇人口,城镇化率低于50%,2020年的人口普查结果城镇率远超50%,城镇人口远高于乡村人口。 9. 2020年第一产业(农业)就业率达23.60%,乡村就业率38.36%;近20年三大产业就业分布趋势显示,第一产业就业人数占比连年下跌,第三产业就业人数连年上升,第二产业就业人数占比波动不明显;近20年城乡就业分布趋势显示,城镇就业人数占比连年上升,乡村就业人数逐年下跌。 10. 近12年私营和非私营单位平均工资差距越来越大,2020年差距达到48839元;农林牧渔工资水平非私营单位始终高于私营单位。Digital_Agriculture.zip (3.29 M)
报表工程师标准版-序章
疫情大屏制作流程 数据库连接 数据库文件chapter0.db移到FineReport安装路径下D:\FineReport_11.0\webapps\webroot\help,为了更好的组织日后作业的数据库,新建一个coursedb目录,将chapter0.db移入此目录。 设计器菜单栏中的【服务器】【定义数据连接】,新建JDBC连接,重命名为chapter0。数据库选择SQLite;URL设置为:jdbc:sqlite://${ENV_HOME}/../help/coursedb/chapter0.db;测试连接。 预览chapter0.db中的数据信息 大屏布局设计 本次主要为了复现课程案例,则采用课程提供的设计原图FineReport_standard 数据集提取 FineReport设计器布局实现 标题板块功能实现 本功能实现分别利用了单元格插入图片、单元格边框设置、单元格合并以及文本录入等 公式编辑输入标题名称 疫情简介功能实现 单元格插入图片 单元格录入文本,“\n”换行符实现文本换行 优化布局:对字体大小、行高和列宽通过数值统一化调整 累计情况功能实现 数据集查询语句:SELECT * FROM data_area,数据集命名为中国实时数据 绘制表格,拖入对应字段 美化布局:确诊数为红色;死亡数为灰色;治愈数为绿色 疫情详情功能实现 数据集查询语句: SELECT hist_data_china.ProvinceName AS 省份, hist_data_china.CityName AS 城市, max( hist_data_china.CityConfirm ) AS 确诊数, hist_data_china.CityHeal AS 死亡数, hist_data_china.CityDead AS 治愈数, tab.date FROM ( SELECT DISTINCT ProvinceName, CityName, max( date( UpdateTime ) ) AS date FROM hist_data_china GROUP BY CityName ORDER BY date ) AS tab, hist_data_china WHERE tab.ProvinceName = hist_data_china.ProvinceName AND tab.CityName = hist_data_china.CityName AND date( hist_data_china.UpdateTime ) = tab.date GROUP BY hist_data_china.ProvinceName, hist_data_china.CityName, tab.date 绘制表格:输入表头设置下边框格式,拖拽相应字段。 隔行变色效果:添加条件属性,背景色浅蓝色,公式输入变色逻辑: // 偶数行背景变色,行号从0开始 row() % 2 = 0 跑马灯效果:由于使用的是FineReport 11.0版本,课程提供的JS代码无法运行,自行查找帮助文档获取新的JS代码: setTimeout(function() { // 隐藏报表块report0的滚动条(此报表块名为report0,根据具体情况修改) $("div").find(".frozen-north").css({ 'overflow-x':'hidden', 'overflow-y':'hidden' }); $("div").find(".frozen-center").css({ 'overflow-x':'hidden', 'overflow-y':'hidden' }); _g().getWidgetByName('report3').startMarquee() },1000); 效果展示 疫情重点区域功能实现 数据集查询语句: SELECT hist_data_china.ProvinceName AS 省份, hist_data_china.CityName AS 城市, max( hist_data_china.CityConfirm ) AS 确诊数, hist_data_china.CityHeal AS 死亡数, hist_data_china.CityDead AS 治愈数, tab.date FROM ( SELECT DISTINCT ProvinceName, CityName, date( UpdateTime ) AS date FROM hist_data_china WHERE date( UpdateTime ) != "${=today()}" ORDER BY date ) AS tab, hist_data_china WHERE tab.ProvinceName = hist_data_china.ProvinceName AND tab.CityName = hist_data_china.CityName AND hist_data_china.ProvinceName = "湖北省" AND date( hist_data_china.UpdateTime ) = tab.date GROUP BY hist_data_china.ProvinceName, hist_data_china.CityName, tab.date ORDER BY date 选择力学气泡图类型,配置数据集【省市历史数据】,分类选择城市,字段名为确诊数,汇总方式为最后一个,本表为累计数据,最后一个值为最新累计值。 系列属性根据值进行合适分组,气泡半径大小进行调整,美观布局。 谣言与辟谣功能实现 数据集查询语句: SELECT * FROM 疫情辟谣信息 绘制表格:父子格设置、边框格式设置以及字体格式设置 跑马灯效果:参考【疫情详情】的JS代码 湖北省新型冠状病毒确诊病例统计表功能实现 数据集查询语句:参考【疫情重点区域】采用的是省市历史数据 折线图数据集配置后,将分类设置为date,字段名分别设置为确诊数、死亡数、治愈数,汇总方式修改为求和 修改图例位置和系列颜色属性,分别设置为红色、灰色和绿色 背景属性绘图区的网格线选择为无 新型冠状肺炎病例分布示意图功能实现 数据集查询语句: # 疫情市实时数据 SELECT * FROM 疫情市实时数据 # 省市实时数据参考【疫情详情】数据集 钻取地图类型属性设置:GIS图层选择无,缩放等级和中心点自定义设计 数据数据,第一层选择省市实时数据集,字段名分别添加确诊数、死亡数和治愈数,汇总方式为求和;第二次选择疫情市实时数据集,字段名分别添加确诊人数、死亡人数和治愈人数,汇总方式求和 系列属性颜色为区域渐变色,分别设置合适的区间,图例显示取消。 疫情大屏最终制作效果展示
【2022BI数据分析大赛】好消息!好消息!好消息!炙手可热的二手房挑选方案,优质...
Your browser does not support video tags.   选手介绍: 个人赛选手: 时亚东,现就职于浙江养生堂天然药物研究有限公司的检测中心,日常负责实验室管理系统的运维管理和数据报表开发。目前技术能力主要涉及Java、Python、SQL、FineReport、PowerBI和FineBI 等数据分析工具。本次已经是第三次参加帆软举行的FineBI可视化大赛了,一次次的锻炼,使我在数据分析领域越来越得心应手,每次同这些志同道合的小伙伴们通过作品交流总是受益匪浅。 本次参赛项目从设计到实现全流程均由我一个人完成,由于水平有限,肯定还是有多方疏漏,请读者们见谅。 项目及数据源介绍: 自比赛启动后,我花了一周时间来选择项目主题,从kaggle、天池、知乎等各个网站搜索数据,但是这些零散的数据始终难以形成完整的分析思路,最后还是在不舍中放弃从头再来。在翻看本地数据库时,发现之前练习Python网络爬虫时,针对链家网数据进行了“扫荡”,但仅仅获取了杭州二手房的数据。于是,顺着这个思路我开始建立起本次项目的分析思路。 一直以来,在杭州都想拥有一套自己的房子,但是目前微薄收入难以支付起高昂的新房首付,我便时常关注杭州二手房的情况,挑选出一套各方面都满意的二手房便成了我的执念!杭州,这座城市一直以来的发展是全国人民有目共睹的,但是离我们常说的北上广深这样的一线大城市相比,还有一定的差距,究竟这种差距有多大呢?于是便有了获取北上广深杭这5座城市二手房的房源数据的想法,在房子特征上是否能找到些印证呢?我希望能通过本次项目的深度分析成功获取到买房最佳方案,实现多年来的梦想! 本次参赛数据源主要来源于链家网、安居客。其中安居客主要获取到北上广深杭5城的房价数据;链家网获取了北上广深杭5城的房源信息。均采用Python结合BeautifulSoup模块获取网站数据,存储至本地数据以备后面数据ETL清洗工作。 Python爬虫代码示例: 数据处理: 数据获取来了之后,为了满足自己的分析要求,针对数据进行数据清洗工作,去除不必要的字段、转换数据类型、定量数据转换为定性数据等操作。 主要分为:房价数据清洗、房源信息清洗 房源信息清洗主要针对时间进行了拆分,获取了年、月、季度字段,单价进行了数据类型转换。 房源信息清洗主要做了房源基本信息、房源满意度、核心卖点、周边配套等方面的清洗 数据清洗步骤截图: 作品介绍: 本次作品主题是关于二手房挑选方案的,主要从房价现状、二手房整体画像和房源满意度评价三个方面着手分析。 首先为本次报告起一个振聋发聩的标题,并留下作者信息 第一部分:北上广深杭五城房价现状分析(数据来源:安居客) 2022年4月五城房价对比分析:杭州市房价以21466元/平方米的单价获得五城最低房价城市,而深圳市以52873元/平方米的单价获得五城最高房价城市; 2022年4月五城房价环比对比分析:杭州市和上海市相对于3月份分别环比增长1.15%和1.78%,而深圳市、广州市和北京市相对于3月份环比均有所下降; 2022年4月五城房价同比对比分析:杭州市是唯一相较去年4月份同比下降的城市,同比降低了2.97%,其他四城均呈现同比增长趋势,其中深圳市竟同比上升了23.39%; 基于以上对2022年4月份的房价分析,杭州市可谓是买房的最佳选择城市。 接下来我们看一下,杭州市2022年全年的房价走势,除1月份相较2021年12月份环比下降1.34%以外,其他月份均有环比增长趋势;相较2021年同期,2022年所有月份的房价均同比下降,其中1月份同比下降做多,同比降低了8.66%; 结合2013年-2022年杭州市历年房价趋势,在2016年-2018年出现了大幅度上涨,当时杭州举办了2016年“G20峰会”以后其知名度打响之后,房价收到了明显的影响。2018年以后房价略有缓和,但是2022年9月杭州市将举办“亚运会”,预计房价会有新一轮的波动,但波动不会太大,因为杭州的调性相较于其他四城来说,更希望发展为适宜居住的,休闲养老的幸福感城市,具体情况让我们拭目以待吧。 第二部分:二手房整体画像(数据来源:链家网) 本次共计获取到12868条房源信息,其中上海市2849条,占比22.14%;深圳市2650条,占比20.59%;杭州市2491条,占比19.36%;广州市2441条,占比18.97%;北京市2437条,占比18.94%。 房源信息中针对户型介绍主要包括采光、阳台、方正、通风等关键词;针对核心卖点介绍主要包括满五唯一、交通便利、装修等关键词;针对周边配套主要包括医院、公园、银行、地铁等关键词。 接下来列出房源信息的明细表,点击每一条明细均可调转到对应的房源网页。 房源数随挂牌时间的变化趋势可以看出二手房购买率变化情况,可以对比出不同城市二手房销耗能力,主要受房价和贷款优惠政策影响。 基于房源数的帕累托分析:房屋户型、单价分类、建筑面积分类、总价分类、公摊面积分类、建造时间,分别明确了80%房源数的各种房源特征。 基于筛选的90%房源数的房屋户型:查看不同户型单价的分布情况、单价与建筑面积之间的四象限分析、户型总价与建筑时间的分布情况、单价与关注人数分布、建筑面积与总价之间的线性关系。 其他二手房画像特征:装修情况、配备电梯、所在楼层、房屋年限、建筑类型、房屋用途、交易权属等。 第三部分:房源整体满意度评价(数据来源:链家网) 不同城市房源整体满意度排名:杭州市房源整体满意度排名第二,为0.34,仅次于广州市的0.39;北京市房源整体满意度排名最低,为0.22。 不同单价类型房源整体满意度排名:5000-10000元/平方米和10000-15000元/平方米分别以0.60和0.56的整体满意度位居前两名;45000元/平方米以上的整体满意度为0.20,位居最后一名。 不同总价分类房源整体满意度排名:50万以下和50-100万的总价范围以0.56和0.53的整体满意度占据前两名;450万以上的整体满意度为0.19,位居最后一名。 不同建造时间房源整体满意度排名:未知年份的房源整体满意度位列第一,分数为0.34,可以通过明细表具体查看相关房源信息;2010-2015年和2015-2020年同时以0.31并列第二名;而1970-1980年和1960-1970年则以0.21并列最后一名。 不同房屋户型房源整体满意度前十名:3室1厅0厨0卫和3室1厅1厨0卫的房源整体满意以0.57和0.55位居前两名。 不同建筑面积房源整体满意度排名:建筑面积50平米以下和90-100平方米位居前两名,整体满意度分别为0.33和0.31;130平方米以上的整体满意度为0.25,位居最后一名; 不同公摊面积房源整体满意度排名:公摊面积5平方米以下和5-10平方米的整体满意度均为0.35,并列位于第一名;40-45平米以上的整体满意度为0.22,位居最后一名; 户型满意度、配套满意度、建筑满意度与房价满意度四象限分析:气泡大小为整体满意度,气泡颜色为房屋户型,我们可以通过选择分布在第一象限的房源,房价满意度、户型满意度、建筑满意度以及配套满意度最高的房屋户型,通过单价可以查看具体户型的明细信息。 结论与建议 基于以上分析结果,我们发现杭州市目前房价最低,2022年全年房价趋势以及杭州市历年来房价趋势来看,在杭州市选择一套合适的二手房是最佳的。但是2022年9月举办的“亚运会”对房价会有轻微的影响,加上近几年政府对房地产的干预,贷款利率的调整,整体上应该处于稳定波动。 基于杭州市获取的2491条二手房房源信息来看,2021年下半年挂牌时间的几乎每个月房源数都还有100多套二手房未被交易,2022年03月新增挂牌房源664套。 从对杭州市房源信息的分析来看,80%房源数的房屋户型主要有3室2厅1厨2卫、2室1厅1厨1卫、3室2厅1厨1卫/4室2厅1厨2卫、2室2厅1厨1卫以及 3室1厅1厨1卫,对于我来说,这些房源都是相当不错的选择,适合90后小夫妻安逸生活。 从对杭州市房源信息的分析来看,80%房源数的总价分类范围在450万以上、200-250万、150-200万、250-300万、300-350万,对于我的预期总价250万以内的需求来说,有相当一部分房源储备量。 从对杭州市房源信息的分析来看,80%房源数的建筑面积分类范围在80-90平方米、130平方米、50平方米以下、120-130平方米以及50-60平方米,对于我个人需求来讲,建筑面积在90平以上的房源储备也是相当多了。 从对房源整体满意度的分析来看,杭州市房源整体满意度为0.34,排名第二,仅此于广州市的0.39。 从个人需求来说,预期选购建筑面积在90平方米以上的二手房,所以这里需要对建筑面积优先过滤,杭州市的建筑面积分类在90-100平方米的二手房整体满意度最高的房屋户型为2室1厅1厨1卫,单价分类的整体满意度最高的范围是5000-10000元/平方米和10000-15000元/平方米均可,总价分类的整体满意度最高的范围是50万-100万和100-150万也在预期之内,公摊面积在5平方米以下和15-20平方米也是可以接受的。 经过层层筛选,终于定位到一套优等房源,位于杭州市钱塘区,标题为“房子是经典的跃层loft户型视野好精装修 业主诚心出售”,可以通过明细表跳转至详情页面查看。房价满意度0.78,户型满意度0.3,建筑满意度0.2,配套满意度0.76,房源整体满意度为0.62。但是本身还是希望入手一套普通住宅,可以再退而求其次,选择心仪的房源。 建议:这里在计算整体满意度时,针对房价满意度、户型满意度、配套满意度和建筑满意度分别按 5 : 2 : 2 : 1 的方式进行加权计算,可以根据大家的个人需求进行比例调整,获取自己心仪的二手房房源信息。 参赛总结: 通过本次项目又一次锻炼了自己的数据分析能力,虽然成长之路还有很长,但每取得一点进步都让人获取巨大的幸福感,就像之前FineBI课程的老师所说——莫问前程,勇往直前。在数据分析领域的大神们一直都在强调“培养用数据讲故事的能力”,我想在这句话中有两层意思,一是整个数据分析报告中要具有逻辑性,二是一定要让数据分析报告有足够的吸引力,而吸引力最重要是能够解决大家的困扰。当我们遇到问题了,可以尝试用数据分析的思维方式去思考一下,找数据,做分类,正如我这个项目一样,就是为了解决困扰我如何选择合适的二手房的问题。 再次感谢帆软团队组织的可视化大赛,让我能有机会和大家在这个比赛中,通过作品彼此学习,共同成长。
FineReport设计器(10.0或11.0)画面出现撕裂现象解决方案
现象描述:FineReport设计器界面出现画面撕裂 打开设计器添加一个决策报表后   鼠标所到之处皆为撕裂画面,无法正常使用   电脑配置信息:这个问题和电脑显卡及配置有关系 电脑显卡信息: 本人电脑为Dell G系列游戏本,AMD显卡,出现画面撕裂主要原因和AMD显卡有关,因为目前在其他非AMD显卡电脑上使用均未产生画面撕裂现象。如果其他人遇到这类现象可以参考以下解决方案。   解决方案:FineReport配置文件修改 1. 进入设计器安装路径的bin目录:D:\FineReport_11.0\bin 2. 修改文件designer.vmoptions信息:-Dsun.java2d.d3d=false 这段设置的意思是:关闭JAVA 3D功能(Direct3D,有时候Direct3D功能可能导致JVM Crashed,默认是打开(true),属于Java Swing 2D系统属性参数。 若想了解其他Swing 2D系统参数可参考:Java Swing 2D系统属性参数详解 3. 重启设计器即可解决画面撕裂问题 编辑于 2021-10-14 22:44
FineBI标准版学习心得
学习初衷:数据分析师技能提升   毕业前为了找到一份合适的工作,通过多方信息对数据分析行业有了初步的了解。开始学习Python、MySQL等技能,参加大数据分析课程的培训,在培训课程中接触到了帆软的第一个产品FineReport,通过对FineReport的学习,体会到了帆软产品的快捷性和便利性。随后通过帆软官网看到了更多的产品,均可安装试用,FineBI便是其中之一,从FineBI v5.0到现在FineBI v5.1一年来每个版本都有使用过,一步步跟着FineBI成长着。后来参加了两次“FineBI可视化挑战赛”获得了一些奖励,才有机会接触到FineBI标准版课程,对它的功能有了更加全面的了解。 学习经历:   在课程学习的过程中,前期的基础操作训练,由于本身自己接触FineBI的时间比较久,很多操作比较熟练,任务量不算高,能够较轻松的完成。后面2周的学习开始制作大屏和数据可视化故事,每个作业都相当于一次挑战赛作品,开始了熬夜赶作业的生活。每次看到自己的作业被老师点评的时候,分值都不算低,内心总是满满的获得感,付出总是会有收获的。   每次熬夜赶作业的时候,刷新作业提交界面,发现这是的作业批改老师也刚刚打出之前的作业分数,心想老师们也是在熬夜改作业,每份作业的细节都把握的死死的,心头涌上一份感动,谢谢Suri班主任、Lynn老师、助教老师们的辛苦和陪伴,祝福我们大家都有一个美好的前程和未来。 学习成果:   通过FineBI的学习,最大的收获是数据分析思维的训练,数据可视化故事的讲述原则以及数据可视化大屏布局和配色原则。这是之前自学FineBI的时候所缺乏的技能,在课程中都得到了补全。目前自己可以搭建起来炫酷的数据可视化大屏/驾驶舱,可以独立讲述数据背后的数据故事。同时,利用FineBI已经开始着手分析工作中的数据,向同事介绍更深刻的数据结论,以及FineBI的优势。以下展示一个在学习过程中的案例——福布斯富豪榜可视化分析    小结   通过这次学习,自己在数据分析的道路又添一把利器,希望日后能在工作更好的发挥FineBI的功能。最后再次感谢老师们的辛苦付出,学习不易,教学更难!用老师鼓励的话来说:“莫问前程,勇往直前!”     编辑于 2021-9-28 09:59
【2021夏季挑战赛】新冠肺炎疫情实时动态分析
一、选手简介   1. 选手介绍   团队名称:干饭魂队   队长:时亚东,在杭州某公司检测中心工作,日常处理一些公司内部产品检测数据,擅长帆软报表开发,利用Python及MySQL等进行数据分析;   成员介绍: 王小涂:零售行业数据产品经理,擅长针对业务数据应用难题,提供解决方案,并以项目制的落地执行。 Harry:某互联网公司企业智能部门-BI工程师,主要参与大数据环境下的数据仓库以及相关ETL工具建设、开发及维护 杜光华:曾就职某大数据bi团队,擅长数据处理,指标搭建,可视化等 邓子琦:兰州,学生,专业社会学,有bi开发经验,打算9月份去找工作,目标数据分析岗,现有bi开发经验,web全栈开发经验(Python flask),爬虫开发经验(Python scrapy)   2. 参赛初衷 希望和不同行业的数据工作者加强交流,碰撞出更多的数字化解决方案思路。 希望通过实践掌握更多的BI分析工具,为自身产品的设计提供更多的思路。 培养数据分析思维,站在不同的角色角度去思考业务问题,了解更多的数据分析思路。 和更多FineBI大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞   3. 目标 对疫情数据进行简单的统计。 设计可视化数字大屏展示新冠疫情的时空变化情况。 使用可视化工具绘制城市疫情风险图。 对国内和国际的疫情变化情况进行分析。 二、场景介绍   1. 业务背景介绍&数据来源   业务背景: 疫情的发展动向,牵动着每一个人的心,及时且准确的知晓世界各地的疫情防控情况,了解境外输入的风险,以及本国风险地区防疫进度,对每个人都显得尤为重要。了解疫情的渠道不少,但是能全盘看整体情况并针对性了解重点信息的渠道却不多,我们希望通过帆软BI制作疫情动态分析看板,帮助大家及时并快捷知晓疫情动态发展情况。   数据来源: ·https://news.sina.cn/zt_d/yiqing0121 ·https://news.qq.com/zt2020/page/feiyan.htm#/   利用网络爬虫技术实时转存数据至MongoDB数据库,然后将数据整理成关系型数据转存至云服务器的MySQL数据库,在数据获取阶段,本队邓子琦花费了大量精力和时间,在自己忙碌毕业事项的同时,仍未耽误项目进度。并提供了自己的云服务器,实现了数据的实时更新和获取,起到了重要的作用。 2. 分析思路145514 3. 数据整理 中国最新疫情 各国疫苗接种明细 中国疫苗接种明细 疫苗厂家分布 境外国家最新数据 -累计确诊降序top10 获取所有国家每日最新数据 境外输入源 遭受境外输入省份top10 境外输入源top10 各省每日境外输入数据 境外国家最新数据_日-累计确诊降序top10 印度-每月最后一天历史数据 全国各省每日最新数据汇总 广东各市每日最新数据汇总   4. 完成分析报告   通过KPI指标卡制作国内和全球累计数据,集中表达了疫情的现状;通过地图展示了全球和国内的累计确诊人数的分布情况;同时,基于相关数据针对疫情严重区域印度和广东进行了重点分析;同时获取了累计确诊人数前十位的国家数据; 利用词云图分析了国内疫情境外输入情况,主要来源国家有美国、英国等,进入的城市主要集中在北上广以及福建等发展较好的省份及沿海省份,对外交流频繁; 同时本项目关注疫情期间疫苗的接种情况,分别展示了全球疫苗接种的变化趋势、国内近日以来的疫苗接种变化趋势以及全球各大疫苗厂家的市场占比情况。   (1)疫情累计数据展示 145515   (2)国内疫情地图 145516   (3)全球疫情地图 145518   (4)重点国家——印度疫情变化趋势分析 145519   (5)重点城市——广东各市疫情情况 145520   (6)全球疫情累计确诊人数前十名国家分布 145521   (7)境外输入主要国家来源 145522   (8)各省市境外输入情况 145523   (9)全球累计疫苗接种趋势分析 145524   (10)国内累计疫苗接种情况 145525   (11)疫苗生产厂商占比分析 145526   分析结论:   全球疫情确诊人数仍呈上升趋势,截止目前累计确认1.8亿以上,累计死亡390万人以上,现有确诊2697万人,从各国来看,新增确诊病例以印度和巴西较为严重,各国防疫战役仍不可掉以轻心;从国内来看,截止目前累计确诊人数达到11万人,现存确诊将近5000人,整体呈下降趋势,但是境外输入仍呈上升趋势,境外输入仍需要严格做好防控。国内各省份来看,台湾地区最为严重,现有确诊病例达到4000以上,每日确诊人数呈上升趋势;其次福建、香港、广东地区每日仍有新增确诊人数。截止目前,国内新冠疫苗累计接种达到11.7亿剂,每百人接种人数达到80以上,国民接种疫苗意识高涨,疫情防控措施深入人心。   5.总结   本次参赛是采用团队合作方式,队长体验出了强大的规划和组织能力,及时组织队员沟通交流,并做好计划及人员分工安排,各组员也都积极配合工作安排,在规定的时间内完成各自分工的同时,也会主动帮助其他组员,相互答疑解惑。在这个过程中,团队成员不仅在BI工具的使用上掌握了更多的方法和技巧,更在数据分析的思路上有了更多的认知,思路上有了很大的拓展,对于我们日后的学习和工作也有很大帮助。 145530疫情实时动态分析.pdf (1.17 M)
【2020冬季挑战赛】某公司员工流失情况分析
1.选手简介 1.1.选手介绍 帆软社区用户名:时亚东 职业简介:现就职于浙江养生堂天然药物研究所有限公司,在检测中心任职数据分析助理工程师岗位,日常负责检验人员工作量统计、检测中心业务量统计和数据库管理等工作。 1.2.参赛初衷 希望通过实践提升分析工具技能; 培养数据分析思维 了解并掌握FineBI的应用 和更多FineBI大神交流学习,进行数据可视化作品以及分析思维的激烈碰撞 2.场景介绍 2.1.业务背景介绍&数据来源 业务背景:人员流失问题类型有很多,目前在学习数据分析过程中经常遇到的几种人员流失问题主要包括:电信客户流失预测案例、淘宝用户行为分析、信用卡逾期用户预测以及员工流失分析预测案例等。造成员工流失的原因有很多,分析起来也很复杂,对于管理者来说需要针对员工的相关属性进行准确的预测,采取相应的对策应对。因此本次选择以IBM员工流失案例的数据针对此类问题提供一定的研究思路和预测方法。 数据来源:个人获取的数据-https://www.datafountain.cn/datasets/12 2.2.分析思路 139600 2.3.数据整理 所选数据相对整齐,无缺失值和异常值存在,所以之间导入了FineBI中建立了自选数据集,把对应的字段进行分类进行使用。 2.4.完成分析报告 2.4.1.配色选择:色彩柔和、层次分明 2.4.2.图表选择:想要表达的关系多以分类汇总、占比分析为主,因此选择柱形图和饼图居多;当然为了增加报告元素的多元化,也选择了树图、圆环图、条形图、散点图以及气泡图进行相关内容的表达。 2.4.3.分析结论: 员工流失原因多种多样,为了清晰地分析某公司员工流失的原因,本次分析将流失原因分为三类:员工画像、公司画像、工作和薪资情况分析。点击流失比例中Yes的比例便可查看流失员工各项原因分布情况。流失员工中男性占63%;本科以下学历占70%以上;单身员工占一半左右;25-35岁员工占50%左右;10年以下工作经验的员工占67%;生命科学和医药学专业的员工占65%;离家距离10km以内的员工占56%;入职年限10年以内的员工约占83%;流失员工中科研人员占56%;股票期权水平为的0的员工占65%;不经常出差的员工占66%;实验室技术员占26%,且销售主管占24%,研究员占20%;生活和工作平衡程度为3的员工更易流失占54%;经常加班的员工占54%;工作级别为1的员工占60%;3年内晋升的员工占78%;在当前职位工作时间在2年以内的新员工更易流失;更换工作次数在2次以内的员工占51%。 完整报告请参见pdf附件 139627 2.5.总结 平时工作之余的时间太少,针对本次比赛共花了半个月的时间准备,但实际制作作品时间仅有两个晚上,针对员工流失分析的层次感还是觉得不够明确,对数据的整理方面仍有欠缺。但虽然时间紧张在使用FineBI的过程仍能感受到它带来的便捷和高效,通过自己的快速学习和不断实战练习,能够早点成长为一名合格的数据分析师,当然也会将这款高效的软件向身边的同事进行推广和介绍,让更多人了解FineBI。 140378
个人成就
内容被浏览59,774
加入社区4年175天
返回顶部