有过数据分析工作经历的跨境电商运营者都知道,采集到的第一手数据一般都是无法直接进行分析的,这时候就需要对数据进行“清洗”。
运营在分析不同国家或地区站点数据时,由于不同的站点采用了不同的时间格式与标准,所以需要提前进行时间格式的转换处理。
另外,如果想要筛选中国时间12月的整体销售情况,由于时差的缘故,报告中下载的美区下午1点与德国下午1点并不是同一个时间点,需要算入时差,才能计算规范且正确的时间段。
所以作为运营者,我们必须将所有数据表达的时间统一化,才能保证后续分析的准确。
今天小九给大家介绍几个时间格式统一化的分析小技巧。
时间格式处理:字段类型转换
类似像 “2023-01-13T21:44:15+00:00” 这样比较规范的字段,在上传到数跨境BI分析的时候,无法直接识别为日期字段,这时候我们可以用【字段类型转换】功能,仅需一步,便可将其转换成标准的、可供进一步分析的时间格式,使用Excel则需要复杂的公式嵌套计算。
复杂时间格式处理:公式组合
由于亚马逊后台报告根据站点不同,会出现各种类型不一的时间格式,如“Feb 1.2023 12:37:23 AM PST”,这种时间格式是难以处理的,对汇总数据进行统一分析造成了障碍,这类数据也无法直接由文本转换为日期。
数跨境BI提供了多种公式函数,通过组合使用,可以对各种类型复杂的时间格式进行处理。
我们需要先处理掉字段后的AM和PST等内容,再通过Todate函数转化为日期字段。
Todate 函数教程 https://help.fanruan.com/shukuajing/doc-view-394.html
下图即为组合使用todate、substitute和right函数将“Feb 1.2023 12:37:23 AM PST”日期处理为“2023-02-01 12:37:23”
时差调配:Hourdelta公式
不同地区对于时间的制式也不同,有些地方采用12小时制,使用AM和PM来区分上下午,有些则采用24小时制。再上一步进行日期字段格式处理后,我们还发现美区时间需要区分AM和PM,同时还包含了PST和PDT。
这时候我们可以组合使用Hourdelta和条件赋值:
- HOURDELTA(date, deltahours)
- date是处理好的时间字段
- delatehours是所需要加减的小时数
- 当原字段包含PM时,为下午,我们需要给处理好的日期字段新增12小时
世界上有24个时区,每个时区相对于世界标准时间(UTC)有不同的偏移量。有些国家会使用夏令时制度,在特定时间将时间调快1小时,进一步加剧了时间处理的复杂性。所以在日期清理好之后,需要考虑到不同时区的差异标准,来规范所有站点的时间标准。
一般来说,运营需要先把各个站点的数据合并,然后将时间可以先统一转换成UTC时间,做统一规范,方便后续调配。最后按需求转换成北京时间,之后筛选销量、支出等信息的时候按北京时间为基准。同样可以使用Hourdelta公式与条件赋值,当原字段包含时区代码时,算入时间与0时区的差异。
时间格式处理是每一个跨境电商运营必备的技能,通过数跨境BI不同函数组合,字段转化等功能,即可将所有数据表达的时间统一化,确保后续分析的准确性。
数跨境BI作为一款BI工具,所有的分析步骤均可一键复用,搭建好一次的字段清理流程,后续只需要替换来源表即可自动更新,方便快捷。
|