数据分析的-五种常用方法实例

2023-09-21 16:51:54

一、对照

    俗称对比,单独看一个数据是不会有感觉的,必需跟另一个数据做对比才会有感觉。比如下面的图a和图b。

图a毫无感觉

图b经过跟昨天的成交量对比,就会发现,今天跟昨天实则差了一大截。

这是最基本的思路,也是最重要的思路。在现实中的应用非常广,比如选产品丶监控增量等,这些过程就是在做【对照】,决策BOSS们拿到数据后,如果数据是独立的,无法进行对比的话,就无法判断,等于无法从数据中读取有用的信息。

拆分

   分析这个词从字面上来理解,就是拆分和解析,拆分不等于分析,分析包含拆分,拆分能帮助我们找出原因(这简直是终极意义

回到第一个思维“对比”上面来,当某个维度可以对比的时候,我们选择对比。再对比后发现问题需要找出原因的时候?或者根本就没有得对比。这个时候,拆分了。

例如:

运营组XX童鞋,经过对比成交数据,发现今天的销售额只有昨天的50%,这个时候,我们再怎么对比销售额这个维度,已经没有意义了。这时需要对销售额这个维度做分解,拆分指标。

销售额=成交用户数*客单价,成交用户数又等于访客数*转化率。

如图c和图d:

图c是一个指标公式的拆解

图b是对流量的组成成分做的简单分解(还可以分很细很全)

分拆后的结果,相对于拆分前会清晰许多,便于分析,找细节。可见,拆分是分析人员必备的思维之一。

降维

    当面对一大堆维度的数据却促手无策时,当数据维度太多的时候,我们不可能每个维度都拿来分析,有一些有关联的指标,是可以从中筛选出代表的维度即可。如下表:

这么多的维度,不必每个都分析。我们知道成交用户数/意向客户数=转化率,当存在这种维度,是可以通过其他两个维度通过计算转化出来的时候,我们就可以降维

成交用户数、访客数和转化率,只要三选二即可。另外,成交用户数*客单价=销售额,这三个也可以三择二。

我们一般只关心对我们有用的数据,当有某些维度的数据跟我们的分析无关时,我们就可以筛选掉,达到降维的目的。

增维

增维和降维是对应的,有降必有增。当我们当前的维度不能很好地解释我们的问题时,我们就需要对数据做一个运算,增加多一个指标。请看下图。

们发现一个搜索指数和一个类目数,这两个指标一个代表需求,一个代表竞争,有很多人把搜索指数/类目数=倍数,用倍数来代表一个词的竞争度。这种做法,就是在增维。增加的维度有一种叫法称之为辅助列

增维和降维是必需对数据的意义有充分的了解后,为了方便我们进行分析,有目的的对数据进行转换运算。

假说

   当我们拿不准未来的时候,或者说是迷茫的时候。我们可以应用假说,假说是统计学的专业名词吧,俗称假设。当我们不知道结果,或者有几种选择的时候,那么我们就召唤假说,我们先假设有了结果,然后运用逆向思维。

从结果到原因,要有怎么样的因,才能产生这种结果。这有点寻根的味道。(好比你分析和女朋友的最终的目的)那么,我们可以知道,现在满足了多少因,还需要多少因。如果是多选的情况下,我们就可以通过这种方法来找到最佳路径决策(应对方法)

当然,假说的威力不仅仅如此。假说可是一匹天马(行空),除了结果可以假设,过程也是可以被假设的。

我们回到数据分析的目的,我们就会知道只有明确了问题和需求,我们才能选择分析的方法。

三大数据类型:这个属于偷换概念,其实就是时间序列的细分,不是真正意义上的数据类型,但这个却是在处理销售数据时经常会碰到的事情。数据放在坐标轴上面分过去丶现在和未来

第一大数据类型 过去

过去的数据指历史数据,已经发生过的数据。

作用:用于总结丶对照和提炼知识

如:历史店铺运营数据,退款数据,订单数据

第二大数据类型 现在

【现在】的概念比较模糊,当天,当月,今年这些都可以是现在的数据,看我们的时间单位而定。如果我们是以天作为单位,那么,今天的数据,就是现在的数据。现在的数据和过去的数据做比较,才可以知道现在自己是在哪个位置,单有现在的数据,是没什么用处的。

作用:用于了解现况,发现问题

如:当天的店铺数据

第三大数据类型 未来

未来 的数据指未发生的数据,通过预测得到。比如我们做得规划,预算等,这些就是在时间点上还没有到,但是却已经有了数据。这个数据是作为参考的数据,预测没有100%,总是有点儿出入的。

作用:用于预测

如:店铺规划,销售计划

三种数据是单向流动的,未来终究会变成现在,直到变成过去。

例如:把数据往坐标轴上面放,按时间段一划分,每个数据的作用就非常清晰。

更多推荐

ElasticSearch从入门到精通(一)

1.初识ElasticSearch传统数据库查询的问题:如果使用模糊查询,左边有通配符,不会走索引,全表扫描,效率比较慢倒排索引将文档进行分词,形成词条和id的对应关系即为反向索引。以唐诗为例,所处包含“前”的诗句正向索引:由《静夜思》-->窗前明月光--->“前”字反向索引:“前”字-->窗前明月光-->《静夜思》反

git 常用命令总结

gitinit:初始化一个Git仓库。例:在项目目录下打开终端,输入gitinit即可将该目录初始化为Git仓库。gitadd:将文件添加到暂存区。例:将新添加的文件a.txt添加到暂存区,命令为gitadda.txt。gitcommit:将暂存区的文件提交到本地仓库。例:将暂存区的文件提交到本地仓库,并添加提交注释,

C语言文件的相关操作

C语言中文件的相关操作文件的打开使用文件的打开函数需要引入这个头文件:#include<fcntl.h>open函数intopen(charconst*pathname,intflags,mode_tmode)功能:打开已有的文件或者创建新文件参数pathname:文件路径名,可以是相对路径或绝对路径flags:打开文

[MIT6.824] Spring2021 Lab 2: Raft

0x1ReadingPaperRaft协议感觉目标很简单:保证分布式系统的一致性和可用性,在阅读时,我联想到之前看的ARIES论文,感觉思维有很多共通之处,比如如何通过非易失性存储来保证持久性。但是ARIES中是单个机器崩溃导致内存内容丢失,通过硬盘上的LOGs来重做数据库,并且ABORT掉未提交的记录并写入CLR。R

uni-app实现web-view图片长按下载

<template><view><web-view:webview-styles="webviewStyles":src="webUrl"></web-view></view></template>uniapp的web-view中图片无法长按保存,IOS下是正常的,但是Android下长按无反应解决方案:下载mui.m

什么是C语言中的命名空间?

C语言本身并没有像某些其他编程语言(如C++)中的显式命名空间(namespace)的概念,但C语言中有一些机制和约定,允许开发人员组织和管理变量、函数和其他标识符的名称,以避免名称冲突和提高代码可维护性。本文将介绍C语言中的命名空间概念,包括作用域、静态变量、文件作用域、函数作用域以及如何避免名称冲突。作用域(Sco

会C++还需要再去学Python吗?

提到的C++、数据结构与算法、操作系统、计算机网络和数据库技术等确实是计算机科学中非常重要的基础知识领域,对于软件开发和计算机工程师来说,它们是必备的核心知识。掌握这些知识对于开发高性能、可靠和安全的应用程序非常重要。Python作为一种脚本语言,在某些场景下确实可以作为加分项或辅助工具使用。它具有易学易用的特点,并且

【C++】泛型算法(六)Map和Set的使用

Mapmap<key,value>key起到索引的作用。//常见使用:字数统计程序#include<map>#include<string>map<string,int>words;//string是key,int是valuestringtword;while(cin>>tword){words[tword]++;//

解释器风格架构C# 代码

/*解释器风格架构是一种基于组件的设计架构,它将应用程序分解为一系列组件,每个组件负责处理特定的任务。这种架构有助于提高代码的可维护性和可扩展性。以下是如何使用C#实现解释器风格架构的步骤:定义组件:首先,定义一个组件接口,这将是所有组件需要遵循的规范。这包括组件的基本操作,如添加、删除、查询等。*/voidMain(

c#设计模式-结构型模式 之适配器模式

🚀介绍将一个类的接口转换成客户希望的另外一个接口,使得原本由于接口不兼容而不能一起工作的那些类能一起工作。适配器模式分为类适配器模式和对象适配器模式,前者类之间的耦合度比后者高,且要求程序员了解现有组件库中的相关组件的内部结构,所以应用相对较少些。适配器模式(Adapter)包含以下主要角色:目标(Target)接口

算力和LAXCUS分布式操作系统

有用户问LAXCUS分布式操作系统和算力的关系,今天借这个话题讲讲二者的关联。算力是指计算机系统在单位时间内所能完成的计算任务数量。随着计算机技术的发展,尤其是大数据、云计算、人工智能等新技术、新应用业务的出现,算力已经成为了衡量计算系统和产业业态的重要指标。在传统的集中式计算模式下,算力的提升主要依赖于硬件设备的升级

热文推荐