数分面试题-业务题1

目录

      • 1、如何理解数据分析,流程
      • 2、数据分析的价值
      • 3.0、指标的异常波动异常如何分析?(例如日活下跌)
      • 3.1、销售额下降了如何分析
      • 4、注册类指标和活跃类指标,看哪个?
      • 5、Python计算圆周率
      • 6.0、估算星巴克的销售额
      • 7、对指标的理解,有哪些组成部分?
      • 8、指标与维度的区别和联系
      • 9、北极星指标?虚荣指标?
      • 10、什么是指标体系?如何建立?业务应用场景?
      • 11、什么是a/btest?核心原理与应用场景
      • 12、A/Btest如何合理分流?
      • 13、如何验证A/Btest结果
      • 14、什么是漏斗分析?
      • 15、什么是EDA(exporatory data analysis)?
      • 16、使用ABtest评估算法效果
      • 17、如何评估一场活动的效果
      • 18,同比?环比?

1、如何理解数据分析,流程

数据分析:基于业务,发现业务中的问题或潜在增长点,形成分析思路,并利用数据分析工具进行分析,给出结论和解决方案,并协调推进方案落地
流程:

  1. 观察现状
  2. 留意变化
  3. 多维、交叉分析
  4. 预测趋势
  5. 生成策略
  6. 推动落地
  7. 复盘效果

2、数据分析的价值

数据分析不仅是要给出一个明确数字,还要给出背后的原因,数字大小正负说明业务是好是坏,好的方面是否可以复用拓展,坏的地方原因是什么?应对方案是什么?要把方案落地到业务中去,并进行跟进与复盘。

通过洞察数据背后的业务价值,进而提出有指导性的建议,帮助业务发展

3.0、指标的异常波动异常如何分析?(例如日活下跌)

  1. 确定数据来源是否可靠
  2. 确定数据的计算口径是否一致
  3. 确定是否是市场的整体趋势
  4. 描述性分析:下降了多少
  5. 观察变化:同比下降了多少,环比下降了多少
  6. 评估变化/方差分析:跌幅是否在合理范围内?
  7. 交叉分析/相关性分析:对指标进行拆解,有哪些指标可能与日活下跌有关,有关程度是多少
  8. 业务分析:这些指标的运营部门,是否有某些运营策略或者活动造成了指标变化,间接导致了日活下跌
  9. 回归分析/预测:还会跌几天,跌幅最坏到什么程度
  10. 风险/损失评估:日活下跌对产品的核心KPI有什么影响
  11. 制定策略:如何挽回损失、下次如何避免

3.1、销售额下降了如何分析

1,需求:发现,某店铺20年11月的销售额同比去年11月下降了60%,如何分析?
2,解题思路:

  1. 先确认数据来源是否可靠,确认问题是否真的存在
  2. 如果数据来源可靠,指标口径一致,再看外部市场环境,是否是整体市场大盘在下降,受到大盘的影响
  3. 如果不是外部因素,就要检查内部问题,对指标进行拆解
    销售额 = 访客数 ×下单率 ×客单价 - 退货金额
    访客数 = 新客户+老客户,新客户 = 渠道的流量 ×转化率
    下单率 = 页面访问量 ×转化率
    订单取消率 = 订单取消数/订单总数
  4. 针对指标的变化给出建议,定位到具体原因后,针对性的给出改进策略方案,如开展促销活动、商品

4、注册类指标和活跃类指标,看哪个?

不同时期关注的指标不同,应该区别对待
产品初期:关注产品的快速成长,重点关注注册类指标
产品成熟期:关注用户的使用粘性、深度等,重点关注留存和活跃类指标

5、Python计算圆周率

蒙特卡洛法:边长为1的正方形与其内切圆的面积之比为4/pi,随机生成在0-1内的x,y,落在圆内的个数M除以总个数N等于面积之比。即M/N = pi/4,反解可得圆周率

6.0、估算星巴克的销售额

需求:某CBD下一个星巴克门店,面积40平方米,估算每周的营业额。

经典的费米估算问题。费米思想的步骤:

  1. 把问题拆解,直到拆解到不能拆解需要估算的基本问题
  2. 对基本问题的估算,不要估算其本身,而是先估算其上下界,然后在上下界的范围内估算出数值。
    营业额 = 消费人数×平均消费金额(区分工作日与周末)
    消费人数 = 营业时间×单位时间消费人数(区分高峰时段+低峰时段)

二八原则拆分:星巴克以饮品为主,饮品主要以咖啡为主
1、从需求端估算:
饮品销量:每天多少人喝咖啡,CBD一共多少人,喝咖啡的比例,每人每天喝几杯
非饮品
2、从供给端估算:
工作日供给:忙时供给(忙时每小时多少杯,一天多少时间忙)、闲时供给(闲时每小时多少杯,一天多少时间闲)
周末供给:

估算:
每天按照12h营业时间计算,高客流量4h,低客流量8h
工作日流量大的时候,每三分钟接待一人次,人均消费30元
一个店40平米,50%比例算,20平米可以站下10个人,工作日高峰时段每小时消费人数 = 1h/3min×10=200个,非高峰估算60个
工作日一天的营业额 = 4h×200个×30元+8h×60个×30元 = 38400
休息日 = 工作日营业额/4
所以,一周的营业额 = 38400×5 +38400/4×2

7、对指标的理解,有哪些组成部分?

指标:有业务含义的,体现业务变化的,复杂的,有特定业务场景的
指标口径:指标的定义
指标通常与维度一起联合分析,从不同的维度看同一个指标可能会有差异和业务上的发现
同一个指标可能会被应用于不同的业务,需要保证指标口径的一致,避免造成指标的歧义

8、指标与维度的区别和联系

指标:用于定量评估业务好坏程度而建立的
维度:描述指标的角度,可以理解为,看问题的方面
维度不能独立存在,一般都是搭配着指标一起分析,可以分析不同维度下的同一指标,也可以分析同一维度下的不同指标

9、北极星指标?虚荣指标?

北极星指标:被称为第一关键性指标,是指业务当前阶段最为关注的一个指标,引导当前业务的发展,通常是一个汇总指标,可以通过拆解为各个子指标,便于整体指标的实现与分析

虚荣指标:例如累计用户数、累计销量、累计销售额等。都是只涨不跌的虚荣指标

10、什么是指标体系?如何建立?业务应用场景?

指标体系:不是指一个指标,也不是指多个不相关的指标。一个指标体系是多个相关的指标有机结合起来,具有严格的逻辑和分层体系

建议方法:根据业务特定和生命周期选择第一关键指标或者北极星指标
贴合业务需求将第一关键指标进行逐层拆解,按流程拆、按时间区域拆、按公式加减乘除拆
从上至下:从顶层战略或从KPI拆解
从下至上:叶子指标向上汇总成整体指标

应用场景:
监控关键指标变化趋势,判断业务走势
逐层拆解,定位业务异常原因
通过数据驱动业务

11、什么是a/btest?核心原理与应用场景

定义:基于小样本的后验方法,通过设置对照组和实验组,对变量进行试验,通过假设检验对不同组进行检验,以检验变量是否对结果造成显著影响,从而选取最合理的办法。

核心原理:通过随机合理分流,设置对照组和实验组,通过控制变量法,在保证两组用户除待验证变量不同外,其他变量一致。分别对两组施加不同的变量,观察两组用户在一段时间内的表现,通过假设检验分析结果是否有显著差异,从而判断改动是否有效可执行

应用场景:产品功能、算法策略迭代

12、A/Btest如何合理分流?

用户分流一定要随机均匀,保证各组的用户分布一致,有分桶和分层两种方式。
分桶:直接将用户切割成几桶,用户只能在一个桶里,但缺陷是,如果要同时上线多个实验,流量不够切怎么办?
分层:将业务逻辑互斥的环节分为多层,每一层都共享同一批用户,在每一层将用户随机后,使之处于不同的桶。到下一层后,对同一批用户再次随机分为几个桶。也就是说,一个用户会处于多层的多个实验中,只要多层之间互不影响,保证了每个实验都能全流量切割的同时,也保证了实验数据是置信的

13、如何验证A/Btest结果

假设检验:一般情况下,绝对值指标用T检验,相对值指标用z检验

14、什么是漏斗分析?

通过拆分业务流程,形成关键漏斗,分析漏斗各环节的转化率/跳出率,定位问题发生的环节。
漏斗分析的最核心的步骤:分解流程,评估转化率,定位问题
常见漏斗:

  • 电商漏斗:首页-详情页-购物车-支付
  • 用户的生命周期AARRR
  • 用户的行为周期AIDMA

漏斗的环节不易过多,一般不超过5个
以上一环节为基准,计算相邻两个环节的转化率
1-转化率即流失率,但并不代表转化率最低的环节就是问题环节

15、什么是EDA(exporatory data analysis)?

数据探索性分析,需要对数据集中的变量进行统计和分布描述、了解变量间的相互关系,从整体上了解数据集的数据特征。
探索性分析要对调查总体的所有变量的有关数据进行统计性描述,主要包括数据的频数分析、集中趋势分析、离散程度分析、分布以及一些基本的统计图形。

  • 数据的频数分析。在数据的预处理阶段,利用频数分析和交叉频数分析可以检测异常值
  • 数据的集中趋势分析。用于反映数据的一般水平,平均值、中位数、众数等
  • 数据的分布。通常假设样本所属总体的分布属于正态分布,需要用偏度和峰度来检查是否符合正态分布
  • 数据的相关性分析。探索不同变量之间的相关性,可以使用相关性图

16、使用ABtest评估算法效果

1,需求
某个购物app最近优化了“猜你喜欢”模块的推进算法,希望进一步提升推进的精准度,进而提升销售额。现通过ABtest(50%用户保留原先推荐算法为控制组,50%用户使用新的推荐算法为实验组)。如何评估控制组和实验组的表现。指标
2,解题思路
指标:推荐商品的销售额、点击率、转化率
3,分析过程

  1. 假设原假设为使用新的推荐算法后上述指标降低或不变,备择假设为使用新的推荐算法后上述指标增加
  2. 选择显著性水平临界值为5%,并根据指标的预期确定样本量和试验周期
  3. 样本合理分流,AB测试上线,采集数据
  4. 使用T检验,计算P值,进行效果验证
  5. 分析结论,如果P值小于5%,那么原假设不成立,选择备则假设,即使用新算法后指标提升。否则无法推翻原假设。

17、如何评估一场活动的效果

1,需求:某APP近期上线了一个拉新活动,并在各个渠道进行了推广投放,活动结束后,如何进行评估这场活动的效果
2,解题思路:评估活动效果,即回答以下问题

  1. 活动效果如何,要不要继续做
  2. 如果继续做,好的方面是哪些,问题和瓶颈在哪
  3. 针对问题环节的改进方案是什么

具体展开:

  1. 活动关键指标达成分析
    比如:拉新多少用户?达成多少GMV?ROI如何?

  2. 活动关键流程漏斗分析
    活动的关键流程是什么?各个流程的漏斗分析,定位问题发生的环节

  3. 活动的渠道,用户分析
    活动在哪些渠道推送?活动推送给哪些用户?用户画像是怎么样的?各渠道的用户质量ROI如何?

  4. 活动策略、节奏分析
    活动玩法的裂变效果如何?利益点是否有吸引力?整个过程节奏把握如何,前期预热中期爆发和尾期是否过短/长,运营应该在何时进行干预?

18,同比?环比?

环比:与相连续的上一个统计周期进行对比,环比增长速度 = (本期数-上期数)÷上期数×100%,反映本期比上期增长了多少,例如:21年12月比21年11月。环比的好处是可以更直观的表面阶段性的变换,但是会受到季节性因素影响

同比:是对去年同期的一个统计阶段进行对比,同比增长率 = (本期数-同期数)÷同期数×100%,例如:21年12月比20年12月。好处是可以排除一部分季节性因素

本文链接:https://my.lmcjl.com/post/2657.html

展开阅读全文

4 评论

留下您的评论.