1 / 6
文档名称:

数据人告诉你怎样用数据分析撩妹?3.pdf

格式:pdf   大小:267KB   页数:6页
下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

数据人告诉你怎样用数据分析撩妹?3.pdf

上传人:好用的文档 2021/5/7 文件大小:267 KB

下载得到文件列表

数据人告诉你怎样用数据分析撩妹?3.pdf

相关文档

文档介绍

文档介绍:数据人告诉你怎样用数据分析撩妹?

本文由 CDA 作者库成员麻赛原创,并授权发布,文章
来源 CDA 数据分析师;写在前面
在工作中,经常利用多个数据指标对整体进行综合评价,
需要把多个数据压缩成一个综合指标,这就是多指标综合
评价方法。
耐心学完本期内容,足够装 X 一整年。
专业内容
专业术语的名称能吓死人,不用深究。
实际内容很简单,一个案例你就可以完全掌握。一个案例
富帅们看着美女数据,在进行激烈的讨论...那么,李富帅喜
欢的“综合起来最好的”类型,到底是哪个?
小龙女是最好的?虽然她最高,但是体重和胸围都不是最
优的
赵敏头发是最长的,但是其他数据也不是最好
要找出“综合最好的,需要把各项数据进行综合评分,这样”
就能帮李富帅找到心目中的女神!接下来看操作方法:
STEP1 无量纲处理
Q1 “量纲”是什么?就是数据的单位,例如厘米、公斤等
等。
Q2 为什么要进行无量纲处理?
我们对一个美女综合评分不能直接相加,因为身高和胸围
单位不同,并且数据范围相差太大,直接相加没有任何意
义,这是数据分析人员最常犯的错误之一。
Q3 具体怎么操作?(重点)
(不想看公式的可以略过,会有 EXCEL 制作的模板共享给
大家,直接填数据即可)
统计标准化方法:z=(x-μ)/σ。
其中 x 为某一项数据,μ 为均值,σ 为标准差。
此种方法也叫 Z 标准化,比较常用。小龙女的身高:x=
全部美女身高的均值:μ=
全部美女身高的标准差:σ=
那么小龙女身高的标准化 z=(x-μ)/σ=(-
)/=
当然,实际计算不需要这么麻烦,下载模板填数据就 ok 啦
~~~
标准化的结果如下:左侧四列数据为 Z 标准分,右侧数据
为 T 标准分,T=50+100*Z,这样做的目的只是为了调整数
据的范围,便于比较,因为看大一些的数字要直观多啦,
不然 Z 标准分的小数点看着眼花~~~
结论:
赵敏综合评分最高~~~赵敏是李富帅心目中的女神~~~~但
是,李富帅对结论却不满意
STEP2 权重确定
由于李富帅提出了进一步的要求,需要重新找出女神,接
下来我们要做的,是确定身高、头发长度、胸围的权重,
权重是帮我们找出女神的好方法。
那么问题来了,权重又是什么鬼?权重是一个相对的概
念,针对某一指标而言,某一指标的权重是指该指标在整
体评价中的相对重要程度。
身高、胸围、头发长度这三个指标中间,李富帅可能会更
喜欢高个大长腿,而对长头发短头发不甚在意。在上一期
文章中,综合评分=身高得分+胸围得分+头发得分,这也默
认了三个指标的权重是一致的,而本期我们会增加权重的
概念。
加权之后,计算综合评分会变成这种样子:综合评分=身高
得分*60%+胸围得分*30%+头发得分*10%(各个指标的权