线性回归
线性回归是回归问题中的一种,线性回归假设目标值与特征之间线性相关,即满足一个多元一次方程。通过构建损失函数,来求解损失函数最小时的参数w和b。一般表达式如下:
故事我有,我不喝酒。
数据类型 | 表头 |
---|---|
数字 | 123 45.1 |
字符串 | ‘hello world’ |
列表 | [123,’abc,’{4,5,6}] |
元组 | (123,’abc,’{4,5,6}) |
字典 | {‘a’:1,’b’:2,’c’:3} |
集合 | {‘a’,’b’,’c’} |
首先我们引入偏态分布的概念:偏态分布是与“正态分布”相对,曲线左右不对称的分布。
偏态分布分为正偏态(右偏)分布和负偏态(左偏)分布。
正偏也叫右偏,看起来好像是峰值在左,怎么会叫右偏呢?按维基百科的解释是:传统定义,均值大于中位数的称为右偏,也可以理解为长尾在右侧。同理可知,负偏也叫左偏。
以下内容整理自拉勾教育《数据分析思维与实战 23 讲—— 14 | 营销活动:日常运营活动的分析模板》
公司做线上和线下活动时每天都会看到各种活动捷报。活动结束后,钱是花完了,真实用户数却没涨多少,大多数都被薅羊毛了。营销活动每年都会花很多钱,因此必须要找一个公正的第三方——数据分析师,来做这件事。而数据分析师既然要做,就一定要发挥出自己的专业性,大家都是罗列数字,为何你就是不一样,你的强大逻辑性在哪?
创建:
1 | hive> CREATE TABLE t3 (foo STRING, bar MAP<STRING,INT>) |
hive explode函数可以将一个array或者map展开,其中explode(array)使得结果中将array列表里的每个元素生成一行;explode(map)使得结果中将map里的每一对元素作为一行,key为一列,value为一列。
以下内容整理自拉勾教育《数据分析思维与实战 23 讲—— 10 | 指标体系搭建:指标体系的经典四步》
微观模块的学习包含指标体系、流量分析、路径分析、竞品分析、营销活动分析、用户增长分析等,而在所有模块当中,最基本的是指标体系。