分析广告点击率与消费者行为之间的关系
现在是讲究“流量”的时代,流量在网络上的意思是指在一定时间内打开网站地址的人气访问量。我身边也不乏认识几个公司是靠流量赚钱的,即分享客户公司的广告链接靠消费者点击量抽提成的方式。
其中广告行业的业务指标有:
- 品牌忠诚度 (Brand Loyalty) : 品牌忠诚度是品牌影响力的重要指标之一。
- 点击率 (Click Rate) : 广告被点击的次数与广告收拾次数的比率。如果这个页面出现了一万次,而网页上的广告次数为五百次,那么点击率即为0.5%。点击率可以精确地反映广告效果,也是网络广告吸引力的一个标志。
- 点击成本 CPC (Cost Per Click) : 广告为每个用户点击所付的费用, CPC是评价广告效果的指标之一。
- 千人成本 CPM (Cost Per Thousand Impression) : 广告主为其广告显示1000次所付的费用。 CPM是评估广告效果的指标之一。
- 时间段成本 CPT (Cost Per Time) : 以固定价格买断一段时间内的额广告位展示,如开屏广告、富媒体广告或应用市场的下拉关键词等。
- 行动成本 CPA (Cost Per Action) : 按投放实际效果计价的广告
- 下载成本 CPD (Cost Per Download) : 按用户完成APP下载计费, 在应用商店、积分墙、流量联盟比较常见。
- 安装成本 CPI (Cost Per Install) : 按用户激活APP下载计费,渠道按这种模式结算比较少,通常只作为广告主内部衡量广告投放效果指标之一。
- 销售成本 CPS (Cost Per Sales) : 按完成订单的用户数量结算, 高质量垂直渠道、返利网站比较喜欢采用这种模式。
- 客户关系管理 (Costumer Relationship Management) : CRM是一种以客户为中心以信息技术为手段的经营策略,它的核心是客户细分和客户价值定位,在广告行业,通常指作品样稿、样片。
- 浏览量/访问量 (Page View) : 简称PV,网页被浏览的总次数。一个用户有可能创造十几个甚至更多的PV,用户每次刷新即被计算一次,是目前判断网站访问流量最常用的计算方式之一,也是反映一个网站受欢迎程度的重要指标之一。
- 独立访客 (Unique Visitor/User) : 简称UV,访问网站的一台电脑客户端为一个访客, 00:00-24:00内相同的客户端只被计算一次。
- 独立IP (Internet Protocol) : 简称IP,指独立IP数。00:00-24:00内相同IP地址只被计算一次。
- 投资收益率 ROI (Return On Investment) : 净利润除以投资额
- 用户平均收入 ARPU (Average Revenue Per User) : 衡量公司业务收入指标
- 转化率 CR (Conversion Rate) : 指访问某一网站访客中,转化的访客占全部访客的比例
- 跳出率 BR (Bounce Rate) : 指浏览了一个页面就离开的用户占一组页面或一个页面访问次数的百分比。
- 日活跃用户量 DAU (Daily Active User)
- 月活跃用户量 MAU (Month Active User)
- 人均访问页面 : PV总和除以IP=人均访问页面。人均访问页面>=10个才算优质用户。
- 二跳率 : 网站页面展开后,用户在页面上产生的首次点击被成为“二跳”, 二跳的次数即为“二跳量”,二跳量与浏览量的比值为页面的二跳率。
数据来源:
那么今天作为进军广告推广行业的我从 Kaggle竞赛平台上获取一个广告数据集,就暂且来初步分析下广告点击率与消费者行为(人口学特征、浏览网页习惯等等)之间存在的关系?
理解数据:
此数据集共有1000条记录,其中包含的字段有:
Daily Time Spent on Site: 消费者日常花费在浏览网页上的时间,以分钟为单位
Age: 消费者年龄
Area Income: 消费者收入
Daily Internet Usage: 消费者日常网络使用时间,以分钟为单位
Ad Topic Line: 广告标题
City: 消费者所在城市
Male: 消费者是否为男性,男性为1,不是男性为0
Country: 消费者所在国家
Timestamp: 时间戳
Clicked on Ad: 是否点击了广告,点击了广告为1,未点击广告的为0
分析工具:EXCEL + SQL
分析流程:
提出问题:
1⃣️消费者点击广告与消费者年龄的关系
2⃣️消费者点击广告与消费者收入的关系
3⃣️消费者点击广告与消费者使用网络的关系
4⃣️消费者点击广告与消费者浏览网页的关系
数据清洗:
- 对列名进行重命名,最好不允许列名中存在空格。所以我们对列名进行以下修改:
"Daily Time Spent on Site" -> ''DailyTimeOnSite"
"Area Income" -> "AreaIncome"
"Daily Internet Usage" -> "DailyInternetUsage"
"Ad Topic Line" -> "AdTopicLine"
"Clicked on Ad" -> "ClickedOnAd"
2. 对Timestamp列数据使用DATE和TIME函数进行日期和时间的剥离
Date = DATE(YEAR(Timestamp), MONTH(Timestamp), DAY(Timestamp))
Time = TIME(HOUR(Timestamp), MINUTE(Timestamp), SECOND(Timestamp))
在保存excel文件为.csv格式后,将此数据集通过使用Navicat导入Mysql的表Advertising中。这过程中我有遇到图4-4中的错误信息:
这是因为在导入Excel文件过程中的设置出现问题,解决方法:需要按照图4-5所示在“附加的选项”中设置第一行为列名,数据从第二行开始插入
接下来就是SQL分析:
此数据集的广告点击率是多少❓
SELECT
(
SELECT
COUNT(ClickedOnAd)
FROM
Advertising
WHERE
ClickedOnAd = 1
) / COUNT(*) * 100 AS “点击率”
FROM
Advertising;
根据图4-6所示,此数据集的广告点击率为50%
1⃣️消费者点击广告与消费者年龄的关系❓
首先我们可以根据图4-7所示查看消费者的年龄分布情况:点击广告的消费群体多分布于中老年年龄段内
SELECT
是否点击广告,
ROUND(
SUM(
CASE
WHEN Age >= 18
AND Age <= 34 THEN
1
ELSE
0
END
) / (
SELECT
count(*)
FROM
Advertising
WHERE
Age >= 18
AND Age <= 34
) * 100,
2
) AS "青年",
ROUND(
SUM(
CASE
WHEN Age >= 35
AND Age <= 59 THEN
1
ELSE
0
END
) / (
SELECT
count(*)
FROM
Advertising
WHERE
Age >= 35
AND Age <= 59
) * 100,
2
) AS "中年",
ROUND(
SUM(CASE WHEN Age >= 60 THEN 1 ELSE 0 END) / (
SELECT
count(*)
FROM
Advertising
WHERE
Age >= 60
) * 100,
2
) AS "老年"
FROM
Advertising
GROUP BY
是否点击广告;
由图4-8可以看出,越是年轻人点击广告的可能性越小,点击广告的可能性随年龄段的提升而增大。
2⃣️消费者点击广告与消费者收入的关系❓
由图4-9的消费分布图可以看出,点击广告的消费群体大部分都属于较低收入群体
SELECT
是否点击广告,
ROUND(
SUM(
CASE
WHEN AreaIncome >= 10000
AND AreaIncome <= 30000 THEN
1
ELSE
0
END
) / (
SELECT
count(*)
FROM
Advertising
WHERE
AreaIncome >= 10000
AND AreaIncome <= 30000
) * 100,
2
) AS "低收入",
ROUND(
SUM(
CASE
WHEN AreaIncome >= 30001
AND AreaIncome <= 60000 THEN
1
ELSE
0
END
) / (
SELECT
count(*)
FROM
Advertising
WHERE
AreaIncome >= 30001
AND AreaIncome <= 60000
) * 100,
2
) AS "中等收入",
ROUND(
SUM(
CASE
WHEN AreaIncome >= 60001 THEN
1
ELSE
0
END
) / (
SELECT
count(*)
FROM
Advertising
WHERE
AreaIncome >= 60001
) * 100,
2
) AS "高收入"
FROM
Advertising
GROUP BY
是否点击广告;
由图4-10可以看出,收入较低点击广告的可能性越大,高收入人群也极大可能不会点击广告。
3⃣️消费者点击广告与消费者是否为男性有关系❓
SELECT
是否点击广告,
ROUND(
SUM(CASE WHEN Male = 1 THEN 1 ELSE 0 END) / COUNT(*) * 100,
2
) AS "男性",
ROUND(
SUM(CASE WHEN Male = 0 THEN 1 ELSE 0 END) / COUNT(*) * 100,
2
) AS "女性"
FROM
Advertising
GROUP BY
是否点击广告;
由图4-11和4-12对比可得,相较于男性,女性消费者点击广告的可能性会略大一点点
4⃣️消费者点击广告与消费者浏览网页的关系❓
由图4-13的分布图可以看出,点击广告的消费者大多数浏览网页用时较少
SELECT
是否点击广告,
ROUND(
SUM(
CASE
WHEN DailyTimeOnSite >= 30
AND DailyTimeOnSite <= 50 THEN
1
ELSE
0
END
) / (
SELECT
count(*)
FROM
Advertising
WHERE
DailyTimeOnSite >= 30
AND DailyTimeOnSite <= 50
) * 100,
2
) AS "用时低",
ROUND(
SUM(
CASE
WHEN DailyTimeOnSite >= 51
AND DailyTimeOnSite <= 70 THEN
1
ELSE
0
END
) / (
SELECT
count(*)
FROM
Advertising
WHERE
DailyTimeOnSite >= 51
AND DailyTimeOnSite <= 70
) * 100,
2
) AS "用时中等",
ROUND(
SUM(
CASE
WHEN DailyTimeOnSite >= 71 THEN
1
ELSE
0
END
) / (
SELECT
count(*)
FROM
Advertising
WHERE
DailyTimeOnSite >= 71
) * 100,
2
) AS "用时高"
FROM
Advertising
GROUP BY
是否点击广告;
由图4-14可以看出,日浏览网页消耗用时较少的消费群体要更有可能点击广告,反之日浏览网页耗时越高,越不可能点击广告。
SELECT ROUND(
SUM(
CASE ClickedOnAd
WHEN '1' THEN 1 ELSE 0 END)/
COUNT(MONTH(Date))*100, 2)
AS "点击率"
FROM Advertising
GROUP BY MONTH(Date)
ORDER BY MONTH(Date);
由图4-15和4-16来看,此份跨度为七个月的数据中每月的广告点击率大概稳定在50%左右,可以通过分析用户行为AARRR模型来准确定位目标群众从而提高广告的点击率。
分析结论:
综上分析,大概是比较少浏览网页、低收入且年纪偏大的女性群体更容易点击广告。这是我暂时得出的结论,希望在接下来学习过后专业的业务知识后来完善我的分析。