美团数据分析笔试题

编程入门 行业动态 更新时间:2024-10-28 18:36:06

美团数据分析<a href=https://www.elefans.com/category/jswz/34/1769509.html style=笔试题"/>

美团数据分析笔试题

一、 广告是互联网企业重要的变现模式,在美团的广告业务中,商家会和美团的销售签订不同类型的广告合同(比如,按点击收费的广告cpc、按曝光收费的广告cpm、按时长收费的广告cpt)。美团会为商家创建相关的广告内容素材创意(比如,门店图片、活动图片、促销文字等),并通过美团的广告引擎,根据用户访问的行为特征,基于算法策略将商家的广告内容投放到美团的app或者外部合作伙伴(比如如:腾讯,头条)的app不同的展示位置上。普通用户访问这些广告后,会对商家产生兴趣,可能产生购买转换行为,美团会和商家做广告的计费结算,同时为商户提供用户的广告效果信息(比如:广告带来的门店访问量、订单数等)。

1、 如果让你对这个业务进行抽象,你会抽象出哪些数据分析主题,并说出你这样分的原因;

2、 请你根据问题1抽象的主题,进行主题模型设计,并说明设计的模型内容,以及模型之间的关系。


收费模式:按点击收费的广告cpc,按曝光收费的广告cpm,按时长收费的广告cpt
广告投放流程:广告素材创意 => 用户访问的行为特征 => 基于算法策略 => 投放到美团的app或者外部合作伙伴的app => 不同的展示位置上
商家引流流程:广告投放 => 用户访问 => 购买转换行为 => 和商家做广告的计费结算 => 为商户提供用户的广告效果信息(访问量、订单数量)

1、 如果让你对这个业务进行抽象,你会抽象出哪些数据分析主题,并说出你这样分的原因;
广告素材特点和用户访问量的主题:用来分析不同特点和素材的广告对吸引用户访问是否有较大的关系。
用户访问行为特征和最终购买行为主题:分析用户在广告页面滑动、点击、停留等特征,是否对最终购买行为有较大的关系。
收费模式、商户类型、商户付费的关系:分析不同类型的商户在不同模式下的付费意愿,用于向未使用广告业务的商户推广
投放时段和访问量订单数的关系:能带来高访问量或订单数的投放时段,价格可以适当调整
不同类型商户广告投放的效果分析:分析哪些类型商户广告投放效果较差,可以帮助商户调整引流策略

2、 请你根据问题1抽象的主题,进行主题模型设计,并说明设计的模型内容,以及模型之间的关系。
用户访问行为特征和最终购买行为主题:特征值可以选择用户点击进入广告后的行为特征,包括滑动速度、滑动方向、停留时间、点击等。
结合最终购买行为,用来分析用户行为特征对购买行为的影响。可以实时预测用户行为是否有较大几率产生购买行为。对购买意愿弱的用户,可以在页面中实施其他推广营销策略,加强用户的购买意愿。


可以抽象出3个数据分析主题
1)对比不同类型的广告合同对企业广告业务收入的影响
2)对比不同类型的广告内容素材对门店访问量,订单数量,以及企业广告业务收入的影响
3)对比不同平台展示对门店访问量,订单数量,以及企业广告业务收入的影响
原因:根据广告业务中的3个因素进行分析,分别研究每个因素对业务效果和业务收入的影响,使得企业能够及时调整业务形式和内容

模型1:分别建立单变量回归模型,如自变量是不同类型的广告合同,因变量是广告业务的总收入
模型2:建立多变量回归模型
计算出模型1和模型2的回归系数,可以估算出每个自变量对因变量的影响大小;
通过对比模型1和模型2的回归系数,可以判断出变量之间是否有相关性及其大小


主题1 广告转化率主题:分析用户不同用户行为(点击、停留、滑动)对转化率的影响。商家购买广告,最看重的就是广告的转化率,即该广告可以带来多少的新订单。从这个主题,我们找到不同用户行为对转化率的影响,可以确定最能促进转化的用户行为。

主题2 素材形式和用户行为主题:分析不同的素材形式对用户行为的影响。比如:放促销文字是否最能引起用户点击?通过这个主题分析,我们可以结合主题1的结果,进而找到最能促进转化率的广告素材形式。

模型1 新订单量~点击数+停留数+滑动+…(用户行为)

二、说明关系型数据库通过索引提升查询效率的背后原理 。

  1. 如果没有索引,数据库引擎需要通过全表扫描来查找数据,这会产生大量的磁盘IO。

  2. 关系型数据库使用B+树构建索引来加速加快查询。B+树是一种二叉查找树(每个节点的键值必须:比保存在左子树的任何键值都要大,比保存在右子树的任何键值都要小),这样随机查找某个键值时可以通过从根节点执行二叉查找来加速查询,查询成本取决于树的层数。

  3. 针对范围查询和排序的优化:在每个叶子节点保存其下一个叶子节点的指针,这样当指定范围范围查询时,先从根节点根据范围的左值找到其叶子节点,之后通过向后遍历叶子节点即可找到对应范围右值,这样可以加速范围查询、排序、分组等数据库查询动作。

  4. 针对磁盘读写速度的优化:除了叶子节点之外的其他节点只保存键值,这样对磁盘的单次读写可以获取到尽可能多的数据。以MySQL为例,一个1000万行的表对应的B+树按照主键查找理论上只需要3次磁盘IO,这相对于全表扫描带来的磁盘IO是多个量级的性能提升。

  5. MySQL等数据库引擎在实际实现B+树索引的时候,针对磁盘读写做了优化:非叶子节点中只存放key值,叶子节点中除了key值也会存放数据,按照存放数据的不同索引区分为主索引(聚簇索引)和辅助索引:

    a) 主索引的叶子节点中存放该key值对应的完整记录,使用主索引进行查找时,可以直接输出记录;一个表只能创建一个主索引。

    b) 普通索引的叶子节点则存放对应主键的值,因此在使用辅助索引进行查找时,需要先查找到主键值,然后再到主索引中进行查找;一个表可以创建多个辅助索引。

  6. 除了B+树,关系型数据库一般也支持哈希索引,哈希索引能够非常高效地进行随机查找,但是对于范围查询、排序和分组都不支持。

四、在4*4的棋盘上摆满了黑白棋子,黑白两色的位置和数目随机其中左上角坐标为(1,1),右下角坐标为(4,4),现在依次有一些翻转操作,要对一些给定支点坐标为中心的上下左右四个棋子的颜色进行翻转,请计算出翻转后的棋盘颜色。

a = eval(input())  #注意输入方式
b = eval(input())
for i in range(len(b)):m=b[i][0]-1n=b[i][1]-1if m>0:a[m-1][n]=1-a[m-1][n]if m<3:a[m+1][n]=1-a[m+1][n]if n>0:a[m][n-1]

更多推荐

美团数据分析笔试题

本文发布于:2024-03-23 21:07:08,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1742811.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:笔试   数据

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!