2019 暑期实习面试及准备资料总结

编程入门 行业动态 更新时间:2024-10-07 20:31:12

2019 <a href=https://www.elefans.com/category/jswz/34/1761445.html style=暑期实习面试及准备资料总结"/>

2019 暑期实习面试及准备资料总结

2019 暑期实习面试及准备资料总结

18年年初开始转型做ML/DL,0基础,3个月学习了基础知识,打了一个kaggle比赛(DSB2018),截止投简历的时候成绩top 3%,投了三家的算法岗 今日头条图像算法岗,蚂蚁金服机器学习推荐算法,腾讯SNG图像算法,最终拿到蚂蚁金服的offer

问题总结及资料链接

(1)机器学习部分

1 逻辑回归部分
常问,推导要会
推导:

2 SVM部分
常问,推导要会,精简版看下面链接,但是写的不是很详细,最好把cs229讲义好好看看
推导: @靠靠靠谱 的回答

3 集成学习
常问,推导要会
bagging方法:看周志华教授的西瓜书
boosting方法:看李航的蓝书,特别的对于GBDT,这篇文章写的很清晰,推导相对简单
stacking方法:没有特别好的讲解,都看看吧,这篇还行
决策树:cart树是最常问的,详见李航蓝书,从推导到剪枝都要会

4 softmax
这个相对简单,这篇足够了

5 牛顿法和梯度下降
推导以及优劣比较,相对简单,直接看cs229讲义

6 交叉验证
相对简单,看这篇

7 正则方法
正则是一大块,原理方法都要懂,可以参考这些文章 :1 2

8 归一化方法
基础问题,随便那本书都有

9 SVD分解 PCA ICA 白化
这部分我没有被问到,但是应该会问,毕竟是重点,看cs229讲义

(2)深度学习部分

1 过拟合的起因,怎么解决
这个没啥好说的,任何讲深度学习的书和课程都有,看哪个都行

2 batch normalization
这个问题下的回答很有价值

3 cnn rnn本质
这篇文章总结的很好

4 梯度弥散/爆炸
没有太好的文章,看看这篇讲resnet的吧

5 激活函数,比较
sigmod tanh relu maxout… 好多,这个随便一搜就一堆,放一个不太切题的文章吧,我偶像何之源奆佬的回答,手动滑稽

6 梯度下降优化
这就很多了,lan大神的花书讲的就很好,博客也可以看这个

7 各种网络结构
这个就太多了,cnn的 rnn的,细分还有很多,多看多熟悉吧

(3)传统算法

很奇怪,反而这块很不重视,考的题都很简单
1 阿里在线编程测试
给一个圆,切成n个扇形,涂m种颜色,要求任意两个相邻扇形颜色不同
思路:首先不考虑首尾位置的扇形是否颜色相同,那么总共是 m∗(m−1)n−1 m ∗ ( m − 1 ) n − 1 种,
此时两种情况:1)首尾位置扇形颜色相同 2)首尾位置扇形颜色不同,第二种满足题意,不管,第一种可以把首尾颜色相同的扇形合成一个扇形,这样就成了一个相同要求但是规模是 n−1 n − 1 的问题,这样递推公式就是 f(n,m)=m∗(m−1)n−1−f(n−1,m) f ( n , m ) = m ∗ ( m − 1 ) n − 1 − f ( n − 1 , m ) ,代码如下:

#include <iostream>
#include <vector>
#include <numeric>
#include <limits>
#include <math.h>using namespace std;int f(int m, int n) {if (n == 1) return 0;else return int(pow(m - 1, n - 1) + 0.2)*m - f(m, n - 1);
}
int Colour(int colour_number, int split_part) {if (split_part == 1) return colour_number;return f(colour_number, split_part);    
}int main() {int res;int _colour_number;cin >> _colour_number;cin.ignore(std::numeric_limits<std::streamsize>::max(), '\n');int _split_part;cin >> _split_part;cin.ignore(std::numeric_limits<std::streamsize>::max(), '\n');res = Colour(_colour_number, _split_part);cout << res << endl;return 0;}

2 腾讯二面 面试官随手问的一个问题
是分水岭算法的一部分,问题可以如下描述:假设有一个单通道图片,背景像素点值为0,中间的物体像素点值为1,求出所有物体像素点到背景的最短距离
**思路:**dp思想,一个像素点有8个邻点,如果这8个邻点有一个是0,那么距离为1或 2–√ 2 (斜边),否则该点的距离是周围8个邻点中最短的距离+1或 2–√ 2 ,先扫描行然后只关心行的不关心列,再扫描列,只关心列,更新上一步扫描行后的结果,是EDT算法

3 腾讯二三面之间的笔试题
有n堆石子,第i堆石子的重量是w[i],每次合并两堆石子,并计算分数,比如,两堆石子是x,y,合并后是x+y 分数是x*y,一直合并下去,直到只剩一堆石子,求最大累积分数
思路: 一眼看到合并就是哈夫曼树呗,区别就是哈夫曼树分数是x+y,这个是x*y,那么每次取两个最大就行了,优先队列,弹出两个最大的相加计算乘积分数,然后结果扔进队列,直到队列只剩一个元素,白板写的,代码不贴了

(4)数字图像处理和模式识别

不会,没学过,腾讯就跪在这了,我都不知道有啥书可以看,不过面图像岗要求会这些也无可厚非,GG

(5)信息论

不懂,只是在李航的蓝书上看过信息熵 信息增益,其他的也不知道哪里学,GG

面试经历

  1. 今日头条
    2月末
    今日头条上海(实际是收购的musicl.ly)的同学说年会前每个人有任务要内推三个人,被内推

    3月1日 面试
    问了项目,问了深度学习基础,然后让实现一个cnn的forward,当时觉得答的不错,后面莫名其妙通知跪了,说编程能力不过关,黑人问号脸?可能是numpy用的不熟有些地方用错了吧

  2. 蚂蚁金服

    3.10 被内推
    收到邮件通知做线上测试和编程测试
    3.11 在线测评+编程
    周末直接把测评和编程做了,测评就是性格测试和智力测试
    编程是一个概率题,30分钟:一个圆分成n个扇形,用m个颜色着色,保证相邻的扇形着色不同,问几种方法
    然后递归实现就好了
    3.14 一面
    主要就是机器学习的传统方法和深度学习的一些问题,偏重机器学习。包括 机器学习:LR SVM 集成学习的bagging boosting方法(腾讯一面只问了stacking,正好凑齐。。),决策树(cart Id3);深度学习的lstm 梯度爆炸/弥散,一般深度学习训练时要调哪些参数,怎么调,效果如何,overfitting,classification方法;增强学习的马尔可夫过程,问了几个算法的推导
    3.14 二面
    详细让我谈了两个项目,然后让我从本科开始讲一下自己的经历,问了自己影响最大、印象最深的事情,问了区块链的东西,为啥我认为区块链不行要自学转行机器学习,再就是问1-2年的职业规划,啥时候能来实习
    3.16 三面
    面试官非常nice,面试之前先发了条短信约时间,上来先非常热情的介绍了整个部门的机构和规划,然后让我给投的公司排个名次,为什么,还有一些感觉是根据我的回答给的问题,然后详细让我说了另外的项目(跟二面不重叠),问我为啥简历有gap时间,尤其是kaggle的比赛,重点在分工、组内构成、与前面队伍的差距,没有问技术,感觉而三面主要看潜力和除了技术之外的业务能力、逻辑能力、协作能力
    3.20 HR面
    拖了一个周才面,随便聊了聊经历项目什么的,20分钟不到就结束了

  3. 腾讯

    3.16晚 一面
    大量机器学习问题,后面竟然问了好几个网络和操作系统的问题,没预料到,一点没复习,回答的不是很深入上来先介绍了一下自己的部门,然后问了lr svm 集成学习(老生常谈三件套),详细问了stacking用法,牛顿法和梯度下降优劣,过拟合的根本原因解决方法,CNN本质,交叉验证,tcp三次握手哪次调用了accept方法,用户态内核态有什么用,进程通信方法及优劣,总之问的特别多,细节有点记不起来了感觉腾讯是有个题库,然后打印出来对着问,因为一直听到面试官翻页的声音,当然也会根据你的回答即兴问

    3.22上午 二面+三面
    二面
    因为前后两个人面的,就当二面三面一起了吧二面针对我的kaggle比赛问了很多问题,怎么做怎么调优,mask rcnn 语意分割方法等等,基本是上一个问题我回答然后针对我回答的问题继续问
    中间笔试
    给了一套题,,涉及到机器学习、深度学习、信息论、概率、等基础知识,说是部门的要求,给了40分钟,题讲道理很基础,但是不一定学过……,比如说信息论我就没学过,只能凭借熵的定义自己推(还推错了),算法题很简单,leetcode老mid难度吧,优先队列哈夫曼树,代码也很短,基本半页纸就写的下
    三面
    然后三面面试官过来,对着你的简历和试卷,开始是问最后一题做出来没(算法题),看了看说做的不错,然后问卷子里的题为什么这么答,后面问了一些模式识别和数字图像处理的问题,比如几个算子的分析,然而我这种自学只学完了机器学习和深度学习,公式推的欲仙欲死,哪有时间补这些基础。。。又问了问项目,最后结论是,开发能力不错,数据结构的算法能力不错,但是图像处理基础不行,没有相关论文,只会DNN是远远不够的,DNN项目本科生一个周也能搭完跑起来,不适合他们组,适合做开发,然后加了微信说后面联系,回去后在腾讯招聘查结果是挂了

总结

对项目要求高
对实际经验要求高
基础要求一般
算法题要求一般,leetcode老mid难度
技术面之后的总监面、HR面非常重视你对自己的规划,定位,性格,看重潜力
反正我是菜如狗,也没有积累,投三挂二
自以为打了一个kaggle图像的比赛就有cv经验了,还是太年轻
可能全投机器学习会好一些?
没实力是这样的

更多推荐

2019 暑期实习面试及准备资料总结

本文发布于:2024-03-15 00:32:42,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/1737710.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:暑期   资料

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!