求职招聘 | 面试机器学习职位,这些知识点你都会了吗?

论坛 期权论坛 期权     
运筹OR帷幄   2019-7-8 05:33   1711   0
↑↑↑↑↑点击上方蓝色字关注我们!


『运筹OR帷幄』转载
求职招聘栏目
来自于运筹帷幄的招聘板块。一方面,我们将为大家精心挑选和整理全球与运筹学、数据科学、机器学习、人工智能等领域相关的招聘职位。另一方面,我们也将翻译和转载国内外在该领域相关的求职干货。
如果您有职位正在招人,如果您想推荐相关领域的职位,请扫描文末二维码,让我们助您一臂之力。
/转载来源/
本文经牛客网网友“牛妹”授权转载。
/原文作者/
牛客网网友“牛妹”,毕业于哈尔滨理工大学,牛客网第一网红,微博:迪公主dorothy。


-01-
知识点框架





-02-
数学基础

[h2]1)微积分
[/h2]
  • SGD,Momentum,Adagard,Adam原理;
  • L1不可导的时候该怎么办;
  • sigmoid函数特性。
[h2]2)统计学,概率论
[/h2]
  • a,b~U[0,1],互相独立,求Max(a,b)期望;一个活动,n个女生手里拿着长短不一的玫瑰花,无序的排成一排,一个男生从头走到尾,试图拿更长的玫瑰花,一旦拿了一朵就不能再拿其他的,错过了就不能回头,问最好的策略?
  • 问题:某大公司有这么一个规定:只要有一个员工过生日,当天所有员工全部放假一天。但在其余时候,所有员工都没有假期,必须正常上班。这个公司需要雇用多少员工,才能让公司一年内所有员工的总工作时间期望值最大?
  • 切比雪夫不等式;
  • 一根绳子,随机截成3段,可以组成一个三角形的概率有多大?
  • 最大似然估计和最大后验概率的区别?
  • 什么是共轭先验分布?
  • 概率和似然的区别;
  • 频率学派和贝叶斯学派的区别;
  • 0~1均匀分布的随机器如何变化成均值为0,方差为1的随机器;
  • Lasso的损失函数;
  • Sfit特征提取和匹配的具体步骤。
[h2]3)线性代数
[/h2]
  • 求mk矩阵A和nk矩阵的欧几里得距离;
  • PCA中第一主成分是第一的原因;
  • 欧拉公式;
  • 矩阵正定性的判断,Hessian矩阵正定性在梯度下降中的应用;
  • 概率题:抽蓝球红球,蓝结束红放回继续,平均结束游戏抽取次数;
  • 讲一下PCA;
  • 拟牛顿法的原理;
  • 编辑距离。


图片来源:Gerd Altmann from Pixabay

-03-
机器学习算法

[h2]1)处理分类问题常用算法
[/h2]
  • 交叉熵公式;
  • LR公式;
  • LR的推导,损失函数;
  • 逻辑回归怎么实现多分类;
  • SVM中什么时候用线性核什么时候用高斯核;
  • 什么是支持向量机,SVM与LR的区别?
  • 监督学习和无监督学习的区别;
  • 机器学习中的距离计算方法?
  • 问题:朴素贝叶斯(naive Bayes)法的要求是;
  • 问题:训练集中类别不均衡,哪个参数最不准确?
  • 问题:你用的模型,最有挑战性的项目?
  • 问题:SVM的作用,基本实现原理?
  • 问题:SVM的硬间隔,软间隔表达式?
  • 问题:SVM使用对偶计算的目的是什么,如何推出来的,手写推导?
  • 问题:SVM的物理意义是什么?
  • 问题:如果给你一些数据集,你会如何分类(我是分情况答的,从数据的大小,特征,是否有缺失,分情况分别答的)
  • 问题:如果数据有问题,怎么处理?
  • 分层抽样的适用范围;
  • LR的损失函数;
  • LR和线性回归的区别;
  • 生成模型和判别模型基本形式,有哪些?
  • 核函数的种类和应用场景;
  • 分类算法列一下有多少种,分别应用场景有哪些?
  • 给你一个检测的项目,检测罐装的可口可乐,瓶装的可口可乐作为负样本,怎么弄?
  • SVM核函数的选择;
  • SVM的损失函数;
  • 核函数的作用;
  • SVM为什么使用对偶函数求解?
  • ID3,C4.5和CART三种决策树的区别;
  • SVM和全部数据有关还是和局部数据有关;
  • 为什么高斯核能够拟合无穷维度?
  • 第二面完整推导了svm一遍,还有强化学习问的很多,dqn的各种trick了解多少,怎么实现知不知道?
  • SVM所有核函数的了解应用,SVM的损失函数;
  • LR和SVM 区别;
  • 朴素贝叶斯基本原理和预测过程;
  • LR推导;
  • 交叉熵;
  • LR公式;
  • 交叉熵公式。
[h2]2)处理回归问题常用算法
[/h2]
  • L1和L2正则化的区别;
  • 问题:Loss Function有哪些,怎么用?
  • 问题:线性回归的表达式,损失函数;
  • 线性回归的损失函数;
  • 机器学习:知道哪些传统机器学习模型?
[h2]3)处理聚类问题常用算法
[/h2]
  • 什么是DBSCAN?
  • k-means算法流程;
  • LDA的原理;
  • 介绍几种机器学习的算法,我就结合我的项目经理介绍了些RF, k-means等算法;
  • 讲讲,k-means有什么缺点,K怎么确定;
  • DBSCAN原理和算法伪代码,与k-means,OPTICS区别。
[h2]4)推荐系统的常用算法
[/h2]
  • 问推荐算法,fm,lr,embedding;
  • 协同过滤的itemCF,userCF区别适用场景;
  • 推荐系统的大概步骤,解决冷启动;
  • 传统的机器学习算法了解吗?
  • 用mapreduce实现10亿级以上数据的k-means;
  • A/B test如何进行流量分流;
  • 协同过滤中的算法怎么细分?
  • FM公式。
[h2]5)模型融合和提升的算法
[/h2]
  • bagging和boosting的区别;
  • boosting和 bagging区别;
  • XGBOOST和GDBT的区别;
  • GDBT的原理,以及常用的调参参数;
  • AdaBoost和GBDT的区别,AdaBoost和GBDT的区别;
  • gbdt推导;
  • boosting和bagging在不同情况下的选用;
  • gbdt推导和适用场景;
  • 说一下gbdt的全部算法过程;
  • rf和gbdt基分类器区别,里面的决策树分别长啥样,怎么剪枝?
  • 随机森林和 GBDT 的区别;
  • xgboost的特征重要性计算;
  • xgboost的正则项表达式;
  • xgboost原理,怎么防过拟合;
  • xgboost,rf,lr优缺点场景;
  • xgboost特征并行化怎么做的?
  • xgboost和lightgbm的区别和适用场景?
[h2]6)其他重要算法
[/h2]
  • 问题:HMM隐马尔可夫模型的参数估计方法是;
  • 问题:Bootstrap方法是什么?
  • 问题:如何防止过拟合?
  • EM算法推导,jensen不等式确定的下界。


图片来源:Gerd Altmann from Pixabay

-04-
机器学习

[h2]1)Scikit-learn
[/h2]
  • Focal Loss 介绍一下;
  • 过拟合的解决方法;
  • 方差偏差的分解公式;
  • 问题:对应时间序列的数据集如何进行交叉验证;
  • 问题:正负样本不平衡的解决办法?评价指标的参考价值?
  • 迁移学习;
  • 数据不平衡怎么办?
  • AUC的理解;
  • AUC的计算公式;
  • 生成模型和判别模型的区别;
  • 过拟合的解决方法;
  • 特征选择怎么做?
  • 怎么防止过拟合?
  • L1和L2正则;
  • ID3树用什么指标选择特征?
  • 特征工程的问题;
  • 给了个链接线上写代码,要求写读文本、文本预处理、特征提取和建模的基本过程,不过写到特征就没写了;
  • softmax公式;
[h2]2)Libsvm
[/h2]
  • 检测20类物体,多少张训练集,怎么训练?
  • lightgbm优势。
[h2]3)Keras/tensorflow
[/h2]
  • MXNet和Tensorflow的区别;
  • Tensorflow的工作原理;
  • Tensorflow中interactivesession和session的区别;
  • 手写了tensorflow的图像分类代码,还有问之前线下笔试最后编程题的思路,算法复杂度,然后项目也问。


图片来源:Gerd Altmann from Pixabay

-05-
深度学习

  • BatchNormalization的作用;
  • 梯度消失;
  • 循环神经网络,为什么好?
  • 什么是GroupConvolution?
  • 什么是RNN?
  • 训练过程中,若一个模型不收敛,那么是否说明这个模型无效?导致模型不收敛的原因有哪些?
  • 图像处理中锐化和平滑的操作;
  • VGG使用3*3卷积核的优势是什么?
  • Relu比Sigmoid的效果好在哪里?
  • 问题:神经网络中权重共享的是什么?
  • 问题:神经网络激活函数?
  • 问题:在深度学习中,通常会finetuning已有的成熟模型,再基于新数据,修改最后几层神经网络权值,为什么?
  • 问题:画GRU结构图;
  • Attention机制的作用;
  • Lstm和Gru的原理;
  • 什么是dropout?
  • LSTM每个门的计算公式;
  • HOG算法原理;
  • DropConnect的原理;
  • 深度学习了解多少,有看过底层代码吗?caffe,tf
  • 除了GMM-HMM,你了解深度学习在语音识别中的应用吗;
  • 用过哪些移动端深度学习框架;
  • Caffe:整体架构说一下,新加一个层需要哪些步骤,卷积是怎么实现的,多卡机制,数据并行还是模型并行;
  • HOG算子是怎么求梯度的?
  • BN层的作用,为什么要在后面加伽马和贝塔,不加可以吗?
  • 梯度消失,梯度爆炸的问题;
  • Adam;
  • attention机制;
  • RNN梯度消失问题,为什么LSTM和GRU可以解决此问题?
  • GAN网络的思想;
  • 1*1的卷积作用;
  • 怎么提升网络的泛化能力;
  • 什么是seq2seq model?
  • 激活函数的作用;
  • 为什么用relu就不用sigmoid了?
  • 讲一下基于WFST的静态解码网络的语音识别流程?
  • 目标检测了解吗,Faster RCNN跟RCNN有什么区别?
  • SPP,YOLO了解吗?
  • 梯度消失梯度爆炸怎么解决?
  • RNN容易梯度消失,怎么解决?
  • LSTM跟RNN有啥区别?
  • 卷积层和池化层有什么区别?
  • 防止过拟合有哪些方法?
  • 介绍下dropout?
  • relu?
  • 神经网络为什么用交叉熵?
  • 注意力公式;
  • 论文flow情况;
  • Flappy.Bird开发者,怎么利用DNQ方法强化学习你的游戏AI?
  • LeNet-5结构;
  • 推导LSTM正向传播和单向传播过程;
  • LSTM原理,与GRU区别;
  • DNN的梯度更新方式;
  • CNN为什么比DNN在图像识别上更好;
  • 现场用collabedit写代码,一个怪异的归并算法,之前没遇到过,直接把归并写出来,但是说复杂度太高,优化了三遍还不行,最后说出用小顶堆解决了;
  • LSTM和Naive RNN的区别;
  • 神经网络为啥用交叉熵?
  • 注意力公式;
  • Inception Score 评价指标介绍;
  • 使用的 CNN 模型权重之间有关联吗?
  • CycleGAN 原理介绍一下;
  • 训练 GAN 的时候有没有遇到什么问题;
  • 百度实习:CPM 模型压缩怎么做的?有压过 OpenPose 吗?
  • 用过哪些 Optimizer,效果如何;
  • 图像基础:传统图像处理方法知道哪些,图像对比度增强说一下;
  • 介绍一下图像的高频、低频部分,知道哪些图像补全的方法;百度实习:模型压缩的大方向。CPM 模型怎么压缩的,做了哪些工作;
  • Depthwise 卷积实际速度与理论速度差距较大,解释原因;
  • RetinaNet 的大致结构画一下;
  • RetinaNet为什么比SSD效果好;


图片来源:Gerd Altmann from Pixabay

-06-
数据结构与算法

[h2]1)查找
[/h2]
  • 手写二分查找;
  • 算法题,单调函数求零点 (简单的二分法);
  • 特别大的数据量,实现查找,排序。
[h2]2)哈希
[/h2]
  • Hash表处理冲突的方法;
  • 一致性哈希;
  • Hash表处理冲突的方法;
  • apriori;
  • KM算法。
[h2]3)表达式、字符串
[/h2]
  • 中缀表达式转后缀表达式;
  • 算法题:翻转中间由各种符号隔开的字符串;
  • 问题:A+B(CD)/E的后缀表达式。
[h2]4)栈与堆
[/h2]
  • 大顶堆怎么插入删除;
  • 堆栈区别;
  • 栈溢出有哪些情况。
[h2]5)树
[/h2]
  • 问题:手撕代码,根据前序,中序创建二叉树;
  • 算法题:从右边看被遮挡的二叉树,求露出的node;
  • 算法题,给前序和中序,求出二叉树;
  • 算法题,trim二叉搜索树;
  • 红黑树。
[h2]6)排序
[/h2]
  • 对一千万个整数排序,整数范围在[-1000,1000]间,用什么排序最快;
  • 堆排序的思想;
  • 冒泡排序;
  • 快速排序的最优情况;
  • 抽了两道面试题目两道:8个球,1个比较重,天平,几步找到重的;
  • 算法题:topK给出3种解法  ;
  • 快排;
  • 说一下小顶堆的调整过程;
  • 算法题:2sum,3sum。
[h2]7)高级算法
[/h2]
  • 手撕代码:以概率p生成1、概率1-p生成0的rand函数,得到0-1等概率的rand函数,计算新的rand函数中:调用一次,while循环的期望次数;
  • Kruskal算法的基本过程;
  • BFS和DFS的实现思想;
  • 关联规则具体有哪两种算法,它们之间的区别;
  • 贪婪算法;
  • 模拟退火,蚁群对比;
  • 算法题:名人问题,给出最优解法;
  • 代码题:股票最大值;
  • 编辑距离。
[h2]8)链表
[/h2]
  • 如何判断单链表是否是循环链表;
  • 反转链表;
  • 算法题,反转链表;
  • 算法题,单链表判断是否有环 (leetcode easy),以及判断环入口。
[h2]9)数组
[/h2]
  • 找出数组中只出现1次的数,其余数均出现2次,扩展,其余数出现2次以上。
[h2]10)动态规划
[/h2]
  • 最短描述数,10的最短描述数是3^2+1^2所以是2,求一个数的最短描述数;
  • 跳台阶问题,每次只能跳1个台阶或者2个台阶,n个台阶共有多少种方式;
  • 动态规划和带记忆递归的区别;
  • 手撕代码:0-1矩阵的最大正方形。
[h2]11)遍历
[/h2]
  • 代码题:股票最大值。


图片来源:Elchinator from Pixabay

-07-
编程语言,工具和环境

[h2]1)编程语言
[/h2]
  • 什么是python的生成器;
  • Java抽象类和接口的区别;
  • python中is和==的区别;
  • python方法解析顺序;
  • strcpy函数;
  • Ctrl+C程序挂掉还是抛出异常,如何判断两个dict是否一样,list头上删除元素,字符串拼接;
  • pytorch中cuda()作用,两个Tensor,一个加了cuda(),一个没加,相加后怎样;
  • python中dict和list的区别,dict的内部实现;
  • C++析构函数;
  • C++的delete, delete[]的区别;
  • C++相关的问题虚函数;
  • 如何写多线程的代码;
  • 是否关注过caffe和pytorch是怎么写的吗?pytorch调用多GPU函数内核;
  • Java虚拟机内存的划分;
  • python dict按照value进行排序;
  • C++中static关键字的作用;
  • 虚函数和纯虚函数的区别;
  • Python多进程;
  • 深拷贝,浅拷贝,写一个出来(写了个自己认为对的版本);
  • 在程序里面智能指针的名字是啥?
  • new,malloc区别;
  • 纯虚函数怎么定义,写一个出来;
  • 函数后面接const是什么意思?
  • 写一个函数指针;
  • 抽象类和接口的区别;
  • 有看过c++的一些库吗?
  • c++你看的最久的一章是哪一章,c++primer最熟哪一章?
  • 开发环境、语言的掌握;
  • Python 多进程;
  • Python 锁。
[h2]2)大数据相关
[/h2]
  • Spark性能如何调优;
  • map reduce实现笛卡尔乘积;
  • 是否写过udf,问udaf,udtf区别和一些细节。
-08-
自然语言处理

[h2]1)Word2vec
[/h2]
  • Word2Vec中skip-gram是什么,Negative Sampling怎么做;
  • FastText和Glovec原理;
  • word2vec实施过程;
  • softmax的原理了解;
  • Wod2vec公式;
  • 使用gensim的word similar方法预测句子。


图片来源:Gerd Altmann from Pixabay

-09-
计算机基础

[h2]1)linux
[/h2]
  • ELF的bss段;
[h2]2)计算机网络
[/h2]
  • IP报文经过一个路由器改变哪些字段?
  • TCP/IP算法,IP寻址。
[h2]3)操作系统
[/h2]
  • 如何将小端存储模式转为大端存储模式;
  • Python 锁。
[h2]4)数据库
[/h2]
  • count(*),count(1)和count(列名)的区别。



-10-
场景题

  • 如何对10亿个词语进行排序,找出频率最高的100个?
  • 算法题,10亿个32位正整数,求不同值,只给1GB内存 ?
  • AI能用在游戏的哪些方面?
  • 如果让我用AI技术怎么加入AI元素?
  • 你觉得你的构想能实际实现吗?
  • 那这个技术加进去有什么实际上的意义?
[h1]
-11-
项目

[/h1]
  • 自我介绍;
  • 项目介绍;
  • 项目中涉及的算法有了解情况;
  • 模型的搭建,后处理,数据中发现的特征,发现的亮点;
  • 数据量和涉及的算法,效果;
  • 你是怎么处理数据中经常存在的数据不平衡的问题;
  • 考察项目中的roi-pooling;
  • 描述一个算法项目从kickoff-落地的全过程;
  • 扣项目,问简历,其中涉及的算法和上面差不多;
  • 对项目中一些技术选型产生质疑,并友好的一起讨论了这个问题;
  • 扣简历,问得太细了,每个项目都要回答如果再做一次,有什么改进的地方,both算法上和模型选择上;
  • 聊简历项目,对搜索推荐算法的了解;
  • 简历上聚类项目用到的ISODATA算法比kmeans有哪些改进;
  • 然后让我说一下自己最印象深刻的项目。问我项目的最终成果,分析失败的原因;
  • 看过的论文,讨论论文;
  • 针对岗位需求和我简历里的内容进行提问;
  • 项目中遇到的最大困难;
  • 你的C/C++怎么样;
  • 谈谈实习项目;
  • 项目难点;
  • 说一下你简历里的图像识别的项目;
  • 项目经历详细介绍:两种预测方式区别,pair的预测方式,整体项目有哪些可以提升的,遇到的困难之类的,整个项目用了哪些库;
  • 看过的论文,讨论论文;
  • 论文flow情况;
  • 英特尔实习:项目介绍:台球识别和分类使用的方法,Hough 变换原理、后处理;
  • Kaggle 比赛:背景介绍,数据清洗、数据增强、类别平衡,最终成绩,与前几名差距在哪,有没有尝试集成的方法;
  • GAN 小论文,做了哪些工作,详细公式推一下,对 GAN 的具体应用有了解吗;
  • 简历上项目为何适用xgboost和lr,对比其他分类算法的场景优势  ;
  • GAN小论文,你做了什么,有哪些改进,在哪些数据集上做过实验,分辨率是多少;
  • 英特尔实习:1)项目背景。台球检测和分类方法,球杆检测方法,球杆遮挡问题怎么处理,不用分类器,直接分割或计算图像差值会怎样;
  • 有什么问题想了解一下。


图片来源:Wolfgang Claussen from Pixabay

-12-
hr面

  • 自我介绍;
  • 几点过来的;
  • 你有什么跟别人不一样的;
  • 你的缺点是什么;
  • 家里几口人;
  • 搞技术的你怎么很能说啊;
  • 为什么喜欢杭州;
  • 为什么喜欢菜鸟;
  • 如果你面试失败,你会怎么办?
  • 菜鸟跟你相关的部门;
  • 有女朋友吗?
  • 在哪里工作?
  • 从事什么行业?
  • 如果你的岗位有冲突,你会怎么处理?
  • 实习时间,具体什么时候可以开始?
  • 你有什么想问的吗?
  • 有没有男朋友呀,意向地点是哪?
  • 对公司有哪些了解?
  • 兴趣爱好、意向地点?
  • hr面就是常见的问题,城市啊,薪资待遇啊,对部门的评价,对总监的评价;
  • 自我评价优缺点,怎么改进  ;
  • hr抠了简历细节,问了笔试试卷相关的问题,还有自己的职业规划等;
  • 想去的工作城市;
  • 考研还是保研,为什么考到这个学校;
  • 研究生期间最大的改变是什么?
  • 四六级成绩;
  • 讨论下工作地点和期望薪资;
  • 你三年的职业规划是什么?
  • 你和周围的人比你的优势在哪?举个例子;
  • 考研的还是保研的?为什么没有保研?
  • 家庭成员?家里人对你的工作地点有要求吗?
  • 平时喜欢运动吗?
  • 设计模式会吗?
  • 转岗吗?
  • 平时刷题吗?你刷过最有意思的题是哪个,介绍一下?
  • 我看你之前还做过销售,聊一下 ?


-13-
学习与发展

  • 如果有同学要学机器学习,你会建议他们从哪里做起?
  • 个人发展,以及对自己项目的深入思考,还有深度学习的发展之类的。
  • 讲很多关于深度学习以及机器学习的具体应用与实现,也谈到了自己在实际工作中遇到的困难。
  • 之后面试官问了些我对人工智能的看法,以及相关竞赛的情况;
  • 为什么选择实习,而不是在学校做研究?

  END  
本文编辑
原文作者:牛客网网友“牛妹”,毕业于哈尔滨理工大学,牛客网第一网红,微博:迪公主dorothy。
责任编辑:杜图灵
微信编辑:公子乔三
文章申明:本文内容来自牛客网网友“牛妹”,经原作者同意后,由责编杜图灵收集整理。如需转载,请在公众号后台获取转载须知。


往期回顾
求职招聘 | 南洋理工、埃塞克斯、东北大学:优化方向博士(后)
求职招聘 | 算法岗,详细面试问题,十家公司面试经验总结
求职招聘 | AI、算法岗位,2020届华为海思全球博士招聘


号外!『运筹OR帷幄』入驻知识星球!

随着算法岗位对专业人才要求的提高,面试题越来越难。『运筹OR帷幄』特建立【算法岗面试求职招聘】知识星球,邀请业界资深算法工程师,帮助大家解答面试题中的疑点难点,分享成功面试经验。内容涵盖运筹学、数据科学、人工智能等和算法相关的专业。让大家面对算法面试更加游刃有余。
扫描下方二维码,公司大咖与您一起聊算法面经,快来加入我们吧!
[h2]豪华嘉宾阵容
[/h2]目前星球特邀入驻的嘉宾(曾)就职的公司包括(不断扩展中):
腾讯、百度、阿里(菜鸟、达摩院、盒马)、华为、微软、英伟达、顺丰科技、旷视、SAP、NEC、美团、苏宁、福特、阿里妈妈、东芝、松下、佳能、拼多多、环球易购、携程、滴滴、京东、杉数科技、Sabre、悠桦林、Pier、奇弦智能、Momenta等。


分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:10
帖子:2
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP