计算机背景较弱的数学博士,适不适合做数据挖掘方面的算法工程师?

论坛 期权论坛 期权     
Jacobi   2018-9-28 00:20   4960   4
我有一个朋友数学博士,
1.博士做的是非线性优化方向(这方面我也懂的大概)
2.平时做优化主要使用matlab进行编程
3.参加过一家公司的实习,主要使用matlab进行算法设计,由其他人员做C++的实现。同时学了一些C++编程,但要独立完成算法实现还有困难
4.目前正在恶补数据结构等计算机知识

就以上的情况,希望大家给点意见,适不适合做数据挖掘方面的算法工程师?想往这个方向发展需要做哪些努力,哪些知识是必须的?想1年内找这个方向的工作,哪些公司可能会要?
分享到 :
0 人收藏

4 个回复

倒序浏览
2#
张戎  4级常客 | 2018-9-28 00:20:02 发帖IP地址来自
转行数据挖掘和机器学习
半年前从数学专业转行到了互联网行业做数据挖掘和推荐系统,在做具体的业务的时候遇到了一些知识点,于是自己整理出来。如果有后来人需要转行的话,可以用这份资料来参考一下。大牛请忽视以下的内容,小白可以参考下。从数学专业转行到工业界做数据挖掘需要的知识储备:1. Hadoop,HIVE,SQL数据库操作。Hive用于提取数据,做基本的数据分析。hive的基本函数,比如聚合函数,数学函数,字符串的函数,连接表格函数等。hive的各种语句,比如if else,case等语句。EXCEL的基本操作需要掌握,可以进行各种数据的处理、统计分析和辅助决策操作,用熟悉了其实挺方便的。
2. 编程语言
最好会python,c/c++,或者java,至少一种。做机器学习的话感觉用python会多一些。3. 操作系统
Linux系统,脚本语言Shell。4. 数据挖掘和机器学习的基础知识和算法逻辑回归算法 Logistic Regression(LR),
支持向量机算法 Support Vector Machine(SVM),
物质扩散和热传导算法(Heat Spreading),
Gradient Boosting Decision Tree(GBDT),
聚类算法,神经网络算法,决策树,随机森林,异常值检测等常用算法需要掌握。
特征工程的基础知识:根据相应的产品进行必要的特征构造,物品特征,交叉特征等。其中LR使用广泛:由于LR是使用线性方法来处理非线性的问题,导致特征工程十分复杂,交叉项多(二维或者三维的交叉)。工程上的最优化论文推荐:Ad Click Prediction a View from the Trenches需要了解的是相关论文的背景SGD算法,Truncated Gradient算法,RDA算法,FOBOS算法,FTRL算法等。 5. 统计学
时间序列模型,变量的相关系数,ROC和AUC,交叉验证,主成分分析。
6. 业务背景
大数据,推荐系统,计算广告学的科普书籍。以上就是笔者在公司工作半年了的一些简单的总结,如果有啥不正确的地方,还希望大家赐教。

-----------------------------------------------------------------------
工作了一年半之后重新更新了一下帖子:以后有时间会持续更新~
转行数据挖掘和机器学习 - 知乎专栏
3#
姜文浩  4级常客 | 2018-9-28 00:20:04 发帖IP地址来自
了解细基本知识(ng的ml课,课本prml,课本esl 等等)之后就直接刷kaggle的竞赛好了。
4#
田月  2级吧友 | 2018-9-28 00:20:06 发帖IP地址来自
可能会很适合吧,但你必须能独立做出结果,在那之前是没有人会相信你的阳春白雪的。
5#
匿名用户   | 2018-9-28 00:20:07 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:
精华:
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP