纯文科生学习计算机语言学难度大吗?

论坛 期权论坛 期权     
匿名用户   2018-10-15 23:20   32613   7
提示: 作者被禁止或删除 内容自动屏蔽
分享到 :
0 人收藏

7 个回复

倒序浏览
2#
Alison  2级吧友 | 2018-10-15 23:20:42 发帖IP地址来自
04/06/2018 - 添加了正则表达式学习的链接
29/05/2018 - 添加了关于申请可能性的回复
16/03/2018 - 添加了机器学习的链接




正文
难度大,但不是不可能实现。
我本科英语语言文学,研究生语言和语音处理,顺利毕业,目前从事相关工作。研究生的这个项目是专门给没背景的文科生开设的,我根据我们的课程设置和我自己的感受给你一些做准备的建议吧。
[h1]关于申请到的可能性[/h1]很多人在回复和私信里比较关心这个,所以我就拿出来单独说一下。
可能性这个东西是由很多因素决定的,是一个概率问题。并不是说你满足了所有的条件,你就能被录取,因为很有可能项目招满了,也并不是说你的背景很弱,你就一定不会被录取。有次我担心一件事是否能成功,朋友对我说 There's only one way to find out. 尝试一下并不会失去什么呀。所以我在这里惭愧地提供一下我自己的数据和经历,给大家一点安慰和动力,仅供想要申请爱丁堡大学 MSc Speech and Language Processing 这个项目的同学参考


本科 - 三流211,英语语言文学专业,综合绩点3.4/4.0,专业绩点3.7/4.0
数学 - 文科背景,高考数学125+ (没有放在PS里,只是为了有个概念我的数学基础大概是什么水平),GRE数学161,没有学过微积分、概率论、线性代数,大一上学期学过一学期的数学(大概是矩阵、行列式相关的)全部忘光 [微笑]
语言学 - 唯一上过的语言学课是综合语言学,没有系统地学过任何语言学相关的知识,但自己读过一两本语言学相关的书。
雅思 - R 8.5, L 8.5, S 6.5, W 6.5 - 总分7.5
编程 - 在codecademy上自学完成了python的课程。除此以外在递交申请的时候没有任何其他的编程背景和经验。没有接触过任何命令行编程。没有接触过R语言。如果换算成小时大概是20个小时左右。
工作经验 - 我不是应届生,有半年做英语老师的工作经验。(有同学私信提问让我想到这一点,爱大对应届生的绩点要求是3.5,非应届生不太看绩点。如果觉得不保险就工作一年再申请。)
Personal Statement 里提到的软条件 - 有进取心,热爱挑战,不怕走出舒适区,喜欢了解学习新鲜事物。


客观来说我的背景真的是非常非常薄弱,可以说是要啥没啥了。但我仍然幸运地申请到了。就我们当时的项目而言,我的背景既不是最差的也不是最好的。面试的时候我问Simon (Program Director) 我的背景是否会太弱的问题,他说如果你什么都会了,那你还为什么要来这个项目呢?所以其实申请的时候,在英语过关的前提下,对方主要看的是你是不是有学习的热情(比如主动做了哪些相关准备),是不是有快速学习的能力(比如自学的东西学到了一个什么程度),是不是能顺利毕业。


我并没有这个能力提供给你一份清单,告诉你达成清单上的几项就能有多大的成功率,任何人都不能。因为人永远是动态和立体的,一个好的项目,好的导师,也会动态和立体地评价你的申请。这也是离开本科学校以后你应该学会的第一件事情 - 在明确自己目标的前提下,把重点放在“如何提高成功的概率”,而非纠结“我能不能成功”。
[h1]关于准备工作[/h1]一、编程
python
正则表达式 (Regular Expression)
R语言
Shell Script


二、理科知识
概率论 (Probability Theory)
统计 (Statistics)
微积分 (Calculus)
线性代数 (Linear Algebra)
(在 CourseraKhan Academy 上可以找到很多相关课程)


三、语言学
语音学和音系学 (Phonetics and Phonology)
句法学 (Syntax)
语义学 (Semantics)


四、自然语言处理 (Natural Language Processing)
Speech and Language Processing (这本书,非常重要)
数学之美 (豆瓣)


五、机器学习 (Machine Learning)
Coursera: Machine Learning by Andrew Ng (这门课作为机器学习入门非常非常推荐)
Coursera: Deep Learning Specialization


六、其他
PyCharm (Python 集成开发工具)
Vim/Emacs (文本编辑器)
LaTex (论文排版工具)


最后想说,读master的一年除了具体的知识,我学会的最重要的道理就是,学习这件事,不要想难度大不大,get your hands dirty,兵来将挡水来土掩,不要等准备完美了再动手,因为永远准备不完美。
注:如果有关于这个行业,关于爱丁堡这个项目或者其他英国留学和工作的各种问题,欢迎大家来我的值乎提问 :)
3#
PalmDrive  3级会员 | 2018-10-15 23:20:43 发帖IP地址来自
UW老学长前排答题~希望能对你有帮助!

答主背景: 何昊天,华盛顿大学 Computational Linguistics硕士项目,本科毕业于北京语言大学对外汉语专业,现任美国苹果公司Siri语音合成工程师。

华盛顿大学初印象
华盛顿大学位于西雅图,是距离中国最近的一个美国大陆城市。作为一个特别怕热的人,我觉得西雅图环境特别好,一年四季都像春天一样。除了硅谷之外,西雅图是美国科技公司最密集的一个城市,加上现在人工智能发展非常迅速,所以就业机会特别多。



UW有一些很著名的专业是在全美排名前列的。护士护理专业、基础医疗都是全美排名第一的,理工科类专业包括计算机系都是在全美研究型的学校排名前列的。华盛顿大学是在西雅图的downtown,所以吃喝玩乐等等做什么事情很方便,这与大农村型学校形成新生的鲜明。

西雅图怎么样
如果不喜欢雨的话,你可能不会喜欢西雅图,因为西雅图有超过半年的时间都在下雨。
除了下雨没有任何槽点。生活成本低,工作机会多,收入水平高,因为华盛顿州没有周税,所以开出的工资就比其他地区高出一大截。吃喝玩乐的东西比较多,中餐、海鲜也挺多的,可以说是海鲜爱好者的天堂,almon、Alaska crab等都很多,回中国的机票也很便宜,距离也很近,只需要十个小时左右就可以回国。距离加拿大也很近,周末开车去温哥华玩只需要两个小时就到了。

我在UW学什么?



项目介绍
我就读的专业全称叫计算语言学硕士MS in Computational Linguistics,也可以叫自然语言处理,是在华盛顿大学西雅图分校语言学系下面的一个语言学和计算机交叉的跨学科专业,课程是由语言学系、计算机系和统计系等相关科系的课程共同组成的。跟UW一样,有一些学校的Computational Linguistics是在语言学系下面的。但是CMU和Stanford的Computational Linguistics是在计算机系下面的。
计算语言学是一个MS项目,没有提供PhD学位,是一个Professional Program,主要面向就业而不是偏研究型。所以是非常的技术化的一个专业,我们的就业面向就是计算语言学,或者说自然语言处理相关的一些工作。每年大概招30名学生,然后国际生的比例大概占到三分之一。我是2012年唯一一个入学的中国学生。随着现在知名度越来越响之后,现在每一届可能都有4、5名中国学生,也就是说差不多每年都有一半的国际学生是来自于中国的。
UW有一些与Computational Linguistics相关的项目,如信息学院下面的信息管理硕士项目,以及专门研究人机交互的Human Machine InteractionProgram。UW的语言学系开设有理论语言学等一些专业,但是和Computational Linguistics相关性不大。

教授情况
目前有三名专职负责该项目的教授,另外还有一些其他院系的教授参与进来授课。这三位教授的功底都很强,在业界也比较出名,他们做的分支正好是不同的方向,所以三位教授基本上是涵盖了这个领域所涉及全部的知识。一位是Stanford的博士,另一位是MIT的博士。第三位是一名华人教授Xia Fei,他论文产量相对比较多,主要研究的是Statistical Modelling,BiochemicalInformatics,Machine Translation。

课程设置
计算与计算语言学的课程设置由两大部分组成。一部分是语言学基础知识,需要掌握如语音学、句法学、Phonetic Syntax。还有一部分是计算机基础知识。因为是跨学科专业所以他们这两个专业的交叉的一些门类会有一系列课程,如ShallowLanguage Processing, Deep Language Processing等。学生可能会被要求到统计系选修一些课程,如StatisticsModel等,或者一些关于自然语言学应用的课程。研究生阶段必修的课程有:



奖学金
我当时在EE系做关于语音识别的RA。硕士申请到TA基本上是不可能的,当RA还是有机会的,但是opening不是很多,不会像PhD一样会给学生安排工作。学生需要去寻找是否有其他院系的相关研究项目,是否要求申请者有语言学背景的同时又懂计算机。

谁能申请?
我觉得申请Computational Linguistics项目,首先需要对这个领域感兴趣。我的同学基本上都是来自五花八门的领域,可以分为两大类,语言学背景和计算机背景。如果是语言学背景或者是计算机背景的人就特别匹配;其他背景的申请者如果有一些基础的计算机知识,能够通过系里组织的PlacementTest(考察计算机相关的能力,比如编程),就可以顺利就读。
没有GRE的要求,如果有GRE的话是一个加分,达到average水平就可以。托福需要至少100分以上。因为申请需要有跨学科背景,所以对GPA要求不是很高,考虑到华大本身有一个门槛,我觉得需要达到3.5以上。这个项目不是研究型的,不需要套瓷。

先修课程

不同专业的本科在读学生应该怎样满足学校对先修课程的要求:










已经毕业的学生不要担心,也可以做这些准备:



我们毕业后去了哪里?
目前Computational Linguistics可以说是最火的专业,UW在西雅图的认可度也比较高,所以毕业生百分之一百都找到了比较好的工作。再加上西雅图当地有很多高科技公司,每年都有招聘,甚至吸引了大量外地人来西雅图工作。甚至腾讯和阿里巴巴的美国总部都在西雅图,他们现在也在大量招聘自然语言处理相关专业的人。Computational Linguistics的学生毕业后都去了比如亚马逊、微软、Google、Facebook、Apple等相关的企业,做自然语言处理、Software Engineer相关的工作。有一些人计算机技术比较好,了解机器学习,可以做Data Scientist、Machine Learning Scientist;计算机基础不太好的人,也能找到比较基础的计算机和语言学交叉领域的工作,比如Language Engineer
我们毕业的最后一年,系里每天都会推送Daily Job Postings,会有很多的工作机会。每个公司的招聘流程也都不一样,大体上就是先要通过两轮或者三轮电话面试,最后进入一个全天的onsite面试。考察的内容主要是计算机基础,所以计算机基础必须扎实,要掌握Data Structure、核心算法、自然语言处理相关知识,建议多刷题。下图是美国科技公司员工的学校来源,对找工作而言,校友群体的排名比学校排名更重要,这是我在工作中的切身体会!


我工作后的感悟
我毕业已经三四年了,有一些工作中得到的体会想跟学弟学妹们分享。因为我本科学的对外汉语,高中都是文科生,可以说是纯文科的背景。我从文科转到计算机跨度还是非常大的,需要主动的去学习很多新事物。我发现把文科知识跟理科知识相结合起来,能做的事情其实是比想象中多很多。成为一个多学科的人才对以后的工作也是非常有用处的,能够结合不同学科的优势,让自己成为一个不可替代的人才。
苹果的Siri部门半年前发出了一个posting,想要招收一个语音合成方向的工程师。我们想要找一个同时具有语言学背景和计算机背景的人,但是我们一直没有找到特别合适的人选,现在计算语言处理这个领域的人才缺口是很大的。绝大部分申请者是计算机背景的,没有任何文科背景,不太符合我们的要求。公司如果同时招收一个纯计算机背景和一个纯语言背景的人,需要开两份工资,这两个人还要不断磨合沟通。显而易见对于公司来说,一个交叉背景的人才是更加好的选择。所以把文科和计算机结合可以做的事情非常多,跨专业背景的人也是很多公司最需要招收的人才。
本次回答来自棕榈 何昊天
4#
匿名用户   | 2018-10-15 23:20:45 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
5#
棕榈大道  4级常客 | 2018-10-15 23:20:46 发帖IP地址来自
文科生学习计算机语言学是可行的,确实有一定的难度。知乎上已经有计算机语言学的专业人士对这个学科所需要的知识做了比较系统的归纳,我在这里分享一个符合题主所说情况的学生案例吧。


[h1]一、 计算语言学从哪些方面来准备[/h1]作为一个交叉学科,这个专业的人一定是“能文能武”的。
课程方面:


语言学:
不知道题主的“文科”具体是什么。我的学生是法英双语专业出身,她的专业课上直接就包括了“话语分析”。通过专业课的学习,学生了解到如何将相关信息关联、组织和表达,并且被人所理解。我们认为“理所当然”的表达和被理解,其实微妙的被数量原则、质量原则、关联原则、方式原则等基础会话原则所操控。
除了课堂学习之外,学生又主动阅读了大量语言学著作,比如B.布洛赫、G.L.特雷杰《语言分析纲要》和索绪尔的《普通语言学教程》等,加深对句法、语义等的理解。这是计算语言学最重要的理论基础。
计算机方面:
这一块也是大多数文科生,或者转专业申请的学生最为concern的。实话说不是计算机科班出身的人确实难度不小。算法、机器学习等概念对于“码农”们来说是很基础的,但是纯文科生会显得非常难和陌生。这里要给文科同学打鸡血了。刚才介绍的法英双专业的同学是个妹纸,而且是一个非常有决心和毅力的妹纸。自从有了从事自然语言处理(NLP)职业的想法后,她利用大三的寒假时间,参加了一个Python的训练营,高强度的实战训练,让她从最初的零基础,到利用编程来建模用实际数据解决问题。作为文科生,她在中间也遇到过很多困难,但是选择了坚持下来。除此以外,她申请跨到计算机系上了数据结构、机器学习、Java编程等课程,这些基础课的学习,对于一个文科生转到计算机语言学专业是非常重要的。


科研/实习:
计算机语言学是一个应用性很强的专业,仅仅完成一些课程的学习是远远不够的。该同学在申请季前夕参加了一个自然语言处理和深度学习的项目,对她研究生转专业是至关重要的。在该项目中,她独立制作了一个聊天机器人(Chatbot),采用天气预报数据作为素材,进行训练,让机器人可以回答关于某个城市的天气状况和空气质量等信息。该项目中间也遇到了诸多挑战,比如机器人“答非所问”,语调生硬等等,启发她思考如何来加强语义分析和情感识别方面。一些项目中待解决的问题也直接激发了学生继续深造的热情。


[h1]二、 申请美国研究生的策略问题[/h1]正如其他业内知乎答主的所说,美国始终走在计算机语言学的科研前沿。有条件的情况下,申请一个美国的研究生,将成为文科同学走进计算机语言学领域,从事相关工作的一个重要踏板。但是该领域近年来随着“机器学习”“人工智能”等概念变得炙手可热。大量计算机背景的申请者都来申请这个项目,使其难度对于文科背景的申请者来说是很大的。
选校是其中关键一环,这个要根据申请者自身的竞争实力和学校的录取难度以及未来职业规划来综合决定,所谓的“知己知彼”才能“百战不殆”。
而这时候往往申请者对于国外院校的了解也只是学校官网和一些留学网站上面碎片化的信息,对于自身的定位更是难以把控。还有就是搜集和整理这些碎片化的信息,制作自己独特的文书其实也是需要耗费自己大量的时间经历的。
答主在7年间辅导过很多同学进行半 DIY 申请,发现很多同学这个时候也还在努力的刷 GRE、托福成绩,同时大三暑假基本都在做全职的实习,大四上学期申请季也都还有学校的科研项目在做,或者还有几门课程在上。这样的矛盾情况下,其实选择咨询计算语言学亲历过整个申请过程的“过来人”和对近年来积累了大量辅导同学成功案例的老师可以事半功倍。
这里作为棕榈大道的“全能主导师”之一,我就安利一下了。前面所说的同学由于有较好的前期规划,做了很多准备工作,申请季的时候,我们给她安排了在 UW 就读的何学长帮助她分析自身定位,选择了计算机语言学比较有名的几所学校,又避免了以自己所短,来博他人之长(那些纯 CS 的同学在某些特别强调算法和编程背景的学校有很强的竞争)。同时,文书的打造也是重要的环节,个人陈述配合好简历等其他材料,展现申请者独特的优势。通过与申请者详细的沟通,我们深入挖掘她的兴趣,巧妙的展现她独特的“文科”-语言学方面的理解和优势,同时恰到好处的展现她对于自然语言处理方面的热情和清晰的职业规划,最终成功地打动了评审委员会。同学目前已经拿到了 ASU 的 offer,还在争取其他学校的录取。
最后希望文科有志于转计算机语言学的同学们都能勇敢地追随自己的梦想!有关于转专业留学等问题可以添加我们的微信 palmdrivezhihu 详细咨询。
我们创建了一个关于国外名校申请的经历分享的专栏:
国外名校申请经验我们会在该专栏持续更新海外各大名校的申请经验,棕榈大道的 3000+ 导师原创干货分享,如果你也想留学,或者正在申请,那么快来关注吧。
你要走的路,学姐学长们替你探过啦!


查看我们的更多精彩干货回答吧~
真 | 纯干货:
如何自学达到雅思7?
推荐信如何寻找合适的推荐人?
GMAT考700分很难吗?
6#
匿名用户   | 2018-10-15 23:20:48 发帖IP地址来自
提示: 作者被禁止或删除 内容自动屏蔽
7#
湖广总督  1级新秀 | 2018-10-15 23:20:49 发帖IP地址来自
难度大,编程需要很强的逻辑。而这个逻辑大多数文科生却并不具备。或许刚开始写写简单的代码你觉得没什么但当你的代码达到一定量的时候,你会因为逻辑混乱而束手无策。

还有,题主提问之前不加搜索是及其不负责的表现!

以下是知乎上相关问题的答案,供参考
文科生通过考研能否转行当程序员? - 工作
8#
Lincoln Zhou  4级常客 | 2018-10-15 23:20:50 发帖IP地址来自
无法联系上下文给出判断。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:
帖子:24326
精华:1
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP