數據科學專業(yè)是近幾年新興的專業(yè),目前各個高校的研究生專業(yè)中都有涉及到,它是計算機科學下的一個具體的分支專業(yè)。
(資料圖)
這兩年數據科學專業(yè)可以說是越來越火了,近兩年有更多的院校開設了數據科學專業(yè)相關的課程,甚至被納入英國內政部緊缺職業(yè)清單,該專業(yè)的畢業(yè)生無論是選擇在英國求職還是回國發(fā)展,都有著非常廣闊的就業(yè)前景。
什么是數據科學?
數據科學Data Science是從數據中提取知識的研究,關鍵是科學。起初叫"datalogy"。最初在1966年由Peter Naur提出,用來代替"計算機科學"。
數據科學集成了多種領域的不同元素,包括信號處理,數學,概率模型技術和理論,機器學習,計算機編程,統(tǒng)計學,數據工程,模式識別和學習,可視化,不確定性建模,數據倉庫,以及從數據中析取規(guī)律和產品的高性能計算。數據科學并不局限于大數據,但是數據量的擴大誠然使得數據科學的地位越發(fā)重要。
數據科學的從業(yè)者被稱為數據科學家。數據科學家通過精深的專業(yè)知識在某些科學學科解決復雜的數據問題。不遠的將來,數據科學家們需要精通一門、兩門甚至多門學科,同時使用數學,統(tǒng)計學和計算機科學的生產要素展開工作。所以數據科學家就如同一個team。
數據科學使用到數學、統(tǒng)計、信息科學和計算機科學等各個學科的技術和理論,特別是以下分支:機器學習、分類、聚類分析、數據挖掘、數據庫和可視化。大多數院校的Data Science屬于STEM學科。
數據科學主要研究內容有以下三類
Predictive Analytics
分析數據來預測未來可能發(fā)生的事情
Descriptive Analytics
分析數據找出過去事件的特征和正在發(fā)生事件的趨勢
Prescriptive Analytics
分析數據來找出最佳措施、取得最優(yōu)化的結果
海外專業(yè)分支與課程設置
大數據專業(yè)是橫跨數學、計算機、金融還有商科等專業(yè)的交叉學科,目前英美等國家開設的大數據專業(yè)方向主要是四個方向:
1、數據科學 (Data Science)
將數學和統(tǒng)計學課程作為核心,搭配以SQL和Python等編程技能課程,包括數據架構,到計算機工程,再到編程等;
2、商業(yè)分析 (Business Analytics)
商業(yè)分析碩士學位專注于數據應用,以研究消費者、市場和世界經濟趨勢;
3、信息系統(tǒng) (Information Systems)
大多數信息系統(tǒng)是基于現成的計算機架構、語言和系統(tǒng)進行的信息收集、組織和整合的工作,信息系統(tǒng)的碩士學位課程通常面向對商業(yè)環(huán)境中的技術管理崗位
4、運籌學和相關工程學 (Operations Research)
該專業(yè)的學習采用如數學建模,統(tǒng)計分析和數學優(yōu)化,運算研究來為復雜的決策問題找到最優(yōu)的解決方案;
商業(yè)分析從它的名字就可以看出來,這個專業(yè)會包含一些商科類型的課程,比如說管理課,經濟學課等等。數據科學主要針對的就是統(tǒng)計、數據科學這些方向的。機器學習就是我們人學習到東西之后,需要讓機器學習,并幫我們去處理大量的數據等等。
這四個專業(yè)的必修課內容都是相似的,主要學data science、統(tǒng)計學、還有一些教數據可視化處理的課程。其他的選修課就大同小異,就算是相同的專業(yè),在不同的院校開設的選修課也是會有區(qū)別的,大家可以根據自己的喜好或者職業(yè)發(fā)展方向去進行選修課的選擇。
上圖很直觀的表達了數據科學作為一門交叉學科的知識結構組成,也符合了大部分項目的課程設置。數據科學是在數據基礎之上,運用計算機和數理統(tǒng)計的知識,在某一個具體領域(商業(yè)、IT、醫(yī)療等)解決具體問題。
核心課程
數據科學中的計算機系統(tǒng)
Computer Systems for Data Science
數據科學中的機器學習
Machine Learning for Data Science
數據科學中的算法
Algorithms for Data Science
數據科學中的統(tǒng)計與概率論
Probability and Statistics for Data Science
探索性數據分析和可視化
Exploratory Data Analysis and Visualization
統(tǒng)計推理與建模
Statistical Inteference and Modeling
數據科學大作業(yè)
Data Science Capstone and Ethics
海外申請
數據科學專業(yè)是近幾年才剛剛新興的專業(yè),本科階段少有開設,所以它招生的專業(yè)范圍是非常廣,比如計算機、統(tǒng)計學、數學甚至經濟學、工商管理、會計學、市場營銷等等,也都是可以去申請數據科學專業(yè)的。
如果本科專業(yè)是數學、計算機科學等相關度高的專業(yè),在申請時大家要好好在自己的相關課程、研究經歷上做功課。如果本科專業(yè)相關度低,就需要通過非學校經歷,比如網絡課程、編程競賽、科研經歷等來證明你的能力?;虮究齐A段的選課建議需要涉及計算機編程的課程,比如JAVA、Python,還有統(tǒng)計學,數學等,不需精通但建議多少要了解一些。
前期留學準備
主要是分為硬實力和軟實力兩個部分
硬實力一般指的是三維成績以及一些能夠量化的標準:
英語:去學校官網查詢雅思或者托福要求,語言成績是硬性標準,要重視起來提前做好準備。
GPA:是申請中的重點,data science 是math stats和computer science的結合,有涉及這兩個學科的課程且成績比較好,對于申請是非常有幫助的。
軟實力包括推薦信、文書、ps以及科研實習經歷等:
推薦信:大部分的學校都至少需要兩到三封推薦信,你的任課老師,實驗室做科研的教授,你實習的上司,都可以是推薦信的來源。這里有個公式:大牛強推>寫得出彩的強推>其他;可以看出推薦信最重要的是推薦人的地位和可信度;
實習:實習的關鍵不在多在于“精”,申請專業(yè)相契合的實習比公司名頭重要的多;
科研:高含金量的科研經歷,一定是錄取的加分項,能夠讓學校清楚的認識到你對這門專業(yè)的熱情、以及你所具備的學習這門專業(yè)的能力,也是能夠幫助你從眾多同質化申請學生當中脫穎而出的關鍵!
在審核完你的申請材料之后,各種硬件條件都過關的話,有的學校是會有研究生面試的,可能會問到編程知識,如果你答不上來,那大概率是不會被錄取的。
數據科學的就業(yè)方向
在領英的就業(yè)報告中,數據科學被列為最近三年內最具前景的職業(yè)之一。主要的就業(yè)方向是在政府數據中心、金融機構、互聯網企業(yè)等單位從事大數據分析師、大數據應用開發(fā)工程師等工作。
1、Data Scientist 數據科學家
以高級建模為主,需要較深的領域知識,也包含算法到產品的轉化;
2、Data Engineer 數據(庫)工程師
以開發(fā)、管理和維護數據庫為主,也包括優(yōu)化數據獲取流程,搭建數據庫環(huán)境等工作;
3、Machine Learning Engineer 機器學習工程師
以開發(fā)機器學習系統(tǒng)并解決實際產品問題為主,對編程能力有較高要求;
4、Data Analyst 數據分析師
以數據清理/分析為主,為數據驅動的決策服務。需要掌握金融/運籌/經濟/市場等知識;