剛畢業(yè)的大學生們,恭喜你們!歡迎成為勞動者的一員。在你所有可能申請的工作中,“數據科學家”這個風騷無比的職位也許最難得到的一個,同時也許是最具有潛在豐厚回報的一個。但是別害怕:Datanami在這里以一個實際數據科學家從業(yè)者的身份給你一些建議,告訴你怎樣成為他們中的一員。
開始成為數據科學家的第一條建議是別被這個職位的要求所挫敗。沒有一個剛畢業(yè)的大學生能滿足即是數學\統(tǒng)計天才,又精通市場、產品、網絡安全,還是專業(yè)的Python、Java、R程序員。(提示:這就是為什么數據科學家被稱為獨角獸——因為他們不存在)
“在數據科學的屏蔽傘下隱藏著許多的技能,我們不能期望一個人能精通里面的所有東西?!盉ooz Allen Hamilton的數據科學家Kirk Borne說,“數據科學家人才短缺的最好解決方案是組成一個數據科學家團隊。所以我建議有應該精通兩個多個領域的同時對其他領域也能有一個基本的了解”
根據Kirk Borne所說的,你需要抓緊好好溫習數據科學的核心技能,例如,機器學習、信息管理、統(tǒng)計學以及數據信息可視化。同時你也需要懂得數據庫的周邊知識和數據結構,最少掌握幾門像Python、R、SAS、Spark這樣的編程語言。熟悉圖分析、自然語言處理、最優(yōu)化也能使你的數據科學簡歷更好看一些。還需要進行數據建模和一些模擬練習。
“對學習物理學、生物學、天文學、化學或其它科學的學生來說,一個好消息是他們可以很容易地將它們的科學技能轉換到數據科學這一領域”他說。
你應該返回學校繼續(xù)修煉嗎?
盡管最近數量可觀的博士級別的數據科學編程者的出現一定程度上解決著這個“獨角獸”短缺的問題,可是你不想再在學校待太長時間。一個碩士學位就已經足夠了。Borne如是認為。
“最近越來越多的機構愿意雇傭既有一定課堂知識,又有一定實際經驗的中等學位的數據科學家?!彼麑atanami.說“學位最終對職業(yè)提升是十分重要的(對于一個包含商業(yè)分析的MBA來說也許是最重要的),所以要重視獲得你的學位——它只是在你剛開始從事數據科學家職業(yè)之前不是必須的?!?/p>
Hadoop服務提供商Qubole的CEO也針對評估做出了回應。雖然具有所需的如數學、數據挖掘、統(tǒng)計學、概率論、SQL等堅實背景,數據科學家還是有很多路要走,最終要從象牙塔進入產業(yè)界來獲得最重要的元素:有趣的數據。
“在產業(yè)界去獲得這些技能是十分重要的”Apache Hive聯合創(chuàng)造者Thusoo說“你有堅實的知識基礎,但是為I了運用這些技能你需要獲得數據。很多有趣的數據集是和現實產業(yè)緊緊綁在一起的?,F在不再像20或30年前那樣——絕大多數的數據都在研究機構”。
現在頂級的數據科學家去學校不再是研究成為一個數據科學家,而是為了學習成為一個計算機科學家、天體物理學家(就像Borne)、化學工程師、或者理論物理學家。隨著世界的前進,這些艱澀的科學和數學技能被證明對于處理日益增長的數據是無價的、彌足珍貴的。
“圍繞數據進行思考是第一要義”Thusoo說“現成的工具和編程語言之類的你能很容易學會使用。無論是Python實現的、Scale實現的、Java實現的還是其他語言實現的,隨機森林算法就是隨機森林算法。你需要理解的是在哪里使用適合的技術,而不是怎樣用代碼實現這些技術。”
南方衛(wèi)理公會大學統(tǒng)計科學的副教授、數據科學碩士項目主任Dr. Monnie McGee說在大數據領域統(tǒng)計學也扮演著很重要的角色。
“統(tǒng)計和計算機科學都是很重要多的技能”她說“然而作為一個統(tǒng)計學領域的個體,我偏向地認為在數據科學領域統(tǒng)計訓練對于一個個體來說是相當重要的”。
有統(tǒng)計方面的訓練并不僅僅是能使用正確的統(tǒng)計方法或運行相關的軟件,她說,“我的意思是有U能力做出能被測試的假設,適當的采集數據,設計方案評估數據中的噪點和信息,在問題的上下文環(huán)境層面解釋結果。”她說。
耐心,年輕人
不要期望在你22歲時就能解決世界上的數據科學問題。實際上要成為一個數據科學家需要多年的訓練和經驗,為數眾多的失敗,不被打到的毅力。
伊利諾斯理工學院計算機科學與數據科學碩士項目主任Shlomo Engelson Argamon說,要想在數據科學領域做出成績需要很多不同領域的經驗?!靶枰獢的糠倍鄺l目繁雜的工具和技能”Argamon繼續(xù)說道“真正深入研究它們需要消耗多年多的時間和經驗,對于一個剛剛踏入數據科學領域的人,關鍵是抓住其中每一個領域的基礎原理,有能力使用一兩種方法和工具。倘若一個人基礎知識掌握的比較好的話,其它工具和叫技術會很容易地學會?!?/p>
有人預言,軟件的發(fā)展將最終取代對數據科學家的需求。這種言論甚囂塵上,從業(yè)的數據科學家群體也混淆了這個。
根據Borme的說法,數據庫科學家具有堅實的經驗基礎,統(tǒng)計學、機器學習、數據處理方面的知識的事實使得他們區(qū)分于現成的軟件包有有很大的優(yōu)勢?!皫е@些天賦和能力,靈活的數據科學家能夠學習和運用新的軟件包,新的編程技術,許多組織中天才人物新創(chuàng)造的方法”,他說。
“因此,”Borme繼續(xù)說到“分析軟件包的發(fā)展不會像人們預測的那樣取代數據科學家的需求。但是它的發(fā)展肯定會取代一些數據科學家的技能需求(如Java和Hadoop),雖然不是全部取代:我認為我們都需要通曉一種編程語言(Pyython、R、SAS),可預見的將來SQL也是需要的。”
軟技能問題
你也許是能夠在一個單一范圍內跳躍數十億行數據的核心數量分析專家。但那不會自動的成功轉換到數據科學圈。除了基礎數學、技術技能,還要有軟技能”如謙虛、好奇、果斷。SMU的McGee如是說。
“謙虛是必須的,因為經常數據沒有告訴我們想要知道的”她說“我們不得不足夠謙遜去接受和解釋數據真正告訴我們的。因為好奇心對于持續(xù)質詢問關于們周圍的世界的問題和找到這些問題的答案是非常重要的。又因為這些答案不是直接可用的甚至有時不能解決這些問題,所以我們需要果斷的選擇”數據科學家要不斷的告訴自己“我知道存在解決的方法”,直到描繪出解決方法前腦子一直是堵塞的。數據科學家是錯誤的?是否存在一個解決方法?查看一下其中之一的特征就行了(See trait one)?!?/p>
IIT的Argamon鼓勵剛要從事數據科學的人preserver through這份工作最艱難的部分?!皵祿治鲋械拇蠖鄶倒ぷ魇?#8217;數據苦差事’——轉化雜亂的數據集,相處怎樣結合不同數據格式問題的解決方案,處理錯誤和缺失的數據項,探索數據的整體形狀,測試和丟棄不同的模型等等?!彼f“如果你想有尋找數據隱藏的東西的洞察力,你必須精力充沛,有堅強的毅力,這是在任何教育項目中不會傳授的品質,盡管他們能夠通過建庫的訓練逐步獲得”
“我的第一個建議永遠是興趣第一”最近離開喬治梅森大學去Booz Allen Hamilton的私人部門研究數據科學的borme說“你需要知道你擅長什么,你關心什么,你追求什么”。
走一條什么樣的路是每個萌生從事數據科學的人都需要處理的一個挑戰(zhàn)。你也許天生擅長數學、處理問題、交際或后天再大學或其它教育機構獲得了編程和數據處理技能。很幸運,你可以將很多產業(yè)中使用這些技能,從科學研究和網絡安全到市場和金融?!皩W習物理學、生物學、天文學、化學或其它科學的學生來說,一個好消息是他們可以很容易地將它們的科學技能轉換到數據科學這一領域”他說。
成為一名數據科學家
對于很多人來說成為一個數據科學家是一個理想的工作(也許就是你)。Borme說你可以優(yōu)先記住“作為一個成功的數據科學家,你的每一天都在計算你的幸福——你通過使用數據解決現實世界的問題正生活在你的夢想之中?!彼f。
Borme想起了一個關于Jeffrey Hammerbacher的Fastcompany故事,他是一個天才數據科學家,從Facebook離職去幫助建立Cloudera.“如果你認為你稀缺的技能(數據科學)在其他地方可以得到更好的使用,大膽的離開就行了?!?/p>
Via:好酷網
End.
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 網信辦嚴打網絡侵害未成年人行為,守護成長新篇章
- 豆包大模型升級引爆股市,字節(jié)緊急警示:小心為上
- 小米YU7無偽裝實車首次曝光引熱議,小紅書封號事件沖上熱搜,科技圈又掀波瀾?
- 警惕討好型人格:賺錢路上,人格魅力并非一切
- 小米SUV墜崖一家四口奇跡生還,車主回應:別夸大其詞
- 金融AI大模型新突破:奇富科技AI產品小奇引領行業(yè),重塑金融未來
- 谷歌攜手Apptronik,AI+機器人引領未來:商業(yè)化人形機器人新紀元
- AI盛宴即將上演!李想回歸,理想汽車12月25日揭秘未來駕駛新篇章
- 特斯拉Model Y勁敵來襲!明年登陸英國市場的未來樂道L60引爆期待
- 火山引擎總裁回應豆包大模型定價:如何確保合理毛利,揭秘行業(yè)內幕
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。