如何成為(wèi)數(shù)據分析師(shī)
作者: 36大數(shù)據  來源: 36大數(shù)據  發表時間:2016-10-26  點擊:3367

最近(jìn)幾年大數(shù)據的(de)概念比較火(huǒ),越來越多的(de)人感受到數(shù)據的(de)價值,許多公司(sī)都開始招聘數(shù)據分析相關的(de)職位。但(dàn)如果你去看看國內(nèi)的(de)高(gāo)校,會(huì)發現沒有一所大學(xué)開有數(shù)據分析專業的(de),職位的(de)成熟度還不(bù)夠。相比之下,從2003年興起的(de)互聯網産品經理(lǐ)職位,就成熟一些,至少你可以找到大量的(de)書(shū),教你如何成為(wèi)一名産品經理(lǐ)。而數(shù)據分析領域就沒這(zhè)麼幸運了,相關的(de)書(shū)籍雖然也有,但(dàn)總覺得還沒到火(huǒ)候。

都有哪些人想要成為(wèi)數(shù)據分析師(shī)

從我(wǒ)看到想要成為(wèi)數(shù)據分析師(shī)的(de)人大緻有三類:

第一類是非計(jì)算機專業的(de)在(zài)校生,不(bù)知道(dào)怎麼回事,反正就是對數(shù)據感興趣了,然後想畢業之後從事相關工作,但(dàn)對職位要求、該做(zuò)什麼準備一無所知,處于懵懂期;

  第二類是互聯網公司(sī)的(de)産品經理(lǐ)和運營經理(lǐ),及少數(shù)的(de)市(shì)場經理(lǐ)。這(zhè)些人在(zài)實際工作中,發現确實數(shù)據很有用(yòng),但(dàn)對自己的(de)數(shù)據分析能力感到不(bù)滿意,進而想做(zuò)出提升;

  第三類是傳統企業的(de)業務(wù)人員,也是不(bù)知道(dào)怎麼就對數(shù)據感興趣了,想要從事數(shù)據分析相關的(de)崗位,但(dàn)缺少時間系統學(xué)習,工作經曆又(yòu)不(bù)足以支撐自己跳到數(shù)據分析職位

  對于不(bù)同的(de)背景,采用(yòng)一樣的(de)方法去訓練,顯然是不(bù)合理(lǐ)的(de)。我(wǒ)先來講解一下數(shù)據相關的(de)角色以及職責,說(shuō)不(bù)定你認識清楚了就不(bù)想成為(wèi)數(shù)據分析師(shī)了,就可以不(bù)用(yòng)往下看了。如果還有信心,那我(wǒ)就介紹一下要學(xué)習的(de)基礎內(nèi)容,然後再介紹進階的(de)內(nèi)容。

數(shù)據相關的(de)角色

  圍繞數(shù)據分析,主要有六種角色。從平台建設線上,包括:

  數(shù)據平台工程師(shī):負責數(shù)據平台的(de)研發,牽涉到從數(shù)據采集到分析的(de)相關組件(jiàn)開發。

  數(shù)據挖掘工程師(shī):利用(yòng)機器(qì)學(xué)習/數(shù)據挖掘相關技術,研發算法模型,用(yòng)于個(gè)性化(huà)(huà)推薦、用(yòng)戶畫像、精準廣告等。

  數(shù)據産品經理(lǐ):把數(shù)據相關的(de)需求抽象為(wèi)數(shù)據平台的(de)功能産品。

  從數(shù)據流向的(de)角度,包括:

  ETL工程師(shī):把工程團隊的(de)模塊産生的(de)數(shù)據,不(bù)管是日志、數(shù)據表,還是埋點的(de)數(shù)據,進行(xíng)清洗、轉換,建模成利于數(shù)據分析的(de)數(shù)據。ETL是Extract–Transform–Load的(de)縮寫。

  數(shù)據分析師(shī):利用(yòng)ETL工程師(shī)處理(lǐ)好(hǎo)(hǎo)的(de)數(shù)據,滿足業務(wù)人員的(de)數(shù)據需求。

  業務(wù)人員:産品、運營、市(shì)場、管理(lǐ)層等,因為(wèi)産品改進、運營活動、商業決策等,有數(shù)據需求

數(shù)據分析師(shī)的(de)職責範圍

  通過上面的(de)角色劃分,我(wǒ)們可以清楚數(shù)據分析師(shī)在(zài)整個(gè)數(shù)據版圖中的(de)位置。數(shù)據分析師(shī)一方面要和業務(wù)人員打交道(dào),滿足業務(wù)人員的(de)數(shù)據需求,另一方面,要借助ETL工程師(shī)建模好(hǎo)(hǎo)的(de)數(shù)據,以及數(shù)據平台工程師(shī)開發的(de)平台,來更高(gāo)效的(de)完成工作。

  有些公司(sī)在(zài)人員緊缺的(de)情況下,會(huì)把ETL工程師(shī)要做(zuò)的(de)工作,也安排給數(shù)據分析師(shī),這(zhè)樣對數(shù)據分析師(shī)的(de)開發能力和建模能力,就會(huì)有更高(gāo)的(de)要求。最後一點是提供洞察,前面的(de)工作更多的(de)是被動的(de),數(shù)據分析師(shī)還要主動的(de)發現數(shù)據中的(de)異常,将這(zhè)些異常指導業務(wù)。

  看了這(zhè)些工作內(nèi)容,可能并不(bù)會(huì)覺得特别高(gāo)大上。我(wǒ)曾經有個(gè)組員,幹了一年多的(de)數(shù)據統計(jì)工作,覺得整天寫腳本太枯燥了,堅決要求再也不(bù)做(zuò)相關工作了。其實數(shù)據分析師(shī)如果做(zuò)的(de)不(bù)好(hǎo)(hǎo),就會(huì)發現自己無非是在(zài)“取數(shù)”。業務(wù)人員提了需求,然後把要的(de)數(shù)據給提取出來,自己就是一個(gè)流水(shuǐ)線工人,沒有一點成就感。

  這(zhè)裡(lǐ)發揮一下抽象能力,就可能把一些重複的(de)“取數(shù)”工作給解決掉,用(yòng)機器(qì)代替人工。所以理(lǐ)解業務(wù),提供自己的(de)思考與抽象,很重要。

數(shù)據分析師(shī)的(de)基本要求

  對數(shù)據感興趣:是不(bù)是看到一行(xíng)行(xíng)的(de)數(shù)字就頭大,選擇直接跳過?還是願意花(huā)些時間研究這(zhè)些數(shù)字背後意味著(zhe)什麼?如果你看蘋果的(de)發布會(huì)的(de)話,會(huì)看到喬布斯的(de)幻燈片裡(lǐ)出現最多的(de)就是數(shù)字,賣了多少部,分了多少錢(qián),厚度減少到多少毫米之類的(de),他(tā)相信數(shù)字簡單明了。

  如果對數(shù)據不(bù)感興趣,這(zhè)個(gè)角色一定不(bù)适合你。

  良好(hǎo)(hǎo)的(de)理(lǐ)解和抽象能力:把業務(wù)人員說(shuō)的(de)隻言片語,抽象為(wèi)明确的(de)數(shù)據需求,清楚怎麼從基礎數(shù)據中實現出來。還有把一些重複性的(de)需求,抽象出模式來,用(yòng)機器(qì)來替代。

  良好(hǎo)(hǎo)的(de)表達能力:數(shù)據分析師(shī)有個(gè)天然的(de)優勢,能夠直接和老闆打交道(dào),這(zhè)就要求你能站在(zài)老闆的(de)層面來表達。把一堆堆的(de)數(shù)據,很好(hǎo)(hǎo)的(de)呈現給業務(wù)人員,幫助他(tā)們做(zuò)出正确的(de)決策。

  快速動手能力:業務(wù)人員提的(de)數(shù)據需求,巴不(bù)得下一秒都拿到。

  興趣是可以培養的(de),既然願意看這(zhè)篇文章,說(shuō)明有興趣。理(lǐ)解、表達、動手能力,是要有意識的(de)訓練。數(shù)據分析的(de)專業能力,是可以通過學(xué)習提升的(de)

數(shù)據分析師(shī)要學(xué)習的(de)內(nèi)容

  統計(jì)學(xué):我(wǒ)看一些人推薦了不(bù)少統計(jì)學(xué)的(de)專業書(shū)籍,直接把人吓跑了。我(wǒ)自己就大學(xué)時候學(xué)過《概率論與數(shù)理(lǐ)統計(jì)》,其他(tā)統計(jì)相關的(de)內(nèi)容也沒怎麼看過。對于互聯網的(de)數(shù)據分析來說(shuō),并不(bù)需要掌握太複雜的(de)統計(jì)理(lǐ)論。所以隻要按照(zhào)本科(kē)教材,學(xué)一下統計(jì)學(xué)就夠了。

  一是讓你相信統計(jì)本身(shēn)是一門(mén)科(kē)學(xué),這(zhè)不(bù)是星座算命。

  二是在(zài)研究數(shù)據時,知道(dào)一些特征是負責統計(jì)學(xué)規律的(de)。我(wǒ)在(zài)剛參加工作時,看到百度知道(dào)過億的(de)用(yòng)戶訪問,但(dàn)每天訪問的(de)量波動不(bù)超過3%,感覺太神奇了。

  編程能力:學(xué)會(huì)一門(mén)編程語言,會(huì)讓你處理(lǐ)數(shù)據的(de)效率大大提升。如果你隻會(huì)在(zài)Excel上複制粘貼,動手能力是不(bù)可能快的(de)。我(wǒ)比較推薦Python,上手比較快,寫起來比較優雅。

  數(shù)據庫:數(shù)據分析師(shī)經常和數(shù)據庫打交道(dào),不(bù)掌握數(shù)據庫的(de)使用(yòng)可不(bù)行(xíng)。學(xué)會(huì)如何建表和使用(yòng)SQL語言進行(xíng)數(shù)據處理(lǐ),可以說(shuō)是必不(bù)可少的(de)技能。

  數(shù)據倉庫:許多人分不(bù)清楚數(shù)據庫和數(shù)據倉庫的(de)差異,簡單來說(shuō),數(shù)據倉庫記錄了所有曆史數(shù)據,專門(mén)設計(jì)為(wèi)方便數(shù)據分析人員高(gāo)效使用(yòng)的(de)。 

  數(shù)據分析方法:對于互聯網數(shù)據分析人員來說(shuō),可以看一下《精益創業》和《精益數(shù)據分析》,掌握常用(yòng)的(de)數(shù)據分析方法,然後再根據自己公司(sī)的(de)産品調整,靈活組合。

  數(shù)據分析工具:SAS、Matlab、SPSS這(zhè)些工具經常有人推薦,我(wǒ)要說(shuō)的(de)是在(zài)互聯網公司(sī)一般都用(yòng)不(bù)上。

  做(zuò)可視(shì)化(huà)(huà)的(de)Tableau,統計(jì)分析的(de)友盟、百度統計(jì),還有像我(wǒ)們神策分析等。

  這(zhè)些工具本身(shēn)不(bù)一定能滿足你的(de)所有需求,但(dàn)會(huì)讓數(shù)據分析變的(de)更高(gāo)效。我(wǒ)自己整理(lǐ)過一個(gè)豆瓣書(shū)列,有興趣的(de)可以看看:數(shù)據分析師(shī)豆列。上面的(de)內(nèi)容學(xué)習後,隻能說(shuō)成為(wèi)一名合格的(de)數(shù)據分析師(shī)。

  要成為(wèi)高(gāo)級數(shù)據分析師(shī)的(de)話,一方面是要強化(huà)(huà)對業務(wù)的(de)理(lǐ)解,最好(hǎo)(hǎo)是做(zuò)到通過數(shù)據分析幫助公司(sī)決策方向,或者說(shuō)促進企業快速增長(cháng)。另一方面,要加強機器(qì)學(xué)習/數(shù)據挖掘的(de)專業知識學(xué)習,将機器(qì)學(xué)習成為(wèi)數(shù)據分析的(de)手段。比如預測用(yòng)戶的(de)流失,對用(yòng)戶進行(xíng)自動分類等。你能提供的(de)價值就大不(bù)相同了。最後,要強調的(de)是,數(shù)據分析師(shī)是一個(gè)實踐的(de)職位,要在(zài)實際項目中不(bù)斷的(de)訓練,才能成為(wèi)高(gāo)手

服(fú)務(wù)項目

維保運維服(fú)務(wù)

信息系統集成服(fú)務(wù)

機房(fáng)搬遷服(fú)務(wù)

 
 
 
QQ 在(zài)線客服(fú)
QQ 在(zài)線客服(fú)
 
電話:
0531-88818533
客服(fú)QQ
2061058957
1905215487