成功大數據團隊的「三駕馬車」

對於那些著手嘗試大數據應用的企業來說,成敗的關鍵是組建一個優秀的大數據團隊,但是不要指望一個「首席數據官(CDO)」或者數據科學家搞定所有的事情,成功的大數據團隊需要三駕馬車:一位業務分析師、一位機器學習專家和一位數據工程師。
隨著報表軟體企業應用的火熱開展,數據科學家正在鬧人才荒,可謂一將難求,但是Lithium公司的首席科學家Michael Wu博士在接受IW採訪時表示:數據科學家的人才荒是因為人們對數據科學家的期望值過高,希望他即懂業務也懂最先進的大數據技術,這樣的人才自然是奇貨可居,而且不是每個企業有錢就能招募到的。
「三個臭皮匠頂個諸葛亮」,對於大多數企業來說,與其指望一位大數據「救世主」,不如重點關注如何搭建一個成功的大數據團隊。
Wu博士認為,數據科學家這個稱謂被過度炒作了,實際上人們口中的數據科學家對應著多個職位:「當人們嚷嚷數據科學家人才匱乏的時候,實際上他們指的是同時具備多個職位技能的人才缺乏。而企業完全能夠通過將業務分析師、機器學習專家和數據工程師這三類人才捏合成一個團隊來代替數據科學家。」
業務分析師這個角色早在數據科學家之前就已經出現了,業務分析師使用前端工具分析企業核心業務數據並給出能支撐決策的分析結果,這些工具包括Excel、Tableau的數據可視化工具或者QlikView的商業智能應用。財務報表業務分析師通常也有足夠的編程技能來開發儀錶盤,對SQL和NoSQL也不陌生。
隨著大數據的熱潮到來,很多業務分析師開始自我標榜為數據科學家,「但實際上他們不是」,Wu博士說道。不過,根據Alteryx的預測,掌握大數據分析技術的業務部門分析人員將比大數據科學家對企業更加重要。這意味著2014年數據科學家的高工資難以持續。
大數據團隊的第二個重要角色是機器學習專家,他們開發演算法和數據模型來處理數據,甚至提供預測分析,例如分析消費意向。一些機器學習演算法甚至能自動為圖片和視頻加標籤,或者向消費者提供精確的推薦服務(例如Netflix)。
大數據團隊的第三個重要角色是數據工程師,他們是大數據團隊的基石,他們直接面對Hadoop、MapReduce、HBase、Cassandra這樣的大數據技術。大數據工程師的興趣在於採集、存儲和處理數據,以便演算法團隊能在其上建模。

FineRepor報表免費下載——零編碼做報表、多維圖表、多源填報、許可權管理,完美兼容excel。官網:http://www.finereport.com/tw/

时间: 2024-11-10 01:18:30

成功大數據團隊的「三駕馬車」的相关文章

大數據時代的經營

維克托•邁爾•舍恩伯格所著的<大數據時代>是國外大數據研究的經典之作,維克托認為,大數據時代,人們處理數據的方式從抽樣分析,發展為對全體數據的分析.相應的,人們的思維模式也從原來的因果邏輯思維,逐漸演變成關聯思維. 在經驗時代,當所有人都在盲人摸象的時候,企業之間比拼的是決策者的頭腦和思維.當進入大數據時代,僅僅有思維和頭腦已經不夠了,因為有人已經站在大數據頂端,全面地看到了整頭大象,只知道埋頭工作不知道抬頭看方向的企業,是要被淘汰的.今天企業做經營決策不能再依靠經驗模式,而是要用大數據分析的

數據準備是大數據分析的無名英雄

隨著企業花越來越多的時間來分析數據,清理和準備數據的解決方案將會變得更有價值 現在大數據[注]是熱門話題,你在任何地方與任何人交談很難不提到大數據.事實上,大數據的術語有點被過度使用,它對不同的人意味著不同的東西,但所有這些定義都有一個共同點,那就是數據! 上面我們說大數據依賴於數據,這似乎很明顯,但大數據分析的成功需要的不僅僅是原始數據,還需要好的高質量數據.所以,更準確的說法應該是,大數據的成功需要準備好的數據.對於分析,有句古老的格言,「進來是垃圾,出去也是垃圾」,這意味著如果你把大量參差

解決數據質量問題是大數據應用的關鍵

研究稱,整個人類文明所獲得的全部數據量,有90%是最近兩年內產生的.隨著移動互聯大潮的席捲,預計通過網路產生的數據量還將呈幾何級增長.龐大的數據資源蘊藏著無限的寶藏,過去的一年無論是企業.政府還是媒體,都在談論大數據.有人說大數據是黃金.是競爭力,然而在這一切談論的背後卻鮮有人關注數據質量這個最根本的問題.普元數據產品總監王軒認為,大數據處理的關鍵就是解決數據質量問題,規避數據錯誤.保障數據質量才能真正讓企業從大數據應用中獲得利益.保障數據質量成為大數據發揮價值的先決條件「企業做數據集成.數據處

大數據時代浪潮的「弄潮兒」

進入2015年,海量的數據正在迅速膨脹並變大,它決定著企業的未來發展,雖然現在企業可能並沒有意識到數據爆炸性增長帶來的問題的隱患,但是隨著時間的推移,人們將越來越多的意識到數據對企業的重要性. 面臨海量數據的挑戰 大數據(big data)是時下非常熱門的話題,大數據是用來描述和定義信息爆炸時代產生的海量數據.大數據的發展能夠為人們獲得更為深刻.全面的洞察能力提供前所未有的空間與潛力,那麼如何看待大數據給IT市場帶來的機遇和挑戰呢? 紐約時報網站此前刊載文章稱,大數據時代已經來臨並且正在對每個領

「一根手指」背後的大數據生意

大家好!我是識益科技的聯合創始人劉志彬. 首先,在場的朋友,請伸出你的一根手指,大家想想看,一根手指能做什麼呢?能提起一個袋子,能捋下頭髮,扶下眼鏡,摳一下鼻子對吧!但,今天,我要給大家分享:這根手指,如何改變我們的整個生活. 大家看下我手裡的卡包,尤其是女孩子都不陌生吧.銀行卡,購物卡,美容卡,美甲卡,玩具卡...這些都是我老婆一個人的.這麼多卡,太麻煩了.首先,出門不能全帶著吧.今天我想去咖啡店喝咖啡,還要在裡面折騰找一回.還有,在郊區吃了一家新館子,送了張會員卡,下次不知道哪年哪月能來,這

大數據的「真面目」及其運用

大數據的定義 近年來,人們對「大數據」的關注度日益提高.這都歸因於麥肯錫全球研究院在2011年發布的研究報告.該報告認為人們即將迎來一個利用規模大到超出現有數據處理系統能力的巨量信息時代,並暗示戰略性地利用這些信息數據,就有可能產生巨大的商業機會. 那麼大數據到底是什麼呢?從字面來看,它指的是以現有信息處理技術無法應對的龐大信息量.而實際上,當我們將儲蓄了各種服務的使用信息數據與用戶的屬性信息相結合,並在這些信息數據發生時能夠全量獲取,就被稱做大數據. 典型的是互聯網服務的利用數據.另外還包括零

保障「舌尖」安全 大數據應用有錢「數」

兩會期間,空氣.水.食品安全等問題依然是關注熱點.針對食品安全風險如何把控的話題,昨日,全國政協委員嚴琦.全國政協委員杜惠平.全國政協委員彭靜等接受商報記者採訪時均建議,新的市場環境下,除了完善的制度體系建設,解決食品安全問題更需要藉助更新的技術和服務.而隨著移動互聯網.大數據等先進技術手段在食品安全領域的應用,配套建設誠信資料庫.移動APP等將迎來商機. 現狀 食品追溯體系 推廣率亟待提高 食品安全關係千家萬戶,保障「舌尖」安全目前還有哪些方面需要完善? 全國政協委員嚴琦表示,在2010年和2

生物醫學大數據:現狀與展望

大數據 (big data) 是指由於容量太大和過於複雜,無法在一定時間內用常規軟體對其內容進行抓取.管理.存儲.檢索.共享.傳輸和分析的數據集. 大數據具有「4V」特徵:①數據容量 (Volume) 大,常常在 PB(1 PB=250 B)級以上:②數據種類 (Variety) 多,常常具有不同的數據類型(結構化.半結構化和非結構化)和數據來源:③產生和更新速度 (Velocity) 快(如實時數據流),時效性要求高:④科學價值 (Value) 大,儘管利用密度低,卻常常蘊藏著新知識或具有重要

大數據時代的不平等問題

一家國際著名保險公司與提供大數據的公司合作,推出一款針對不同駕車群體的保險計劃.這一計劃的要點是,由大數據公司對不同潛在客戶的駕車習慣進行分析,如果數據表明某位客戶是白天上班,路也近,而且所經過的地帶是安全路線,客戶駕車習慣良好,沒有特別情緒化舉動,那麼,給其所賣的保險可以打折:反之,如果數據表明某位客戶是上夜班,上班地點也遠,所經過的路線有風險,客戶駕車習慣也不好,常無法控制自己的行為,那麼,保險公司將提高其所繳納保費額度.從商業角度看,保險公司這樣做,是為了更精確地細分市場,賺取更高利潤,這