大數(shù)據失敗案例提醒:8個(gè)不(bù)能犯的(de)錯誤
作者:CIO時代  來源:CIO時代  發表時間:2016-12-20  點擊:3483
      近(jìn)年來,大數(shù)據旋風以“迅雷不(bù)及掩耳之勢”席卷全球,不(bù)僅是信息領域,經濟、政治、社會(huì)等諸多領域都“磨刀霍霍”向大數(shù)據,準備在(zài)其中逐得一席之地(dì)。然而,很多公司(sī)在(zài)邁入大數(shù)據領域後遭遇“滑鐵盧”。在(zài)此,本文盤點了一系列大數(shù)據失敗項目,深究其原因,具有警示意義。

對數(shù)據過于相信


2008年,Google第一次開始預測流感就取得了很好(hǎo)(hǎo)的(de)效果,比美國疾病預防控制中心提前兩禮拜預測到了流感的(de)爆發。但(dàn)是,幾年之後,Google的(de)預測比實際情況(由防控中心根據全美就診數(shù)據推算得出)高(gāo)出了50%。媒體過于渲染了Google的(de)成功,出于好(hǎo)(hǎo)奇目的(de)而搜索相關關鍵詞的(de)人越來越多,從而導緻了數(shù)據的(de)扭曲。

低估大數(shù)據複雜程度


在(zài)美國有幾個(gè)互聯網金融公司(sī)專做(zuò)中小企業貸款。但(dàn)是中小企業貸款涉及的(de)數(shù)據更複雜,而且中小企業涉及到整個(gè)行(xíng)業非常特殊的(de)一些數(shù)據,比如非标準的(de)财務(wù)報(bào)表和不(bù)同行(xíng)業、不(bù)同範式的(de)合同,他(tā)們沒有很專業的(de)知識,是很難理(lǐ)解或者很難有時間把它準确挖掘出來。

當時大數(shù)據團隊想用(yòng)一個(gè)很完美的(de)模型把所有的(de)問題都解決掉,比如把市(shì)場和信貸的(de)解決方案全部用(yòng)一個(gè)模型來解決,但(dàn)因為(wèi)數(shù)據的(de)複雜程度,最後證明這(zhè)種方法是失敗的(de),而且90%的(de)時間都在(zài)做(zuò)數(shù)據清理(lǐ)。這(zhè)就說(shuō)明,想通過大數(shù)據技術一下子(zi)解決所有的(de)問題是很難成功的(de),而是要用(yòng)抽絲剝繭、循序漸進的(de)方式。

管理(lǐ)層的(de)惰性


某家旅遊公司(sī)系統通過web日志數(shù)據的(de)挖掘來提升客戶洞察。結果證明,用(yòng)戶在(zài)浏覽網站之後,随後的(de)消費行(xíng)為(wèi)模式與管理(lǐ)層所認為(wèi)的(de)不(bù)一緻。當團隊彙報(bào)此事時,管理(lǐ)層認為(wèi)不(bù)值一提。但(dàn)是,該團隊并沒有放棄,并通過嚴密的(de)A/B測試,回擊了管理(lǐ)層的(de)輕視(shì)。

這(zhè)個(gè)案例的(de)最終結果,不(bù)是每個(gè)CIO都能期盼的(de)。但(dàn)是,有一點是可以确定的(de):做(zuò)好(hǎo)(hǎo)和管理(lǐ)層打交道(dào)的(de)準備,讓他(tā)們充分理(lǐ)解大數(shù)據是什麼以及相應的(de)價值。

應用(yòng)場景選擇錯誤


一家保險公司(sī)想了解日常習慣和購買生命保險意願之間的(de)關聯性。由于随後覺得習慣太過于寬泛,該公司(sī)将調查範疇限定到是否吸煙上。但(dàn)是,工作仍然沒有實質進展。不(bù)到半年,他(tā)們就終止了整個(gè)項目,因為(wèi)一直未能發現任何有價值的(de)信息。

這(zhè)個(gè)項目的(de)失敗是由于問題的(de)複雜性。在(zài)抽煙與否之間,該公司(sī)沒有注意到還有大片灰色地(dì)帶:很多人是先抽煙而後又(yòu)戒煙了。在(zài)将問題簡單化(huà)(huà)動機的(de)驅動下,這(zhè)個(gè)部分被忽略了。

問題梳理(lǐ)不(bù)夠全面


一家全球性公司(sī)的(de)大數(shù)據團隊發現了很多深刻的(de)洞察,并且計(jì)劃通過雲讓全公司(sī)共享。結果這(zhè)個(gè)團隊低估了效率方面的(de)損耗,由于網絡擁塞的(de)問題,無法滿足全球各個(gè)分支順暢提交數(shù)據運行(xíng)分析的(de)需求。

該公司(sī)應該仔細思考下如何支撐大數(shù)據項目,梳理(lǐ)所需的(de)技能并協調各IT分支的(de)力量進行(xíng)支持。由于網絡、安全或基礎設施的(de)問題,已經有太多的(de)大數(shù)據項目栽了跟頭。

缺乏大數(shù)據分析技能


一家零售公司(sī)的(de)首席執行(xíng)官不(bù)認同亞馬遜規模化(huà)(huà)、扁平化(huà)(huà)的(de)服(fú)務(wù)模式,因此讓CIO構建一個(gè)客戶推薦引擎。項目最初的(de)規劃是半年為(wèi)期,但(dàn)是團隊很快認識到諸如協同過濾(collaborativefiltering)之類的(de)概念無法實現。為(wèi)此,一個(gè)團隊成員提出做(zuò)一個(gè)“假的(de)推薦引擎”,把床單作為(wèi)唯一的(de)推薦産品。這(zhè)個(gè)假引擎的(de)工作邏輯是:買攪拌機的(de)人會(huì)買床單,買野營書(shū)籍的(de)人會(huì)買床單,買書(shū)的(de)人會(huì)買床單。就是如此,床單是唯一的(de)、默認的(de)推薦品。

盡管可笑(xiào)(xiào),這(zhè)個(gè)主意其實并不(bù)壞,默認的(de)推薦也能給企業帶來銷售上的(de)提升。但(dàn)是,由于大數(shù)據相關技能的(de)缺失,真正意義上的(de)引擎未能實現。

提出了錯誤的(de)問題


一家全球領先的(de)汽車制造商決定開展一個(gè)情感分析項目,為(wèi)期6個(gè)月,耗資(zī)1千萬美元。項目結束之後,該廠商将結果分享給經銷商并試圖改變銷售模式。然後,所得出的(de)結果最終被證明是錯誤的(de)。項目團隊沒有花(huā)足夠的(de)時間去了解經銷商所面臨的(de)問題或業務(wù)建議(yì),從而導緻相關的(de)分析毫無價值。

應用(yòng)了錯誤的(de)模型。某銀(yín)行(xíng)為(wèi)判斷電信行(xíng)業的(de)客戶流失情況,從電信業聘請(qǐng)了一位專家,後者也很快構建了評估用(yòng)戶是否即将流失的(de)模型。當時已進入評測驗證的(de)最後階段,模型很快就将上線,而銀(yín)行(xíng)也開始準備給那些被認為(wèi)即将流失的(de)客戶發出信件(jiàn)加以挽留。

但(dàn)是,為(wèi)了保險起見,一位內(nèi)部專家被要求對模型進行(xíng)評估。這(zhè)位銀(yín)行(xíng)業專家很快發現了令人驚奇的(de)事情:不(bù)錯,那些客戶的(de)确即将流失,但(dàn)并不(bù)是因為(wèi)對銀(yín)行(xíng)的(de)服(fú)務(wù)不(bù)滿意。他(tā)們之所以轉移财産(有時是悄無聲息的(de)),是因為(wèi)感情問題——正在(zài)為(wèi)離(lí)婚做(zuò)準備。

可見,了解模型的(de)适用(yòng)性、數(shù)據抽象的(de)級别以及模型中隐含的(de)細微差别,這(zhè)些都是非常具有挑戰性的(de)。

管理(lǐ)層阻力


盡管數(shù)據當中包含大量重要信息,但(dàn)FortuneKnowledge公司(sī)發現有62%的(de)企業領導者仍然傾向于相信自己的(de)直覺,更有61%的(de)受訪者認為(wèi)領導者的(de)實際洞察力在(zài)決策過程中擁有高(gāo)于數(shù)據分析結論的(de)優先參考價值。

選擇錯誤的(de)使用(yòng)方法


企業往往會(huì)犯下兩種錯誤,要麼構建起一套過分激進、自己根本無法駕馭的(de)大數(shù)據項目,要麼嘗試利用(yòng)傳統數(shù)據技術處理(lǐ)大數(shù)據問題。無論是哪種情況,都很有可能導緻項目陷入困境。

提出錯誤的(de)問題


數(shù)據科(kē)學(xué)非常複雜,其中包含專業知識門(mén)類(需要深入了解銀(yín)行(xíng)、零售或者其它行(xíng)業的(de)實際業務(wù)狀況);數(shù)學(xué)與統計(jì)學(xué)經驗以及編程技能等等。很多企業所雇用(yòng)的(de)數(shù)據科(kē)學(xué)家隻了解數(shù)學(xué)與編程方面的(de)知識,卻欠缺最重要的(de)技能組成部分——對相關行(xíng)業的(de)了解,因此最好(hǎo)(hǎo)能從企業內(nèi)部出發尋找數(shù)據科(kē)學(xué)家。

缺乏必要的(de)技能組合


這(zhè)項理(lǐ)由與“提出錯誤的(de)問題”緊密相關。很多大數(shù)據項目之所以陷入困境甚至最終失敗,正是因為(wèi)不(bù)具備必要的(de)相關技能。通常負責此類項目的(de)都是IT技術人員——而他(tā)們往往無法向數(shù)據提出足以指導決策的(de)正确問題。

與企業戰略存在(zài)沖突


要讓大數(shù)據項目獲得成功,大家必須擺脫将其作為(wèi)單一“項目”的(de)思路(lù)、真正把它當成企業使用(yòng)數(shù)據的(de)核心方式。問題在(zài)于,其它部門(mén)的(de)價值或者戰略目标有可能在(zài)優先級方面高(gāo)于大數(shù)據,這(zhè)種沖突往往會(huì)令我(wǒ)們有力無處使。

大數(shù)據孤島


大數(shù)據供應商總愛談論“數(shù)據湖”或者“數(shù)據中樞”,但(dàn)事實上很多企業建立起來的(de)隻能算是“數(shù)據水(shuǐ)坑兒”,各個(gè)水(shuǐ)坑兒之間存在(zài)著(zhe)明顯的(de)邊界——例如市(shì)場營銷數(shù)據水(shuǐ)坑兒與制造數(shù)據水(shuǐ)坑兒等等。需要強調的(de)是,隻有盡量緩和不(bù)同部門(mén)之間的(de)隔閡并将各方的(de)數(shù)據流彙總起來,大數(shù)據才能真正發揮自身(shēn)價值。

在(zài)大數(shù)據技術之外遇到了其它意外狀況。數(shù)據分析僅僅是大數(shù)據項目當中的(de)組成部分之一,訪問并處理(lǐ)數(shù)據的(de)能力同樣重要。除此之外,常常被忽略的(de)因素還有網絡傳輸能力限制與人員培訓等等。

回避問題


有時候我(wǒ)們可以肯定或者懷疑數(shù)據會(huì)迫使自身(shēn)做(zuò)出一些原本希望盡量避免的(de)運營舉措,例如制藥行(xíng)業之所以如此排斥情感分析機制、是因為(wèi)他(tā)們不(bù)希望将不(bù)良副作用(yòng)報(bào)告給美國食品藥品管理(lǐ)局并承擔随之而來的(de)法律責任。

在(zài)這(zhè)份理(lǐ)由清單中,大家可能已經發現了一個(gè)共同的(de)主題:無論我(wǒ)們如何高(gāo)度關注數(shù)據本身(shēn),都會(huì)有人為(wèi)因素介入進來。即使我(wǒ)們努力希望獲取對數(shù)據的(de)全面控制權,大數(shù)據處理(lǐ)流程最終還是由人來打理(lǐ)的(de),其中包括衆多初始決策——例如選擇哪些數(shù)據進行(xíng)收集與分析、向分析結論提出哪些問題等等。

為(wèi)防止大數(shù)據項目遭遇失敗,引入叠代機制是非常必要的(de)。使用(yòng)靈活而開放的(de)數(shù)據基礎設施,保證其允許企業員工不(bù)斷調整實際方案、直到他(tā)們的(de)努力獲得理(lǐ)想的(de)回饋,最終以叠代為(wèi)武器(qì)順利邁向大數(shù)據有效使用(yòng)的(de)勝利彼岸。

獲取更多專業資(zī)訊

微信掃一掃

服(fú)務(wù)項目

維保運維服(fú)務(wù)

信息系統集成服(fú)務(wù)

機房(fáng)搬遷服(fú)務(wù)

 
 
 
QQ 在(zài)線客服(fú)
QQ 在(zài)線客服(fú)
 
電話:
0531-88818533
客服(fú)QQ
2061058957
1905215487