數據分析的十二個誤區

在IT領域,炒作越大,誤解越多,數據分析也不例外。分析是當今信息技術最熱門的方面之一,可以帶來巨大的商業收益,但錯誤的觀念可能會阻礙分析能力順利和及時的流轉,從而使商業用戶和最終客戶受益。當企業創建或擴大他們的分析戰略時,以下是他們可能要記住的誤區。

大數據背景7

誤區1:數據分析需要重大投資

這些天來,似乎每一項技術努力都必須經過健全性財務的過濾。當IT和業務經理提議啟動一個項目或部署一個新的工具時,"它將花費多少錢?"是他們首先得到的問題之一。

有些人認為,數據分析本質上是一項昂貴的工作,因此只限于擁有大額預算或大量內部資源的組織。但并不是所有的數據分析工作都需要重大投資,移動和在線房地產服務提供商Trulia的工程副總裁Deep Varma說。

"現在市場上有很多開源以及其他工具,可以幫助你開始展示數據分析的價值,"Varma說。"你需要對你的內部數據存儲以及你要解決的問題有一個很好的了解。云計算也讓你很容易嘗試分析解決一個商業問題"。

現代分析"基于云系統和大數據架構,顧名思義,比傳統的數據倉庫系統要便宜不少,"咨詢公司EY的分析學全球領導人Beatriz Sanz Saiz補充說。

"另外,數據和分析的應用通常是為了實現三個結果:提高流程效率、收入增長和主動風險管理,"Saiz說。"所以總的來說,數據和分析的應用給任何公司都帶來了巨大的成本效益。"

誤區2:您需要大數據來執行分析

對許多人來說,大數據和分析的概念是相輔相成的。他們的想法是,企業在進行分析之前需要收集大量的數據,以產生商業洞察力,改善決策等。

當然,大數據分析的好處已經被充分證實,擁有資源的公司確實可以通過利用其數據存儲作為分析工作的一部分來獲得巨大的競爭優勢。但認為大數據是分析工作的必要條件的想法并不正確。

"很多時候,人們試圖捕捉盡可能多的數據;他們聽到'大數據'就會感到興奮,"人事公司Allegis Global Solutions的商業智能執行總監Tim Johnson說。"人們的誤解是,數據越多越好,機器會把它全部整理出來。"

然而,分析師需要的不是更多的數據,而是具體的數據。"約翰遜說:"95%的用戶正在尋找與他們的工作相關的信息,并支持決策和改善績效。與其關注更多的數據,企業必須考慮業務用戶,不僅要確定他們需要訪問什么數據,還要確定數據的呈現方式。"

約翰遜說:"以多種格式提供對每一點信息的訪問可能會讓人不知所措,而且實際上會扼殺采用。"相反,要找出什么對他們來說是重要的,以及你如何以最簡單的格式向他們展示這些信息"。

誤區3:分析消除了人為偏見

自動化系統的執行方式不應該是有偏見的。但技術是由人類建立的,所以消除所有偏見幾乎是不可能的。有些人認為分析和機器學習消除了人類的偏見。

"不幸的是,這完全不是事實,"全球技術咨詢公司ThoughtWorks的技術主管邁克-梅森說。"算法和分析是使用'訓練數據'進行調整的,并且會重現訓練數據所具有的任何特征。"

梅森說,在某些情況下,這將給分析結果帶來良性偏差;在其他情況下,則會出現更嚴重的偏差。"他說:"僅僅因為'算法這么說'并不意味著答案是公平或有用的。

誤區4:最好的算法總是贏家

實際上,事實證明,只要有足夠的數據,"有時算法并不重要",梅森說。在他引用的一篇IEEE文章"數據的不合理的有效性"中,谷歌工程師認為,簡單的統計模型,加上極其大量的數據,比包含大量特征和總結的"智力超群"的模型取得更好的結果。

"在某些情況下,只要壓縮更大的數據堆就能取得最好的結果,"梅森說。

誤區5:算法是故障安全的

約翰遜說,人們固有的對統計模型和算法的信任程度很高,而且隨著企業建立他們的分析項目,他們越來越依賴復雜的模型來支持決策。

"因為人們不了解模型、算法和其他先進的數據科學實踐,所以他們對它們信任,"約翰遜說。用戶不覺得他們有知識來挑戰這些模型,所以他們必須相信建立這些模型的"聰明人",他說。

"在過去的50到60年里,我們聽說人工智能將在20年內接管這一切,而且我們將繼續聽到人們這樣說,"約翰遜說。"在我們可以公然相信機器學習和結果之前,還有很多地方需要覆蓋。在此之前,我們需要挑戰那些建立算法和模型的人,讓他們解釋答案是如何得出的。這并不是說我們不能依賴結果;而是說我們需要透明度,以便我們能夠信任和驗證分析結果。

誤區6:數據科學是一門神秘的"黑色藝術"

近年來,數據科學這門學科受到了很多關注,有時會讓人對它到底是什么產生混淆?;旧?,它涉及使用算法來尋找數據中的模式。

相關推薦
新聞聚焦
猜你喜歡
熱門推薦
返回列表
Ctrl+D?將本頁面保存為書簽,全面了解最新資訊,方便快捷。
国产青榴视频a片在线观看