DataVisor維擇科技創(chuàng)始人兼CEO謝映蓮近日在《福布斯》上發(fā)表了她對大數(shù)據(jù)發(fā)展的見解,她認為推動下一次大數(shù)據(jù)浪潮的動力不是“集中數(shù)據(jù)”,而是“集中智能”的能力。“集中智能”指運用有效的工具優(yōu)化企業(yè)各部門的工作流程,運用先進的特征工程直接從原始數(shù)據(jù)中獲取智能見解并輸出有預見性的決策。
▽以下為原文譯文
數(shù)據(jù)對現(xiàn)代數(shù)字經(jīng)濟的運作至關重要。但是,僅有數(shù)據(jù)并不能自動轉(zhuǎn)換為可操作的智能能力,也不會自動推動數(shù)字經(jīng)濟繁榮發(fā)展。想要在全球數(shù)字經(jīng)濟中取得成功,除數(shù)據(jù)外,還需要先進的操作工具和解決方案,從而大規(guī)模獲得可行的智能見解。
當前,不少企業(yè)仍停留在用大量集中式的數(shù)據(jù)驅(qū)動企業(yè)發(fā)展的階段,但是,從數(shù)據(jù)安全和隱私保護等角度出發(fā),我們應該從“集中數(shù)據(jù)”向“集中智能”過渡。
2015年,IBM指出:“當今世界90%的數(shù)據(jù)是在過去兩年中創(chuàng)建的。”回頭看這段數(shù)字化之路,我們提升了數(shù)據(jù)解釋、創(chuàng)建數(shù)據(jù)圖表、圖形和可視化效果的能力,同時也增強了數(shù)據(jù)分析能力。為了在企業(yè)級利用這些能力,我們還開發(fā)了集中式數(shù)據(jù)分析方法使企業(yè)和機構(gòu)能夠受益。
如今,AI和機器學習等變革性技術(shù)快速崛起,智能能力也隨之變得異常復雜,同時,“集中數(shù)據(jù)”和“集中智能”之間出現(xiàn)了溝壑。在“集中數(shù)據(jù)”階段,我們?nèi)栽谶M行可視化的數(shù)據(jù)管理和數(shù)據(jù)分析解釋,努力找出趨勢并嘗試理解它們。當我們進入到“集中智能”階段時,意味著數(shù)據(jù)不僅停留在解釋階段,“集中智能”能夠預測性地創(chuàng)建可行的智能見解,并有效采取大規(guī)模實時的行動。重要的是,可操作的智能位于系統(tǒng)內(nèi)部,它是集中式的。
什么是集中式?集中式不是一個新概念。數(shù)據(jù)規(guī)模和復雜性的快速增長使企業(yè)難以管理自己的信息。因此,企業(yè)往往朝著集中團隊、工具和流程的方向去發(fā)展。表面上看,集中式代表了企業(yè)對大數(shù)據(jù)增長趨勢的積極應對。不少企業(yè)在實現(xiàn)降本增效的路上努力,并取得了不同程度的成功。但實際上,還有一些企業(yè)停留在只“集中數(shù)據(jù)”而不是“集中智能”的階段,而“集中數(shù)據(jù)”的成本和效率收益仍然有限。
鑒于當今數(shù)字經(jīng)濟的需求,數(shù)據(jù)安全的壓力和用戶體驗的競爭都在不斷增加。大數(shù)據(jù)智能已成為當代最有價值的商品。但對于大多數(shù)企業(yè)而言,“集中智能”仍然是一個遙不可及的目標,主要原因是許多企業(yè)普遍缺乏先進的特征工程的能力。特征工程對于構(gòu)建智能系統(tǒng)至關重要。特征能從大數(shù)據(jù)中發(fā)掘出的可行見解,這些見解轉(zhuǎn)換為智能來供AI算法使用,也就是說,通過特征來釋放出大數(shù)據(jù)的力量。
那么,為什么先進的特征工程尚未得到廣泛的應用呢?因為特征工程必須手動完成,這是一個復雜且耗時的工作。在迎接各類業(yè)務挑戰(zhàn)時,需要大量有效特征去應對,這是個很難克服的困難。
實時生成高質(zhì)量的特征需要大量專業(yè)領域的知識,來自專家豐富的經(jīng)驗能夠支持特征工程輸出特征的價值、適用性、相關性,并且還能對操作進行有效優(yōu)化。除此之外許多因素影響著特征工程的質(zhì)量和效率,比如,在準備好生產(chǎn)就緒的代碼之前,數(shù)據(jù)科學團隊和特征工程團隊需要詳細溝通;復雜特征的創(chuàng)建需要考慮可擴展性;大規(guī)模獲取智能見解也需要耗費大量內(nèi)存等。先進的算法帶來了巨大的復雜性,對數(shù)千個數(shù)據(jù)點進行實時全面分析,在流程上仍需進行大量優(yōu)化。
如果一個系統(tǒng)仍舊依賴于手動操作,該系統(tǒng)是無法真正實現(xiàn)智能的。對于企業(yè)來說,要提高模型性能、提升效率、優(yōu)化靈活性并采取實時行動是至關重要的,同時,企業(yè)內(nèi)不同團隊的能力和獨立性也非常重要。這意味著:自動化和定制之間的平衡將很關鍵。
如果某個領域的專業(yè)知識可以被應用在處理特定業(yè)務問題上,那就意味著一些標準化特征也有機會被應用在自動化模型的構(gòu)建。通過自動化的能力,直接從原始數(shù)據(jù)中獲得新特征。比如,在欺詐檢測領域中,影響檢測精度的關鍵特征是IP地址,如果能從原始數(shù)據(jù)的一個IP地址中自動提取可用特征,那自動化能力、準確性和效率都將大大提高。
先進的特征工程本質(zhì)上是“集中智能”在實踐中的體現(xiàn)。因為它代表了一種高效、大規(guī)模地從大量眾多來源的原始數(shù)據(jù)中集中提取可操作的智能見解的能力,并且這些智能見解能夠?qū)崟r對其他諸多領域產(chǎn)生積極影響。
重塑企業(yè)的大數(shù)據(jù)系統(tǒng),既是縱向的過程,也是橫向的過程??v向角度來看,“集中智能”的目標是使組織中的每個團隊都能利用數(shù)據(jù)做出貢獻,并獲取智能見解。橫向角度看,“集中智能”需要在所有相關用例和業(yè)務場景中實現(xiàn)集中智能風控的目標。
先進的實時特征工程能推進企業(yè)的現(xiàn)代化進程,加速并優(yōu)化企業(yè)的風控模式,從而確保更安全,更高效,更繁榮的數(shù)字經(jīng)濟發(fā)展。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )