智行千里,“人文”為本:可視化文本分析將引領(lǐng)人工智能3.0時(shí)代

2020年第二季度的Forrester Wave分析報(bào)告中,SAS被評(píng)為基于AI的文本分析領(lǐng)域領(lǐng)導(dǎo)者。

2020年7月20日,中國(guó)北京 — 近日,全球領(lǐng)先的獨(dú)立研究機(jī)構(gòu)Forrester發(fā)布2020年第二季度的Forrester Wave分析報(bào)告。與往年有所不同,今年的報(bào)告首次將“基于人工智能的文本分析平臺(tái)”的分析主題分為“文檔數(shù)據(jù)”和“個(gè)人數(shù)據(jù)”兩大方向。而作為全球數(shù)字分析領(lǐng)域的領(lǐng)導(dǎo)者,SAS憑借多年以來(lái)在文本分析上的技術(shù)深耕以及人工智能上的創(chuàng)新成果,同時(shí)被Forrester Wave分析報(bào)告評(píng)為基于人工智能的“文檔數(shù)據(jù)”和“個(gè)人數(shù)據(jù)”文本分析雙領(lǐng)域的領(lǐng)導(dǎo)者。

眾所周知,大部分的商業(yè)相關(guān)信息都是以非結(jié)構(gòu)化格式(主要是文本數(shù)據(jù))而存在的,但是由于近年來(lái)數(shù)據(jù)的爆發(fā)式激增,不僅使本來(lái)非結(jié)構(gòu)化的數(shù)據(jù)被進(jìn)一步沉積,也讓數(shù)據(jù)質(zhì)量更加糅雜。倒逼之下,越來(lái)越多的企業(yè)竭力尋找更高效、更智能的工具來(lái)獲得快速增長(zhǎng)的數(shù)據(jù)并從中挖掘出可實(shí)現(xiàn)的價(jià)值。但是,一些錯(cuò)綜復(fù)雜的因素(比如:價(jià)格、專(zhuān)家評(píng)定、學(xué)習(xí)過(guò)程、時(shí)間)成為企業(yè)尋找“得手”工具的阻礙??梢暬谋痉治銎脚_(tái)的出現(xiàn),能幫助企業(yè)擺脫這種“進(jìn)退兩難”的境地,并讓收集信息比以前更加簡(jiǎn)單。可視化文本分析平臺(tái)讓每一個(gè)人都能夠在數(shù)據(jù)驅(qū)動(dòng)基礎(chǔ)上增加決策程序,同時(shí)這個(gè)平臺(tái)也可成為一些綜合商業(yè)智能計(jì)劃的重要成分。

“對(duì)于不同的行業(yè)領(lǐng)域,任何企業(yè)和機(jī)構(gòu)都可從海量的非結(jié)構(gòu)化數(shù)據(jù)中挖掘出深刻洞察和巨大商業(yè)價(jià)值”。SAS公司高級(jí)產(chǎn)品市場(chǎng)經(jīng)理Katie Tedrow表示:“文本分析確實(shí)可以幫助企業(yè)機(jī)構(gòu)解決復(fù)雜的業(yè)務(wù)問(wèn)題,例如偵測(cè)欺詐行為、評(píng)估客戶(hù)反饋等,但是傳統(tǒng)的分析流程更傾向于勞動(dòng)密集型,更依賴(lài)手動(dòng)操作且需要更多的人力投入。SAS可視化文本分析(SAS Visual Text Analytics)則通過(guò)自然語(yǔ)言處理(NLP)、機(jī)器學(xué)習(xí)和語(yǔ)言規(guī)則等強(qiáng)大功能,幫助商業(yè)用戶(hù)輕松挖掘非結(jié)構(gòu)化數(shù)據(jù)背后隱藏的價(jià)值,制定商業(yè)決策并提升用戶(hù)體驗(yàn)?!?/p>

以“人文”為本,透視非結(jié)構(gòu)化數(shù)據(jù)中蘊(yùn)藏的金礦

針對(duì)結(jié)構(gòu)化數(shù)據(jù)的可視化在許多公司中成為最優(yōu)也是最便捷的文本分析方式。但是無(wú)法回避的是,許多企業(yè)仍然被淹沒(méi)在巨大的數(shù)據(jù)量以及文本數(shù)據(jù)源快速增長(zhǎng)的洪流當(dāng)中。因此許多的數(shù)據(jù)都夾雜了大量的非結(jié)構(gòu)化數(shù)據(jù)。

文本數(shù)據(jù)一直存在且隨處可見(jiàn)。這些數(shù)據(jù)可以在你公司內(nèi)部的郵件信息、聊天記錄以及搜集到的調(diào)查結(jié)果中得到,也可以是你對(duì)個(gè)人網(wǎng)站上的評(píng)論、對(duì)客戶(hù)關(guān)系管理系統(tǒng)中的評(píng)論或者是從你使用的個(gè)人應(yīng)用程序中得到的文本字段。甚至是你在公司外部的社會(huì)媒體、論壇以及來(lái)自于一些你很感興趣的話(huà)題的評(píng)論。因此,這些文本數(shù)據(jù)零散且冗雜,對(duì)于企業(yè)而言針對(duì)這些非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行文本分析有些“入不敷出”。所以有些企業(yè)現(xiàn)在正投資幾十億美金分析結(jié)構(gòu)化數(shù)據(jù),卻對(duì)非結(jié)構(gòu)化數(shù)據(jù)置之不理。

熟不知,無(wú)論是各類(lèi)文檔數(shù)據(jù),還是能夠描繪用戶(hù)畫(huà)像的個(gè)人數(shù)據(jù),在這些非結(jié)構(gòu)化數(shù)據(jù)中都蘊(yùn)藏著有用的信息寶庫(kù),利用數(shù)據(jù)可視化工具分析非結(jié)構(gòu)化數(shù)據(jù)能夠幫助企業(yè)快速地了解現(xiàn)狀、顯示趨勢(shì)并且識(shí)別新出現(xiàn)的問(wèn)題。在Forrester Wave基于人工智能的文檔數(shù)據(jù)和個(gè)人數(shù)據(jù)文本分析平臺(tái)兩大分析報(bào)告中,SAS可視化文本分析秉持“人文為本”的研發(fā)和優(yōu)化策略,在諸多子類(lèi)別評(píng)選中均獲得了最高分,包括:子文檔分析、機(jī)器學(xué)習(xí)能力、架構(gòu)、安全性、產(chǎn)品支持及服務(wù)、全球市場(chǎng)表現(xiàn)等。

兩份報(bào)告都指出:“SAS可視化文本分析進(jìn)一步完善了自身強(qiáng)大的分析產(chǎn)品和解決方案組合,它主要基于SAS Viya 平臺(tái),不僅能夠?qū)崿F(xiàn)不同應(yīng)用場(chǎng)景之間的數(shù)據(jù)共享和模型管理,更輔以杰出的商業(yè)智能、便捷的分析圖形用戶(hù)界面和其他微服務(wù)架構(gòu),為企業(yè)和用戶(hù)提供絕佳的用戶(hù)體驗(yàn)?!?/p>

讓機(jī)器決策,賦能文本分析引領(lǐng)人工智能3.0時(shí)代

事實(shí)上,“人工智能”正式提出時(shí),計(jì)算機(jī)國(guó)際象棋和機(jī)器翻譯就是人工智能的兩個(gè)標(biāo)志性目標(biāo),但直到國(guó)際象棋甚至圍棋都被人工智能所攻克,機(jī)器認(rèn)知智能的核心能力之一,即自然語(yǔ)言處理(NLP)能力依然無(wú)法和人類(lèi)相比。

NLP大致包含三個(gè)技術(shù)層面:詞法分析、句法分析、語(yǔ)義分析,三者之間既遞進(jìn)又相互包含,這也構(gòu)成了NLP技術(shù)的最大瓶頸。由于詞句往往在具體的場(chǎng)景下?lián)碛胁煌暮x,人在理解時(shí)會(huì)基于已有知識(shí)儲(chǔ)備和上下文環(huán)境,然而人工智能目前還很難做到。要讓機(jī)器理解我們?nèi)祟?lèi)的語(yǔ)言,機(jī)器必需共享與我們類(lèi)似的背景知識(shí),還需要依賴(lài)深度學(xué)習(xí)技術(shù),這也就需要大規(guī)模甚至超大規(guī)模的數(shù)據(jù)積累,讓機(jī)器不斷訓(xùn)練和學(xué)習(xí)。

SAS公司副總裁兼大中華區(qū)董事總經(jīng)理何偉信表示:“回首人工智能發(fā)展的60多年,我們經(jīng)歷了“算法為重”的1.0階段,現(xiàn)在則進(jìn)入“數(shù)據(jù)凸顯”的2.0階段,但真正步入“讓機(jī)器做明智決策”的3.0階段,還需要大量數(shù)據(jù)積累和技術(shù)的提升。因此,實(shí)現(xiàn)認(rèn)知智能不僅是當(dāng)前人工智能領(lǐng)域發(fā)展的重要使命,更是SAS未來(lái)幾年不斷探索追求的終極目標(biāo)?!?/p>

SAS可視化文本分析就融合了智能算法、NLP、機(jī)器學(xué)習(xí)等創(chuàng)新技術(shù),自動(dòng)抽取非結(jié)構(gòu)化數(shù)據(jù)中的關(guān)系和模式,從而使手動(dòng)分析成為歷史。NLP工具可幫助用戶(hù)進(jìn)行情感分析,將語(yǔ)音轉(zhuǎn)化為文本,理解自然語(yǔ)言并生成自然語(yǔ)言。例如,通過(guò)NLP訪(fǎng)問(wèn)和分析未挖掘的數(shù)據(jù),使金融機(jī)構(gòu)能夠提高反洗錢(qián)(AML)調(diào)查的管理效率和精準(zhǔn)度。采用自動(dòng)化分析后,調(diào)查人員可以使用統(tǒng)一的風(fēng)險(xiǎn)識(shí)別手段來(lái)應(yīng)對(duì)負(fù)面新聞監(jiān)測(cè)、交易單據(jù)違規(guī)監(jiān)控等繁雜的業(yè)務(wù)場(chǎng)景。這使得用戶(hù)能夠了解各個(gè)事件的風(fēng)險(xiǎn)級(jí)別,然后優(yōu)先調(diào)查風(fēng)險(xiǎn)最大的事件。

以“知的力量”,讓智能分析服務(wù)人類(lèi)社會(huì)健康發(fā)展

一直以來(lái),SAS都秉持“知的力量”,對(duì)其簡(jiǎn)單易用且功能強(qiáng)大的自動(dòng)化分析平臺(tái)進(jìn)行完善和升級(jí),以幫助數(shù)字顛覆者和新興領(lǐng)導(dǎo)者開(kāi)辟前進(jìn)的道路。最新版的SAS Viya 、SAS平臺(tái)、SAS可視化文本分析等均加入人工智能相關(guān)的創(chuàng)新技術(shù),尤其在機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、NLP以及其它支持人工智能的技術(shù)領(lǐng)域大舉發(fā)力。

特別是SAS近年來(lái)宣布將投資10億美元用于人工智能,在此基礎(chǔ)上SAS還將改進(jìn)計(jì)算機(jī)視覺(jué)軟件,以幫助企業(yè)利用可視化數(shù)據(jù)來(lái)改善業(yè)務(wù)成果?!拔覀円恢辈粩嗤菩小牧α俊?qiáng)調(diào)智能創(chuàng)新,這一點(diǎn)清晰地體現(xiàn)在SAS平臺(tái)和SAS人工智能技術(shù)中。創(chuàng)新推動(dòng)著領(lǐng)先的公司、管理人員和數(shù)據(jù)科學(xué)家通過(guò)應(yīng)用高級(jí)分析來(lái)改變其公司、行業(yè)的發(fā)展軌跡,甚至為人類(lèi)社會(huì)謀福祉”。SAS首席執(zhí)行官Jim Goodnight表示。

因此,正值疫情期間,SAS還發(fā)布了COVID-19科學(xué)文獻(xiàn)搜索與文本分析平臺(tái),該平臺(tái)為研究人員提供了免費(fèi)的可視化文本分析環(huán)境,憑借強(qiáng)大的人工智能和機(jī)器學(xué)習(xí)技術(shù),讓相關(guān)人員能夠從數(shù)以萬(wàn)計(jì)的研究文獻(xiàn)中檢索最需要的文本內(nèi)容,不僅讓研究人員能夠更快、更精準(zhǔn)地找到潛在的解決方案,同時(shí)也為疫情防控做出貢獻(xiàn)。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )

贊助商
2020-07-20
智行千里,“人文”為本:可視化文本分析將引領(lǐng)人工智能3.0時(shí)代
2020年第二季度的Forrester Wave分析報(bào)告中,SAS被評(píng)為基于A(yíng)I的文本分析領(lǐng)域領(lǐng)導(dǎo)者。

長(zhǎng)按掃碼 閱讀全文