12月4日,在AWS re:Invent全球大會(huì)上,AWS發(fā)布五項(xiàng)新的人工智能 (AI) 服務(wù),旨在將機(jī)器學(xué)習(xí)交到更多應(yīng)用程序開(kāi)發(fā)者和終端用戶手中,而他們無(wú)需機(jī)器學(xué)習(xí)經(jīng)驗(yàn),也能輕松使用AI。
這五項(xiàng)AI新服務(wù)分別是:
1、Amazon Kendra重塑企業(yè)搜索,它利用自然語(yǔ)言處理及其它機(jī)器學(xué)習(xí)技術(shù),將企業(yè)內(nèi)部的多個(gè)數(shù)據(jù)孤島統(tǒng)一起來(lái),始終如一地為常見(jiàn)查詢(xún)提供高質(zhì)量的結(jié)果,而不是以隨機(jī)的鏈接列表響應(yīng)關(guān)鍵字查詢(xún);
2、Amazon CodeGuru可幫助軟件開(kāi)發(fā)者自動(dòng)執(zhí)行代碼審核,確定應(yīng)用中開(kāi)銷(xiāo)最大的代碼行;
3、Amazon Fraud Detector基于為Amazon.com開(kāi)發(fā)的相同技術(shù),幫助企業(yè)實(shí)時(shí)識(shí)別線上身份欺詐和支付欺詐;
4、Amazon Transcribe Medical為醫(yī)療保健提供商提供高精度的、實(shí)時(shí)語(yǔ)音到文本轉(zhuǎn)錄,以便他們可以專(zhuān)注于患者護(hù)理;
5、Amazon Augmented Artificial Intelligence (A2I) 幫助機(jī)器學(xué)習(xí)開(kāi)發(fā)者通過(guò)人工確認(rèn)驗(yàn)證機(jī)器學(xué)習(xí)預(yù)測(cè)。
具體而言
Amazon Kendra
盡管多年來(lái)多種嘗試,但內(nèi)部搜索對(duì)于當(dāng)今的企業(yè)來(lái)說(shuō)仍是一個(gè)棘手的問(wèn)題,大多數(shù)員工仍然經(jīng)常難以找到他們需要的信息。機(jī)構(gòu)擁有大量非結(jié)構(gòu)化文本數(shù)據(jù),如果能夠發(fā)現(xiàn)、存儲(chǔ)多種格式并跨不同的數(shù)據(jù)源(例如Sharepoint、Intranet、Amazon S3和本地文件存儲(chǔ)系統(tǒng)),則這些數(shù)據(jù)非常有用。即使通用的、基于 Web 的搜索工具隨處可見(jiàn),機(jī)構(gòu)仍然發(fā)現(xiàn)內(nèi)部搜索很困難,因?yàn)闆](méi)有可用工具能夠很好地跨越現(xiàn)有數(shù)據(jù)孤島編制索引,無(wú)法提供自然語(yǔ)言查詢(xún),并且無(wú)法提供準(zhǔn)確的結(jié)果。當(dāng)員工有疑問(wèn)時(shí),他們需要使用可能出現(xiàn)在不同上下文、多個(gè)文檔中的關(guān)鍵字,這些搜索通常會(huì)生成一長(zhǎng)串隨機(jī)鏈接,員工必須篩選這些鏈接才能找到他們查找的信息(如果他們找得到的話)。
Amazon Kendra讓員工可以使用真實(shí)問(wèn)題(而不僅僅是關(guān)鍵字)在多個(gè)數(shù)據(jù)孤島中搜索,在后臺(tái)部署AI技術(shù)來(lái)提供他們尋求的精確答案(而不是隨機(jī)的鏈接列表),重塑企業(yè)搜索。員工可以使用自然語(yǔ)言運(yùn)行搜索(關(guān)鍵字仍然有效,但大多數(shù)用戶更喜歡自然語(yǔ)言搜索)。例如,員工可以提出一個(gè)特定問(wèn)題,如“IT服務(wù)臺(tái)什么時(shí)候開(kāi)?”Amazon Kendra會(huì)給他們一個(gè)具體答案,如“IT 服務(wù)臺(tái)在上午9:30打開(kāi)”,同時(shí)給出指向IT門(mén)戶和其它相關(guān)網(wǎng)站的鏈接??蛻艨梢栽趹?yīng)用程序、門(mén)戶和 wiki 中使用Amazon Kendra。只需在AWS管理控制臺(tái)中單擊幾下,客戶即可將Amazon Kendra指向其各種文檔存儲(chǔ)庫(kù),服務(wù)會(huì)聚合PB級(jí)的數(shù)據(jù)以構(gòu)建集中索引。Amazon Kendra會(huì)掃描文檔的權(quán)限,確保搜索結(jié)果符合現(xiàn)有的文檔訪問(wèn)策略,搜索結(jié)果僅包含用戶有權(quán)訪問(wèn)的文檔。此外,Amazon Kendra還根據(jù)客戶的特定情況,積極地重新訓(xùn)練機(jī)器學(xué)習(xí)模型,使用點(diǎn)擊率數(shù)據(jù)、用戶位置和反饋提高準(zhǔn)確性,隨著時(shí)間的推移提供越來(lái)越好的答案。
Amazon CodeGuru
跟亞馬遜一樣,AWS客戶也編寫(xiě)了大量代碼。軟件開(kāi)發(fā)是一個(gè)廣為人知的過(guò)程。開(kāi)發(fā)者編寫(xiě)代碼、查看代碼、編譯代碼和部署應(yīng)用程序、衡量應(yīng)用程序的性能并使用該數(shù)據(jù)改進(jìn)代碼,循環(huán)往復(fù)。然而,如果代碼一開(kāi)始就不正確,那么所有這些過(guò)程都沒(méi)什么用,所以團(tuán)隊(duì)都會(huì)在新代碼添加到現(xiàn)有應(yīng)用程序代碼庫(kù)之前執(zhí)行代碼檢查,檢查邏輯、語(yǔ)法和樣式。即使對(duì)于像亞馬遜這樣的大型機(jī)構(gòu),考慮其每天要編寫(xiě)的代碼量,也很難有那么多有經(jīng)驗(yàn)的開(kāi)發(fā)者、他們有足夠的富余時(shí)間來(lái)審核代碼。而且即使是有經(jīng)驗(yàn)的審閱者遇到面向客戶的應(yīng)用程序時(shí)也會(huì)漏掉問(wèn)題,從而導(dǎo)致出錯(cuò)和性能問(wèn)題。
Amazon CodeGuru是一種新的機(jī)器學(xué)習(xí)服務(wù),可自動(dòng)執(zhí)行代碼審核,找到應(yīng)用程序開(kāi)銷(xiāo)最大的代碼行。Amazon CodeGuru有兩個(gè)組件: 代碼審核和應(yīng)用程序分析。對(duì)于代碼審核,開(kāi)發(fā)者像往常一樣提交其代碼(目前支持GitHub和CodeCommit,未來(lái)會(huì)支持更多的存儲(chǔ)庫(kù)),將Amazon CodeGuru添加為代碼審閱者之一,無(wú)需對(duì)正常過(guò)程或要安裝的軟件進(jìn)行其他更改。Amazon CodeGuru收到拉取請(qǐng)求,會(huì)自動(dòng)開(kāi)始使用經(jīng)過(guò)預(yù)先訓(xùn)練的模型來(lái)評(píng)估代碼。這些模型已經(jīng)在亞馬遜和GitHub前10000的項(xiàng)目中經(jīng)受過(guò)數(shù)十年的代碼審核訓(xùn)練。Amazon CodeGuru將檢查代碼更改的質(zhì)量,如果發(fā)現(xiàn)問(wèn)題,它將向拉取請(qǐng)求添加易于閱讀的注釋?zhuān)瑯?biāo)識(shí)出代碼行、特定問(wèn)題和修正建議,包括示例代碼和指向相關(guān)文檔的鏈接。
Amazon CodeGuru還包含一個(gè)機(jī)器學(xué)習(xí)驅(qū)動(dòng)的應(yīng)用程序探查器,可幫助客戶找到開(kāi)銷(xiāo)最大的代碼行。要使用它,客戶只要在其應(yīng)用程序中安裝一個(gè)小小的代理程序,然后Amazon CodeGuru就可以觀察應(yīng)用程序運(yùn)行時(shí),每五分鐘分析一次應(yīng)用程序代碼。代碼配置文件包括有關(guān)延遲和CPU利用率的詳細(xì)信息,直接鏈接到特定的代碼行。Amazon CodeGuru可幫助操作者在應(yīng)用程序中找到開(kāi)銷(xiāo)最大的代碼行,生成火焰圖,幫助直觀地標(biāo)識(shí)出造成性能瓶頸的其它代碼行。多年來(lái),亞馬遜內(nèi)部團(tuán)隊(duì)使用Amazon CodeGuru對(duì)80000多個(gè)應(yīng)用程序進(jìn)行了代碼分析。2017 到2018年,Amazon CodeGuru內(nèi)部版本的廣泛使用,幫助亞馬遜消費(fèi)者業(yè)務(wù)的Amazon Prime Day團(tuán)隊(duì)提高了其應(yīng)用效率,CPU利用率提高325%,減少了管理Prime Day所需的實(shí)例數(shù)量,整體成本降低了39%。
Amazon Fraud Detector
Amazon Fraud Detector提供完全托管的服務(wù),基于亞馬遜消費(fèi)者業(yè)務(wù)使用的相同技術(shù),實(shí)時(shí)檢測(cè)潛在的線上身份欺詐和支付欺詐,無(wú)需機(jī)器學(xué)習(xí)經(jīng)驗(yàn)。Amazon Fraud Detector使用欺詐和合法交易的歷史數(shù)據(jù)來(lái)構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型,提供實(shí)時(shí)、低延遲的欺詐風(fēng)險(xiǎn)預(yù)測(cè)。首先,客戶將交易數(shù)據(jù)上傳到Amazon S3,定制模型訓(xùn)練??蛻糁恍杼峁┡c交易關(guān)聯(lián)的電子郵件地址和IP地址,可以選擇添加其它數(shù)據(jù)(例如帳單地址或電話號(hào)碼)。根據(jù)客戶想要預(yù)測(cè)的欺詐類(lèi)型(新帳戶或線上支付欺詐),Amazon Fraud Detector將預(yù)處理數(shù)據(jù)、選擇一個(gè)算法、訓(xùn)練一個(gè)模型————使用亞馬遜數(shù)十年來(lái)大規(guī)模運(yùn)行欺詐檢測(cè)風(fēng)險(xiǎn)分析的經(jīng)驗(yàn)。Amazon Fraud Detector還使用基于機(jī)器學(xué)習(xí)的、根據(jù)亞馬遜數(shù)據(jù)訓(xùn)練過(guò)的數(shù)據(jù)檢測(cè)器。這些數(shù)據(jù)檢測(cè)器可幫助識(shí)別與發(fā)生在Amazon上的欺詐活動(dòng)(例如異常的電子郵件命名規(guī)律)相似的模式,即使客戶向Amazon Fraud Detector提供的欺詐示例數(shù)量很少,也可以幫助提高模型訓(xùn)練的準(zhǔn)確性。
Amazon Fraud Detector將模型訓(xùn)練、部署到完全托管的私有API端點(diǎn)??蛻艨梢詫⑿禄顒?dòng)(例如注冊(cè)或新購(gòu)買(mǎi))發(fā)送到API、接收包括風(fēng)險(xiǎn)評(píng)分的欺詐報(bào)告。根據(jù)此報(bào)告,應(yīng)用程序可以確定正確的行動(dòng)(例如接受購(gòu)買(mǎi),或?qū)⑵鋫鬟f給人工審核)。借助Amazon Fraud Detector,客戶可以更快、更輕松地、更準(zhǔn)確地檢測(cè)欺詐。
Amazon Transcribe Medical
如今,醫(yī)生們的一部分日常工作,是將詳細(xì)的數(shù)據(jù)輸入病歷(EHR)系統(tǒng)。然而,幫助他們準(zhǔn)確記錄和存檔病情的解決方案是欠佳的。在許多醫(yī)院,醫(yī)生必須將醫(yī)療筆記口述到記錄器中,然后將這些語(yǔ)音文件提交到第三方手動(dòng)抄錄,服務(wù)成本高昂,可能需要長(zhǎng)達(dá)三個(gè)工作日,延誤了存檔流程。另一種選擇是利用現(xiàn)有的前端聽(tīng)寫(xiě)軟件,但受限于現(xiàn)有的工具,醫(yī)生們?nèi)匀幻刻煲谂R床記錄上花費(fèi)好幾小時(shí)。第三種選擇是醫(yī)療保健提供商雇用人工抄寫(xiě)員,在醫(yī)生們看病時(shí)協(xié)助做記錄,但人工抄寫(xiě)員可能會(huì)令患者感到不安,醫(yī)生們經(jīng)常提到他們的記錄有欠缺,醫(yī)療機(jī)構(gòu)也很難大規(guī)模地安排和協(xié)調(diào)抄寫(xiě)員??傊?,現(xiàn)有的解決方案在提高臨床記錄效率和改善患者護(hù)理方面都有不足。
Amazon Transcribe Medical通過(guò)使用機(jī)器學(xué)習(xí)技術(shù)自動(dòng)轉(zhuǎn)錄自然醫(yī)學(xué)語(yǔ)音來(lái)解決這些問(wèn)題。建立在 Amazon Transcribe Medical語(yǔ)音到文本功能之上的病歷應(yīng)用,可以準(zhǔn)確、經(jīng)濟(jì)實(shí)惠地生成記錄。Amazon Transcribe Medical由多個(gè)機(jī)器學(xué)習(xí)模型組成,這些模型經(jīng)過(guò)數(shù)萬(wàn)小時(shí)的醫(yī)學(xué)語(yǔ)音訓(xùn)練,可提供準(zhǔn)確的、機(jī)器學(xué)習(xí)驅(qū)動(dòng)的醫(yī)學(xué)轉(zhuǎn)錄。實(shí)時(shí)生成記錄,消除了多日的流轉(zhuǎn)時(shí)間。
Amazon Transcribe Medical可以幫助醫(yī)生們?cè)诟颊邷贤〞r(shí)自動(dòng)轉(zhuǎn)錄對(duì)話,不用分心手動(dòng)筆記,醫(yī)療保健提供商能夠?qū)W⒂诨颊咦o(hù)理。醫(yī)生可以自然地說(shuō)話,Amazon Transcribe Medical使用內(nèi)置的自動(dòng)標(biāo)點(diǎn)符號(hào),克服現(xiàn)有轉(zhuǎn)錄軟件的局限性。對(duì)于醫(yī)療保健提供商,基于Amazon Transcribe Medical的語(yǔ)音解決方案可擴(kuò)展到數(shù)千個(gè)潛在的醫(yī)療中心,消除了管理和協(xié)調(diào)臨時(shí)抄寫(xiě)員的操作難題。Amazon Transcribe Medical符合HIPAA認(rèn)證,提供易于使用的 API,可與支持語(yǔ)音的應(yīng)用程序和帶有麥克風(fēng)的任何設(shè)備集成。Amazon Transcribe Medical的輸出文本也可以用于其他AWS服務(wù),例如自然語(yǔ)言處理服務(wù)Amazon Comprehend Medical,在最終進(jìn)入病歷系統(tǒng)前進(jìn)行下一步的數(shù)據(jù)分析。
Amazon Augmented Artificial Intelligence (A2I)
機(jī)器學(xué)習(xí)可以為各種應(yīng)用場(chǎng)景提供高度準(zhǔn)確的預(yù)測(cè),包括識(shí)別圖像中的對(duì)象、從掃描的文檔中提取文本、或者轉(zhuǎn)錄與理解口語(yǔ)。在每種情況下,機(jī)器學(xué)習(xí)模型都會(huì)提供預(yù)測(cè),提供置信度分?jǐn)?shù)以表示模型預(yù)測(cè)的確定性。置信度分?jǐn)?shù)越高,結(jié)果的可信度就越高。對(duì)于許多應(yīng)用場(chǎng)景,當(dāng)開(kāi)發(fā)者收到高置信度結(jié)果時(shí),他們可以信任其結(jié)果可能是準(zhǔn)確的,可以自動(dòng)處理它們(例如,自動(dòng)調(diào)整社交網(wǎng)絡(luò)上用戶生成的內(nèi)容,或者給視頻加字幕)。但是,在置信度低于預(yù)期的情況下,預(yù)測(cè)結(jié)果模糊,可能需要人工審核才能解決這種模糊性。機(jī)器學(xué)習(xí)和人工審閱之間的這種相互作用,對(duì)于機(jī)器學(xué)習(xí)系統(tǒng)的成功至關(guān)重要,但人工審核的大規(guī)模構(gòu)建和運(yùn)營(yíng),很有挑戰(zhàn),成本高昂,通常涉及多個(gè)流程步驟,需要定制軟件管理人工審核任務(wù)和結(jié)果,需要招聘和管理大量審核人員。結(jié)果,開(kāi)發(fā)者時(shí)?;ㄙM(fèi)大量的時(shí)間來(lái)管理人工審核過(guò)程,而不是構(gòu)建其預(yù)想的應(yīng)用程序,或者不得不放棄人工審核,導(dǎo)致許多預(yù)測(cè)的信心和效用都很低。
Amazon Augmented Artificial Intelligence (A2I) 是一項(xiàng)新服務(wù),使用它很容易構(gòu)建和管理機(jī)器學(xué)習(xí)應(yīng)用程序的人工審核。Amazon A2I為常見(jiàn)的機(jī)器學(xué)習(xí)任務(wù)——例如圖像中的對(duì)象檢測(cè)、語(yǔ)音轉(zhuǎn)錄和內(nèi)容審核——提供預(yù)構(gòu)建的人工審核工作流,方便對(duì)來(lái)自Amazon Rekognition和Amazon Textract的機(jī)器學(xué)習(xí)預(yù)測(cè)做人工審核。開(kāi)發(fā)者為其特定應(yīng)用程序選擇置信閾值,所有置信度分?jǐn)?shù)低于閾值的預(yù)測(cè)都將自動(dòng)發(fā)送給人工審核人員進(jìn)行驗(yàn)證。開(kāi)發(fā)者可以選擇Amazon Mechanical Turk的50萬(wàn)全球人工、預(yù)授權(quán)人工的第三方機(jī)構(gòu)如Startek、iVision、CapeStart、Cogito和iMerit、或他們自己的審核人員執(zhí)行其審核。審核結(jié)果存儲(chǔ)在Amazon S3中,開(kāi)發(fā)者在審核完成后會(huì)收到通知,以便他們根據(jù)審核人員的可信結(jié)果進(jìn)行下一步操作。Amazon A2I為所有開(kāi)發(fā)者帶來(lái)了人工審核,消除了構(gòu)建和管理定制審核流程或招募大量審核人員方面的繁重工作。
截至目前,AWS提供超過(guò)175項(xiàng)全功能的服務(wù),涵蓋計(jì)算、存儲(chǔ)、數(shù)據(jù)庫(kù)、聯(lián)網(wǎng)、分析、機(jī)器人、機(jī)器學(xué)習(xí)與人工智能、物聯(lián)網(wǎng)、移動(dòng)、安全、混合云、虛擬現(xiàn)實(shí)與增強(qiáng)現(xiàn)實(shí)、媒體,以及應(yīng)用開(kāi)發(fā)、部署與管理等方面,遍及22個(gè)地理區(qū)域的69個(gè)可用區(qū)。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )