隨著技術(shù)和生態(tài)的不斷演進、應(yīng)用場景的不斷探索,機器學(xué)習(xí)已然不再僅僅停留在實驗室當中。無論是日新月異的互聯(lián)網(wǎng)應(yīng)用,還是求新求變的企業(yè)轉(zhuǎn)型,機器學(xué)習(xí)都得到了廣泛的應(yīng)用,逐步成為驅(qū)動業(yè)務(wù)的關(guān)鍵技術(shù)。
機器學(xué)習(xí)在近 30 多年已發(fā)展為一門多領(lǐng)域交叉學(xué)科,也已廣泛應(yīng)用于數(shù)據(jù)挖掘、計算機視覺、自然語言處理、生物特征識別、搜索引擎、醫(yī)學(xué)診斷、檢測信用卡欺詐、證券市場分析、DNA 序列測序、語音和手寫識別、戰(zhàn)略游戲和機器人等領(lǐng)域。
為了幫助大家更便捷的解決這些實際問題,讓數(shù)據(jù)科學(xué)家、算法工程師、業(yè)務(wù)開發(fā)者都能輕松駕馭機器學(xué)習(xí),AWS 推出了各式各樣的機器學(xué)習(xí)工具,包括:ML 服務(wù)類、API 類、AI 服務(wù)工具類等。
今天,我們就對 AWS 的部分優(yōu)秀機器學(xué)習(xí)工具做一個整理,分享給各位行業(yè)從業(yè)者。
一. ML 服務(wù)類機器學(xué)習(xí)工具
1. Amazon SageMaker
Amazon SageMaker 是一項完全托管的服務(wù),可為每位開發(fā)人員和數(shù)據(jù)科學(xué)家提供快速構(gòu)建、訓(xùn)練和部署機器學(xué)習(xí) (ML) 模型的能力。
開發(fā)者可以在一個集成的可視界面中編寫代碼、跟蹤實驗、可視化數(shù)據(jù)以及進行調(diào)試和監(jiān)控。從完整的平臺 IDE,到具體代碼與 API,SageMaker 都有一種 Pythonic 精神,簡潔易用,同時提供高級的接口。消除了機器學(xué)習(xí)過程中的每個步驟的繁重工作,讓開發(fā)者能夠更輕松地開發(fā)高質(zhì)量模型,提高開發(fā)人員的工作效率。
2020 年 4 月底,SageMaker 在 AWS 中國的北京區(qū)域和寧夏區(qū)域上正式開放。就在前不久,在國內(nèi)開始正式開放。這標志著 AWS 人工智能、機器學(xué)習(xí)平臺服務(wù)的關(guān)鍵技術(shù)已全面進入中國。
工具亮點:
這是第一個用于機器學(xué)習(xí)的完全集成式開發(fā)環(huán)境 (IDE) 單一集成的可視界面操作,大幅提高開發(fā)效率 可自動構(gòu)建、訓(xùn)練和調(diào)試完全可視和可控的模型 使用 Amazon SageMaker Ground Truth 將數(shù)據(jù)標記成本降低多達 70% 使用 Amazon Elastic Inference 可將機器學(xué)習(xí)推理成本降低多達 75% API 類
二. API 類機器學(xué)習(xí)工具
1. 文本轉(zhuǎn)語音:Amazon Polly
Amazon Polly 是一項云服務(wù),可以將文本轉(zhuǎn)化為逼真的語音。支持多種語言,并包含各種逼真的聲音,因此你可以構(gòu)建在多個位置工作的支持語音的應(yīng)用程序,并為你的客戶使用理想的語音。
此外,Amazon Polly 還包含許多神經(jīng)文本到語音轉(zhuǎn)換 (NTTS) 語音,通過新的機器學(xué)習(xí)方法為語音質(zhì)量帶來突破性的改進,從而為客戶提供盡可能最自然的文本到語音的似人類的語音。神經(jīng) TTS 技術(shù)還支持播音員風(fēng)格,專為新聞播報使用案例量身定制。
Amazon Polly 的常用案例包括移動應(yīng)用程序(如新聞閱讀器、游戲、電子學(xué)習(xí)平臺)、視障人士輔助功能應(yīng)用程序以及快速增長的物聯(lián)網(wǎng) (IoT) 細分市場。Alexa 語音助手的品牌定制語音服務(wù),就是通過 Amazon Polly 語音合成平臺提供的。
工具亮點:
高質(zhì)量:新的神經(jīng) TTS 和一流的標準 TTS 技術(shù),可合成發(fā)音精度極高的超自然語音; 支持多種語言和語音:支持數(shù)十種語音語言,并為大多數(shù)語言提供男性和女性語音選項。 經(jīng)濟實惠:Amazon Polly 采用按需付費定價模式,每字符轉(zhuǎn)換成本低廉,并且支持無限次重放,使企業(yè)能夠以經(jīng)濟高效的方式為應(yīng)用程序添加語音功能。
2.語音轉(zhuǎn)文本:Amazon Transcribe
Amazon Transcribe 是一項自動語音識別 (ASR) 服務(wù),讓開發(fā)人員能夠輕松地為其應(yīng)用程序添加語音轉(zhuǎn)文本功能。通過使用 Amazon Transcribe API,可以分析 Amazon S3 中存儲的音頻文件,并讓該服務(wù)返回一個轉(zhuǎn)錄的語音文本文件。開發(fā)人員還可以將實時音頻流發(fā)送到 Amazon Transcribe,并實時接收轉(zhuǎn)錄流。
Amazon Transcribe 可用于很多常見應(yīng)用程序,包括客戶服務(wù)通話轉(zhuǎn)錄,以及基于音頻和視頻內(nèi)容生成字幕。該服務(wù)可以轉(zhuǎn)錄以常見格式(例如 WAV 和 MP3)存儲的音頻文件,并為每個詞附加時間戳,以便開發(fā)者可以通過搜索文本輕松找到原始源中的音頻。
工具亮點:
便于閱讀的轉(zhuǎn)錄:Amazon Transcribe 采用深度學(xué)習(xí)功能自動添加標點符號和格式,從而使輸出內(nèi)容更容易理解,無需進一步編輯即可直接使用。 生成時間戳:Amazon Transcribe 會為每個詞返回時間戳,以便可以通過搜索文本輕松找到原始錄音中的音頻。 自定義詞匯表:Amazon Transcribe 支持擴展和自定義語音識別詞匯表。使用者可以將新詞添加到基本詞匯表中,并生成使用案例特定的高度準確的轉(zhuǎn)錄,例如產(chǎn)品名稱、域特定術(shù)語或個人姓名。 識別多個講話者:Amazon Transcribe 能夠識別出講話者的變化,并相應(yīng)地確定轉(zhuǎn)錄文本的歸屬。這樣可以顯著減少轉(zhuǎn)錄具有多個講話者的音頻(例如電話、會議和電視節(jié)目)所需的工作量。
3.從文檔中提取文本和數(shù)據(jù):Amazon Textract
Amazon Textract 是一項從掃描的文檔中自動提取文本和數(shù)據(jù)的服務(wù)。Amazon Textract 的功能不只是簡單的光學(xué)字符識別 (OCR),它還可以識別表單中字段的內(nèi)容和表格中存儲的信息。
借助 Textract,開發(fā)人員可以快速自動執(zhí)行文檔工作流,數(shù)小時可處理數(shù)百萬個文檔頁面。此外,開發(fā)人員還可以創(chuàng)建智能搜索索引,構(gòu)建自動批準工作流,并通過標記可能需要校訂的數(shù)據(jù),更好地保持對文檔存檔規(guī)則的符合性。
結(jié)合 Amazon Augmented AI (Amazon A2I) 后,開發(fā)人員可以通過內(nèi)置人工審核來管理需要人工判斷的細微或敏感工作流,從而取得高確信度的預(yù)測或?qū)︻A(yù)測進行持續(xù)審計。
工具亮點:
快速準確地提取數(shù)據(jù):Amazon Textract 可以自動檢測文檔的布局和頁面上的關(guān)鍵元素,了解任何嵌入式表單或表格中的數(shù)據(jù)關(guān)系,并提取附帶完整上下文的所有內(nèi)容。 無需維護代碼或模板:借助 Amazon Textract 預(yù)先經(jīng)過訓(xùn)練的機器學(xué)習(xí)模型,無需為數(shù)據(jù)提取編寫代碼,不需要為可能收到的每個文檔或表單維護代碼,也不必擔(dān)心頁面布局隨著時間的推移而發(fā)生變化。 更低的文檔處理成本:Amazon Textract 以非常低的成本提供 OCR 和結(jié)構(gòu)化數(shù)據(jù)提取(表單和表格),你只需按照實際使用量付費,無需預(yù)先承諾或長期合同。
三. AI 服務(wù)類機器學(xué)習(xí)工具
1. 代碼審查工具 —— Amazon CodeGuru
Amazon CodeGuru 是一種機器學(xué)習(xí)服務(wù),可自動執(zhí)行代碼審查,并提供應(yīng)用程序性能建議。它可以幫助開發(fā)人員找到影響應(yīng)用程序性能的代碼行,并版主進行問題排查,然后提供修復(fù)或改進代碼的具體建議。
CodeGuru 由機器學(xué)習(xí)、最佳實踐以及經(jīng)在開源項目和 Amazon 內(nèi)部分析數(shù)百萬項代碼審查和數(shù)千個應(yīng)用程序后總結(jié)出來的經(jīng)驗教訓(xùn)提供支持。
2. 快速構(gòu)建深度學(xué)習(xí)應(yīng)用程序 —— AWS Deep Learning AMI
AWS Deep Learning AMI (DLAMI) 是在云中進行深度學(xué)習(xí)的一站式商店,可以為機器學(xué)習(xí)從業(yè)人員和研究人員提供基礎(chǔ)設(shè)施和各種工具,從而加快在云中進行任意規(guī)模的深度學(xué)習(xí)的速度。
通過 DLAMI,開發(fā)人員可以快速啟動預(yù)先安裝了常見深度學(xué)習(xí)框架和界面(如 TensorFlow、PyTorch、Apache MXNet、Chainer、Gluon、Horovod 和 Keras)的 Amazon EC2 實例來訓(xùn)練復(fù)雜的自定義 AI 模型、試驗新算法或?qū)W習(xí)新技能和技巧。
無論需要 Amazon EC2 GPU 還是 CPU 實例,都無需為 Deep Learning AMI 支付額外費用。只需為存儲和運行應(yīng)用程序所需的 AWS 資源付費。
AWS Deep Learning AMI 可在專為推理設(shè)計的基于 Intel 的 Amazon EC2 C5 實例上運行。AMI 預(yù)安裝了 NVIDIA CUDA 和 cuDNN 驅(qū)動程序,可以有效縮短完成計算所需的時間。
為了簡化軟件包的管理和部署,AWS Deep Learning AMI 安裝了 Anaconda2 和 Anaconda3 數(shù)據(jù)科學(xué)平臺,可以進行大規(guī)模數(shù)據(jù)處理、預(yù)測分析和科學(xué)計算。
工欲善其事必先利其器,想要進行機器學(xué)習(xí)方面的工作研究,配合上優(yōu)秀的工具一定可以事半功倍。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )