国产高清无码视频在线观看,国色天香社区视频手机版,韩日欧∧V精品无码一区二

人工智能浪潮的推動(dòng)下，AI相關(guān)產(chǎn)業(yè)的商用場(chǎng)景正逐步大規(guī)模落地，基于AI技術(shù)的三大支柱：“算法＋大數(shù)據(jù)＋計(jì)算能力”智能應(yīng)用已成為計(jì)算機(jī)最主要的負(fù)載之一。我國(guó)在用戶數(shù)據(jù)方面擁有數(shù)量的先天優(yōu)勢(shì)，但面對(duì)有限的規(guī)模、結(jié)構(gòu)固定、能耗受限的硬件制約下，如何用AI芯片處理海量的并不斷演進(jìn)的深度學(xué)習(xí)算法呢？跟隨OFweek編輯一起來看看各大科技巨頭們研發(fā)的AI芯片吧。（排名按首字母順序排列）

1.含光800

2019年的杭州云棲大會(huì)上，達(dá)摩院院長(zhǎng)張建鋒現(xiàn)場(chǎng)展示了這款全球最強(qiáng)的 AI芯片——含光800。在業(yè)界標(biāo)準(zhǔn)的 ResNet－50 測(cè)試中，含光 800 推理性能達(dá)到 78563 IPS，比目前業(yè)界最好的 AI 芯片性能高 4 倍；能效比500 IPS／W，一個(gè)含光800的算力相當(dāng)于10個(gè)GPU。

目前，含光800已經(jīng)實(shí)現(xiàn)了大規(guī)模應(yīng)用于阿里巴巴集團(tuán)內(nèi)多個(gè)場(chǎng)景，例如視頻圖像識(shí)別／分類／搜索、城市大腦等，未來還可應(yīng)用于醫(yī)療影像、自動(dòng)駕駛等領(lǐng)域。以杭州城市大腦實(shí)時(shí)處理1000路視頻為例，過去使用GPU需要40塊，延時(shí)為300ms，單路視頻功耗2．8W；使用含光800僅需4塊，延時(shí)150ms，單路視頻功耗1W。

2.Graphcore IPU

總部位于英國(guó)布里斯托的Graphcore公司日前推出了一款稱為智能處理單元（IPU）的新型AI加速處理器。芯片本身，即IPU處理器，是迄今為止最復(fù)雜的處理器芯片：它在一個(gè)16納米芯片上有幾乎240億個(gè)晶體管，每個(gè)芯片提供125 teraFLOPS運(yùn)算能力。一個(gè)標(biāo)準(zhǔn)4U機(jī)箱中可插入8張卡，卡間通過IPU鏈路互連。8張卡中的IPU可以作為一個(gè)處理器元件工作，提供兩個(gè)petaFLOPS的運(yùn)算能力。與芯片在CPU和GPU中的存在形式不同，它為機(jī)器智能提供了更高效的處理平臺(tái)。

Graphcore公司于2016年啟動(dòng)風(fēng)險(xiǎn)投資計(jì)劃，并在2018年12月的最后一輪融資中募集了2億美元?；谄?7億美元的公司估值，Graphcore已成為西方半導(dǎo)體界的唯一“獨(dú)角獸”。它的投資者們包括戴爾、博世、寶馬、微軟和三星。

3.Inferentia芯片

2019年，亞馬遜的云服務(wù)業(yè)務(wù)AWS在其發(fā)布會(huì)AWS re：Invent上帶來了高性能機(jī)器學(xué)習(xí)加速芯片Inferentia。據(jù)了解，AWS Inferentia 是一個(gè)由 AWS 定制設(shè)計(jì)的機(jī)器學(xué)習(xí)推理芯片，旨在以極低成本交付高吞吐量、低延遲推理性能。該芯片將支持 TensorFlow、Apache MXNet 和 PyTorch 深度學(xué)習(xí)框架以及使用 ONNX 格式的模型。

每個(gè) AWS Inferentia 芯片都能在低功率下支持高達(dá) 128 TOPS（每秒數(shù)萬億次運(yùn)行）的性能，從而為每個(gè) EC2 實(shí)例啟用多個(gè)芯片。AWS Inferentia 支持 FP16、BF16 和 INT8 數(shù)據(jù)類型。此外，Inferentia 可以采用 32 位訓(xùn)練模型，并使用 BFloat16 以 16 位模型的速度運(yùn)行該模型。與EC4上的常規(guī)Nvidia G4實(shí)例相比，借助Inferentia，AWS可提供更低的延遲和三倍的吞吐量，且每次推理成本降低40％。

4.昆侖芯片 2019年尾聲，百度宣布首款A(yù)I芯片昆侖已經(jīng)完成研發(fā)，將由三星代工生產(chǎn)。該芯片使用的是三星14nm工藝技術(shù)，封裝解決方案采用的是I－Cube TM。

據(jù)悉，昆侖AI芯片提供512Gbps的內(nèi)存帶寬，在150瓦的功率下實(shí)現(xiàn)260TOPS的處理能力，能支持語音，圖像，NLP等不同的算法模型，其中ERNIE模型的性能是T4GPU的三倍以上，兼容百度飛槳等主流深度學(xué)習(xí)框架。該款芯片主要用于云計(jì)算和邊緣計(jì)算，預(yù)計(jì)在2020年初實(shí)現(xiàn)量產(chǎn)，

5.Nervana NNP 芯片

2019 英特爾人工智能峰會(huì)，英特爾推出面向訓(xùn)練（NNP－T1000）和面向推理（NNP－I1000）的英特爾 Nervana 神經(jīng)網(wǎng)絡(luò)處理器（NNP）。據(jù)了解，Nervana NNP－T 代號(hào) Spring Crest，采用了臺(tái)積電的 16nm FF＋制程工藝，擁有 270 億個(gè)晶體管，硅片面積 680 平方毫米，能夠支持 TensorFlow、PaddlePaddle、PYTORCH 訓(xùn)練框架，也支持 C＋＋深度學(xué)習(xí)軟件庫(kù)和編譯器 nGraph。

Nervana NNP－I，代號(hào)為 Spring Hill，是一款專門用于大型數(shù)據(jù)中心的推理芯片。這款芯片是基于 10nm 技術(shù)和 Ice Lake 內(nèi)核打造的，打造地點(diǎn)是以色列的 Haifa ，Intel 號(hào)稱它能夠利用最小的能量來處理高負(fù)載的工作，它在 ResNet50 的效率可達(dá) 4．8TOPs／W，功率范圍在 10W 到 50W 之間。

6.Orin芯片

2019年NVIDIA GTC中國(guó)大會(huì)中英偉達(dá)發(fā)布了全新的軟件定義自動(dòng)駕駛平臺(tái)——NVIDIA DRIVE AGX Orin，該平臺(tái)內(nèi)置全新Orin系統(tǒng)級(jí)芯片，由170億個(gè)晶體管組成。

Orin系統(tǒng)級(jí)芯片集成了NVIDIA新一代GPU架構(gòu)和Arm Hercules CPU內(nèi)核以及全新深度學(xué)習(xí)和計(jì)算機(jī)視覺加速器，每秒可運(yùn)行200萬億次計(jì)算，幾乎是NVIDIA上一代Xavier系統(tǒng)級(jí)芯片性能的7倍。此外，Orin可處理在自動(dòng)駕駛汽車和機(jī)器人中同時(shí)運(yùn)行的大量應(yīng)用和深度神經(jīng)網(wǎng)絡(luò)，并且達(dá)到了ISO 26262 ASIL－D等系統(tǒng)安全標(biāo)準(zhǔn)。

7.邃思DTU

由騰訊領(lǐng)投、融資累計(jì)超過 6 億元的 AI 芯片公司燧原科技，在2019年發(fā)布會(huì)中推出自主研發(fā)的首款 AI 訓(xùn)練芯片“邃思 DTU”。

據(jù)了解邃思DTU采用格羅方德12nm FinFET工藝，480平方毫米主芯片上承載141億個(gè)晶體管，實(shí)現(xiàn)2．5D高級(jí)立體封裝，據(jù)稱單卡單精度算力為業(yè)界第一，達(dá)20TFLOPS，首次支持混合精度，半精度及混合精度下算力達(dá)80TFLOPS，最大功耗僅225W。

邃思芯片基于可重構(gòu)芯片的設(shè)計(jì)理念，其計(jì)算核心包含 32 個(gè)通用可擴(kuò)展神經(jīng)元處理器（SIP），每 8 個(gè) SIP 組合成 4 個(gè)可擴(kuò)展智能計(jì)算群（SIC）。SIC 之間通過 HBM 實(shí)現(xiàn)高速互聯(lián)，通過片上調(diào)度算法，數(shù)據(jù)在遷移中完成計(jì)算，實(shí)現(xiàn)了 SIP 利用率最大化。

8.思元220芯片

寒武紀(jì)在第21屆高交會(huì)正式發(fā)布邊緣AI系列產(chǎn)品思元220（MLU220）芯片及M．2加速卡產(chǎn)品，標(biāo)志寒武紀(jì)在云、邊、端實(shí)現(xiàn)了全方位、立體式的覆蓋。

思元220芯片采用了寒武紀(jì)在處理器架構(gòu)領(lǐng)域的一系列創(chuàng)新性技術(shù)，其架構(gòu)為寒武紀(jì)最新一代智能處理器MLUv02，實(shí)現(xiàn)最大32TOPS（INT4）算力，而功耗僅10W，可提供16／8／4位可配置的定點(diǎn)運(yùn)算。作為通用處理器，支持各類深度學(xué)習(xí)技術(shù)，支持多模態(tài)智能處理（視覺、語音和自然語言處理），應(yīng)用領(lǐng)域廣泛，客戶可以根據(jù)實(shí)際應(yīng)用靈活的選擇運(yùn)算類型來獲得卓越的人工智能推理性能。

9.昇騰910

2019年8月，華為在深圳總部發(fā)布AI處理器Ascend 910（昇騰910），據(jù)華為發(fā)布的參數(shù)顯示，昇騰910是一款具有超高算力的AI處理器，其最大功耗為310W，華為自研的達(dá)芬奇架構(gòu)大大提升了其能效比。八位整數(shù)精度（INT8）下的性能達(dá)到512TOPS，16位浮點(diǎn)數(shù)（FP16）下的性能達(dá)到256 TFLOPS。

作為一款高集成度的片上系統(tǒng)（SoC），除了基于達(dá)芬奇架構(gòu)的AI核外，昇騰910還集成了多個(gè)CPU、DVPP和任務(wù)調(diào)度器（Task Scheduler），因而具有自我管理能力，可以充分發(fā)揮其高算力的優(yōu)勢(shì)。

昇騰910集成了HCCS、PCIe 4．0和RoCE v2接口，為構(gòu)建橫向擴(kuò)展（Scale Out）和縱向擴(kuò)展（Scale Up）系統(tǒng)提供了靈活高效的方法。HCCS是華為自研的高速互聯(lián)接口，片內(nèi)RoCE可用于節(jié)點(diǎn)間直接互聯(lián)。最新的PCIe 4．0的吞吐量比上一代提升一倍。

10.征程二代

2019世界人工智能大會(huì)中，人工智能芯片初創(chuàng)公司地平線正式宣布量產(chǎn)中國(guó)首款車規(guī)級(jí)人工智能芯片——征程二代，并且獲得五個(gè)國(guó)家市場(chǎng)客戶的前裝定點(diǎn)項(xiàng)目。

據(jù)介紹，征程二代于今年初流片成功，搭載地平線自主創(chuàng)新研發(fā)的高性能計(jì)算架構(gòu)BPU2．0（Brain Processing Unit），可提供超過4TOPS的等效算力，典型功耗僅2瓦，滿足AEC－Q100標(biāo)準(zhǔn)，算力利用率超過90％，每TOPS算力可以處理的幀數(shù)可達(dá)同等算力GPU的10倍以上，識(shí)別精度超過99％，延遲少于100毫秒，多任務(wù)模式下可以同時(shí)跑超過60個(gè)分類任務(wù)，每秒鐘識(shí)別目標(biāo)數(shù)可以超過2000個(gè)。

此次地平線率先推出首款車規(guī)級(jí)AI芯片不僅實(shí)現(xiàn)了中國(guó)車規(guī)級(jí)AI芯片量產(chǎn)零的突破，也補(bǔ)齊了國(guó)內(nèi)自動(dòng)駕駛產(chǎn)業(yè)生態(tài)建設(shè)的關(guān)鍵環(huán)節(jié)。

小結(jié)

目前通過CPU／GPU處理人工神經(jīng)網(wǎng)絡(luò)效率低下，谷歌大腦需要1．6萬個(gè)CPU核跑數(shù)天方能完成貓臉識(shí)別訓(xùn)練；AIpha GO與李世石下棋時(shí)用了1000個(gè)CPU和200個(gè)GPU，AI芯片的發(fā)展是第三次AI浪潮中極為明顯的趨勢(shì)，算法已滲透到云服務(wù)器和智能手機(jī)的方方面面，未來每臺(tái)計(jì)算機(jī)可能都需要一個(gè)專門的深度學(xué)習(xí)處理器。

（免責(zé)聲明：本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿，凡在本網(wǎng)站出現(xiàn)的信息，均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性，但不保證有關(guān)資料的準(zhǔn)確性及可靠性，讀者在使用前請(qǐng)進(jìn)一步核實(shí)，并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí)，應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明，并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后，將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí)，溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。）