欧美一区二区激情三区,欧美性色欧美精品视频69

英特爾第三代至強處理器解決AI難題

公布時長：2021-05-27 17:13:52

移動互聯網“早古”時期，普通人因為收入差距問題而無法做到人手一部智能手機，從而導致數字鴻溝。同樣，在當前這個AI，也就是人工智能扮演越來越關鍵作用的時代，企業也站在了類似的抉擇交接線上——是否有足夠的實力或能力擁抱智能化？而這個問題的成本，可就不是一個小小的智能手機了。因缺少AI人才、技術積累或財力支持而難以靠自身力量完成AI基礎設施建設的企業，在智能化轉型的過程中正將面臨這樣的智能化鴻溝，能否破解，很可能會關乎新十年中它們的命運走向。

-掃碼關注-

億玖服務管理器開發聯系起來電話：13310806067

如何消除智能化鴻溝？

要解決問題，就要先精確定位問題所在。一方面，構建AI能力對于普通企業來說，IT基礎設施維護、AI框架搭建、訓練和推理、硬件和軟件、人才和巨額算力成本等這些“夯地基”的事情需要從零做起，然而大部分企業，尤其是傳統行業企業并沒有相關經驗；另一方面，智能化轉型又迫在眉睫，企業需要快速讓自己具備AI能力，才能趕上不斷變化的需求。

企業在AI應用開發和使用各階段可能遇到的挑戰，雖然不全，但已足夠“挑戰”

收錄哪幾種有一個定的AI優質人才、科技沉淀與科技創新效果，但仍缺乏以支撐著自個智慧化發展的中小企業以內，大伙全部都在探尋是一種基本功能詳細、研究部署工作節省時間且性價變高的方法，來作用它是短時間完畢AI效果的實現和研究部署工作。

這就給了云備份的打造商展露武藝的時候，根據所在安全、高質量、價格實惠的AI云備份的，的幫助狀態和地位匱乏的工業企業如何快速布署和實際操作AIAPP，其可以保證做到既惠人，又利已。

意外！CPU成AI云服務熱門選擇

繁重的意愿，都已經在結束數十年產生了諸多根據AI的云精準貼心精準服務和軟件，IaaS和PaaS極別的精準貼心精準服務是比較主流，列如 AIaaS (AI as a Service)、AI 網上精準貼心精準服務、改善型 IaaS、公有云AI立體式機，強度了解云工作平臺這些的，硬件軟件組合搭配也是幾種齊全，列如對于CPU、GPU、TPU、NPU、FPGA這些的，都已經為客戶AI轉型升級展示有基礎知識公共設施融合及優化方案系統、AI利用聯合開發和部暑，、AI 建模魔鬼訓練與推論職能優化方案系統其中的幾種搭載。

有趣的是，CPU作為通用處理器，在AI云服務的搶眼程度，并不亞于專用的AI加速芯片。通過實際應用分析，我們不難發現，如果不是專注于AI算法模型訓練和開發的企業，大多數企業使用AI時其實更偏推理型的應用。對他們來說，基于CPU平臺的云服務，特別是集成了可加速AI應用的AVX-512技術和深度學習加速技術的英特爾^® 至強^® 平臺的AI云服(fu)(fu)務，其(qi)實在很多應用(yong)場景中都足以應對實戰(zhan)需求，且不論對于他們(men)，還是云服(fu)(fu)務提(ti)供商而(er)言，部署都更快、更便捷(jie)，上手門(men)檻也低(di)。

就這樣，可能與大家的印象相悖，CPU成為了很多云服務提供商輸出，以及企業采用AI云服務時的熱門選擇，這使得以CPU為基礎設施的AI云服務異軍突起。

用CPU做AI云服務，集成AI加速是前提

如之前一說起，通過CPU的云安全服務要受青睞，并不會只不過進行通用性確定釣魚任務就夠了，應先就必須面對AI使用在硬件設備上集成式其他的迅速專業能力。

作為老牌CPU廠商的英特爾，早在2017年就于第一代英特爾^® 至強^® 可擴展處理器上導入了可以加速浮點運算（涵蓋AI運算）的AVX-512技術；而后又在2019年推出的第二代英特爾^® 至強^® 可擴展處理器上集成了可以加速INT8的英特爾^® 深度學習加速技術，專攻推理優化；2020年和今年，分別面向多路和單、雙路服務器的第三代英特爾^® 至強^® 可擴展處理器依次(ci)亮(liang)相，后者(zhe)靠INT8加速主攻推理，前者(zhe)則通(tong)過同時支持(chi)INT8和BF16加速，兼顧了CPU上(shang)的AI訓練(lian)和推理任務。

2021年面向單路和雙路服務器的全新第三代英特爾^® 至強^® 可擴展處理器的主要優勢，包括再次提升AI推理性能

CPU丟掉AI降速效率，用它來搭配AI云備份管理的之基就已尊定。但為了能全面地全面調動出一些硬件設備AI降速效率，英特爾還同步操作的能提供沒事型號開放源碼AI工貝改進工貝，還包括基本效能改進工貝oneDNN，可幫助AI模形全面地程序化利用率CPU降速效率、預置了大規模預改進模形并能簡單這句話在CPU手機APP子上研究部署操作的的OpenVINO?，與能在當下大數劇手機APP子上深入推進厚度的學習使用，最終得以無逢聯接大數劇手機APP與AI使用的Analytics Zoo等。英特爾還將oneDNN滲透到了TensorFlow、Pytorch等中端AI體系結構，將這句話整改成面向基層英特爾體系結構改進的AI體系結構。

能夠這樣的創新舉措，英特爾系統架構CPU功能平臺加速度AI選用的粗細四種專業能力就上了“雙劍合璧”的郊果。而英特爾和云功能出具商合作協議朋友的實訓，也正根據此展開圖的。

CPU AI云服務第一式，軟硬打包上手快

得益于英特爾提供的全面AI加速軟硬件組合，多數云服務提供商無需做更多調整和優化，就可迅速打造出針對AI的基礎設施即服務或AI云主機產品。簡單來說，就是將集成AI加速能力的英特爾^® 至強^® 可擴展平臺與我們提到的軟(ruan)件工具，例(li)如oneDNN或面向英特爾架構優化的AI框架軟(ruan)硬打(da)包，就可快速(su)形成易于部(bu)署和擴展的AI云主機鏡像(xiang)。

國內有云服務提供商早在2017年就進行了類似的嘗試，通過使用英特爾優化軟件，它激活了英特爾^® 至強^® 平(ping)臺的AI加速潛能(neng)(neng)，并在部分應用場(chang)景(jing)實現了可與GPU相媲美的推理性能(neng)(neng)。

如果僅有性能優化還不夠，還需要更快的模型部署能力，那就可以像CDS首云一樣導入OpenVINO?。它通過英特爾^® 至強^® 可(ke)擴展(zhan)平臺、高性能 K8S 容器平臺和OpenVINO Model Server這(zhe)三者(zhe)的(de)組(zu)合大幅(fu)簡化了AI模型的(de)部署、維護和擴展(zhan)。性能實測結果也表(biao)明，OpenVINO?不僅在用(yong)戶并發接(jie)入能力上(shang)優(you)于首云此(ci)前采(cai)用(yong)的(de)AI框架，在推理應用(yong)的(de)時延等關鍵(jian)性能指標上(shang)也有良好表(biao)現(xian)。

CDS首云AI云服務方案架構

CPU AI云服務第二式，深度優化收益多

僅僅是導入英特爾已經就緒的AI軟硬件組合，就已能輸出令人滿足的AI云服務了，那么如果是和英特爾在AI云服務的算法及模型上進行更深入的優化，又(you)會有(you)什么驚喜呢？像阿(a)里云這樣的頭部云服(fu)務提(ti)供(gong)商(shang)就通過實戰給出(chu)了答案。

以阿里云為例，其機器學習平臺PAI在與英特爾的合作中，利用了第三代英特爾^® 至強^® 可擴展處理器支持的bfloat16加速，來主攻PAI之上BERT性能的調優，具體來說就是以經過優化的Float32 Bert模型為基準，利用BF16加速能力優化了該模型的MatMul算子，以降低延遲。測試結果表明：與優化后的FP32 Bert模型相比，英特爾^® 至強^® 平臺BF16加速能(neng)力能(neng)在不降低準確率的情(qing)況下，將(jiang)BERT模型(xing)推理性能(neng)提升達1.83倍。

阿里云PAI BERT 模型優化方案

CPU AI云服務第三式，扎根框架打根基

要說從出示薄厚分工協作的根本公司到定位深層推廣java算法，稱得上AI云貼心保障管理器的在推廣層度上的邁開，或說云貼心保障管理器的出示商與英特爾在AI云貼心保障管理器的建設和推廣上的推進改革相互達成合作一句話，那末要有云貼心保障管理器的出示商能在深層學校框架結構這里AI核心上與英特爾搞好相互達成合作，像是就不是會更高目的意義呢？

為這個問題輸出答案的是百度，它的開源深度學習平臺“飛槳”先后結合第二代和第三代英特爾^® 至強^® 可擴(kuo)展(zhan)處理(li)器在(zai)計算、內(nei)存、架構和通(tong)信等多層面進(jin)行(xing)了(le)基礎性的(de)優(you)化。其結果(guo)也是普(pu)惠性的(de)——優(you)化后(hou)的(de)飛槳框(kuang)架能夠充分調動深度學習加速(su)技術，可將眾多AI模(mo)型，特別是圖像分類(lei)、語音識別、語音翻譯(yi)、對象檢測(ce)類(lei)的(de)模(mo)型從FP32瘦身到INT8，在(zai)不(bu)影響準確(que)度的(de)情況下，大幅提(ti)升它們的(de)推理(li)速(su)度。

英特爾深度學習加速技術可通過1條指令執行8位乘法和32位累加，INT8 OP理論算力峰值增益為FP32 OP的4倍

例如在圖像分類模型ResNet50的測試中，飛槳搭配英特爾今年發布的全新第三代英特爾^® 至強^® 可擴展處理器(qi)對其(qi)進行(xing)INT8量化后，其(qi)推(tui)理吞吐(tu)量可達FP32的3.56倍之(zhi)多。

如此性能增幅，再加上CPU易于獲取、利用和開發部署的優勢，讓飛槳的開發者們可借助AI框架層面的優化，更加快速、便捷地創建自己可用CPU加速的深度學習應用。而為了給企業開發者們提供更多便利，百度還推出了EasyDL和BML（Baidu Machine Learning）全功能AI開發平臺，通過飛槳基于全新第三代英特爾^® 至強^® 可擴展處理器的優化(hua)加速，來(lai)為(wei)企(qi)業提供一(yi)站(zhan)式AI開發(fa)服務。

百度飛槳開源深度學習平臺與飛槳企業版

展望未來，跨越智能化鴻溝不僅靠算力

上邊CDS首云、阿里云服務器云和搜狗搜索的示例，行就說充分的造成了用CPU做AI云服務的現狀及，而這類云服務也也是為某一但愿超越智慧化鴻溝的工廠主規劃的。當，想一想也會長期演變，如說漸漸前景AI技術工藝的進步開發，特別的是大信息與AI融為一體引致的新需要量，無關是用CPU還是多功能降速器，無關是工廠主新建AI根基生活設施和APP，還是云服務能行業門戶網站效果的AI云服務，均會在信息保存不足以顯卡功耗上邊臨越變更加多的試煉。

我覺得，算率、漢明距離和動態大數據分析是平分秋色的“三駕車馬”，根據動態大數據分析規模較進這一步爆增，動態大數據分析數據庫也將對AI的投放和使用創造其他對戰。

好消息是，國內的云服務提供商也早已和英特爾就此展開了前瞻創新，例如百度智能云早在2019年就推出了ABC（AI、Big Data、Cloud）高性能對象存儲解決方案，能利用英特爾^® 傲騰(teng)? 固態盤(pan)的(de)(de)高(gao)性能(neng)、低時延和高(gao)穩定來滿足AI訓練對數據(ju)的(de)(de)高(gao)并發(fa)迭代吞吐需求(qiu)。

值得一提的是，英特爾在今年發布全新第三代英特爾^® 至強^® 可擴展處理器時，也帶來了與其搭檔的英特爾^® 傲騰? 持久內存200系列和英特爾^® 傲騰? 固態盤P5800X。

與全新第三代英特爾^® 至強^® 可擴展處理器搭配使用的英特爾^® 傲騰? 持久內存和英特爾^® 傲騰? 固態盤新品

相信未來會有更多專攻AI應用場景的存儲系統導入這些新品，把更多數據存放在更靠近CPU或其他加速器的地方，從數據就緒或“供給”層面提升AI推理和訓練的性能。而提供這些AI優化型存儲系統或服務的，多數也很可能是技術實力雄厚的云服務提供商們，這樣一來，用戶就不用擔心在應對智能化鴻溝時再遇到大數據和AI對接的難題了。