ai的浪潮讓科技巨頭們也紛紛布局ai芯片,也讓芯片領(lǐng)域再現(xiàn)多年未見的創(chuàng)業(yè)熱潮。不過,摩爾定律的放緩以及經(jīng)典的馮諾依曼架構(gòu)瓶頸讓ai芯片的進一步提升面臨挑戰(zhàn),這也在很大程度影響ai的發(fā)展和落地。因此,ai芯片架構(gòu)的創(chuàng)新對于ai發(fā)展意義重大。
本月,清微智能的首款可重構(gòu)計算架構(gòu)ai芯片量產(chǎn),這種被稱為全新類別的ai芯片的技術(shù)獨特性在哪?以清微產(chǎn)品為代表的數(shù)據(jù)流驅(qū)動芯片能否成為ai芯片市場的主流?
可重構(gòu)芯片為什么是全新類別?
可重構(gòu)的概念早在20世紀(jì)60年代就被提出,但經(jīng)過半個多世紀(jì)才終于獲得突破。據(jù)悉,可重構(gòu)芯片最早的技術(shù)源頭可追溯到20世紀(jì)80年代末誕生的高層次綜合理論和方法。2006年,意識到可重構(gòu)計算架構(gòu)對于提升芯片算力、降低功耗的巨大優(yōu)勢,魏少軍教授牽頭成立了清華大學(xué)可重構(gòu)計算研究團隊。成立至今的十多年,魏少軍教授一直帶領(lǐng)的團隊進行可重構(gòu)計算的研發(fā)。
魏少軍教授此前接受雷鋒網(wǎng)采訪時表示,可重構(gòu)計算架構(gòu)芯片不屬于cpu、gpu、fpga、asic,它是全新類別芯片。
但是,由于可重構(gòu)芯片具備軟件、硬件雙編程的特性,無論是在國內(nèi)還是國外,可重構(gòu)芯片很多時候被誤解成fpga。
魏少軍近日撰文詳細(xì)介紹了可重構(gòu)芯片的技術(shù)原理,他以軟件和硬件的可編程性兩個軸構(gòu)建坐標(biāo)圖說明了可重構(gòu)芯片的獨特性。第一象限可以歸納為動態(tài)可重構(gòu)的芯片,有時稱為rcp(reconfigurable computing processor,可重構(gòu)計算處理器)或cgra(coarse grained reconfigurable architecture,粗粒度可重構(gòu)架構(gòu))等,其特點是軟件硬件都可以編程、混合粒度、芯片的硬件功能隨軟件的變化而變化,應(yīng)用改變軟件、軟件再改變硬件。
而且它與cpu等處理器有很多類似的地方,開發(fā)者不需要底層芯片設(shè)計知識。這類芯片與asic一樣,具備很好的能量效率和計算效率等。顯然,這種芯片的屬性分類與以前不同,不可以將其與fpga等混為一談。
動態(tài)可重構(gòu)芯片的屬性分類
可重構(gòu)計算架構(gòu)的優(yōu)勢
清微創(chuàng)始人ceo王博接受雷鋒網(wǎng)采訪時更具體地解釋了這一架構(gòu)以及相比其他傳統(tǒng)芯片的優(yōu)勢。他表示,cgra計算架構(gòu)通過空域硬件結(jié)構(gòu)組織不同粒度和不同功能的計算資源,通過硬件運行時配置,調(diào)整硬件功能,根據(jù)數(shù)據(jù)流的特點,讓功能配置好的硬件資源互連形成相對固定的計算通路,從而以接近“專用電路”的方式進行數(shù)據(jù)驅(qū)動下的計算。
可重構(gòu)陣列在不同時刻可以配置成為不同的功能,進而進行數(shù)據(jù)驅(qū)動的asic計算
當(dāng)算法和應(yīng)用變換時,再次通過配置,使硬件重構(gòu)為不同的計算通路去執(zhí)行。
可重構(gòu)陣列的pe在不同時刻可以配置成為不同的功能
王博進一步表示,cgra最大的優(yōu)勢體現(xiàn)在兩方面,一是沒有傳統(tǒng)指令驅(qū)動的計算架構(gòu)取指和譯碼操作的延時和能耗開銷,二是在計算過程中以接近“專用電路”的方式執(zhí)行。對比來看,cgra的計算能效平均可達cpu計算架構(gòu)的1000倍以上、是gpu計算架構(gòu)的100~1000倍、是fpga計算架構(gòu)的100倍以上,相比npu能夠有10倍以上的性能提升,cgra基于配置方式執(zhí)行,執(zhí)行效率可以和asic相當(dāng),但是靈活性遠(yuǎn)遠(yuǎn)好于asic。
此外,cgra架構(gòu)算力可以彈性擴展,適用于從云端到邊緣端對高能效和靈活性有綜合要求的場景。
可重構(gòu)架構(gòu)優(yōu)勢突出為何今年才量產(chǎn)?
前面已經(jīng)提到,魏少軍教授早在2006年就牽頭成立了清華大學(xué)可重構(gòu)計算研究團隊。2015年,可重構(gòu)芯片因為第三次ai熱潮也開始受到關(guān)注。2017年6月,清華大學(xué)可重構(gòu)計算研究團隊的第一代人工智能芯片thinker-ⅰ推出,并獲2017 acm/ieee islped會議設(shè)計競賽獎。研究團隊還在isca 2018發(fā)表了中國唯一第一作者論文。
到了2018年7月,北京清微智能科技有限公司在在北京中關(guān)村注冊成立,基于十多年的技術(shù)積累,200多項技術(shù)專利,清微智能在不到一年的時間就成功量產(chǎn)了首款可重構(gòu)芯片tx210,這款語音soc芯片可以應(yīng)用于智能手機、可穿戴智能設(shè)備、小家電、大家電、玩具、車載等場景。
從2006年清華大學(xué)可重構(gòu)計算研究團隊開始研究,到2015年ai芯片創(chuàng)業(yè)熱潮開啟,為何可重構(gòu)架構(gòu)的商用等到了2018年清微智能的成立?王博表示:“我之前一直在做智能硬件相關(guān)的產(chǎn)品,2017年,我當(dāng)時所在公司為一款人臉識別智能門鎖尋找芯片時,發(fā)現(xiàn)市場上根本找不到特別合適的產(chǎn)品,其實當(dāng)時心里就存下了一個想法——為什么市面上會沒有好用的芯片,困難在什么地方?因為跟清華大學(xué)微電子學(xué)研究所的尹首一教授也是舊相識,后來藉由種種機會,有過幾次比較深入的溝通,也了解到他們所研究的這項技術(shù)對于芯片產(chǎn)業(yè)的意義研究ai芯片,當(dāng)初的那個想法逐漸成型,并最終和尹老師他們一起在2018年成立清微智能。希望借助清華大學(xué)這支團隊十多年的技術(shù)積累,結(jié)合我在ai領(lǐng)域的商業(yè)落地的經(jīng)驗,將可重構(gòu)計算芯片商業(yè)化?!?br>顯然,可重構(gòu)架構(gòu)芯片的商用化背后很重要的推動力就是眾多電池供電的智能設(shè)備對低功耗ai芯片的需求。僅看智能音箱市場,根據(jù)市場研究公司strategy analytics發(fā)布的報告,2018年第四季度植入ai的智能音箱出貨量從第三季度的2260萬臺增長到3850萬臺,增幅達95%,超過整個2017年的出貨總量。報告還預(yù)測,2019年全球aiot市場規(guī)模為51億美元,到2024年,這一數(shù)字將增長至162億美元,復(fù)合年增長率為26.0%。
王博順勢從ai芯片的需求方轉(zhuǎn)變提供方,發(fā)揮可重構(gòu)芯片的優(yōu)勢。
清微tx210
量產(chǎn)的可重構(gòu)芯片究竟如何?
王博指出,清微的可重構(gòu)芯片主要分為三個維度,從mac層面支持不同的位寬重構(gòu),到執(zhí)行單元層面支持不同算子重構(gòu),再到陣列層面支持不同功能重構(gòu)。因此,清微的可重構(gòu)芯片既可以是“樂高”層級的可重構(gòu),也可以是“面粉”層級的可重構(gòu)。并且,配置過程運行速度非???,動態(tài)重構(gòu)的時間都是在納秒級,在運行的過程中是無縫執(zhí)行,客戶根本感覺不到芯片的架構(gòu)在實時切換,同時初始的配置也會很快,配置本身開銷很小。
清微智能cto歐陽鵬也透露,在可重構(gòu)計算更低能耗和更強靈活性的基礎(chǔ)上,清微在具體的芯片設(shè)計上又做了兩方面深化。他表示:“我們的ai芯片支持從1bit-16bit的混合精度計算,同時,不同的神經(jīng)網(wǎng)絡(luò)層可以采用不同的精度表示,可實現(xiàn)實時切換精度。在具體實現(xiàn)過程中,可重構(gòu)模式動態(tài)重組計算資源和帶寬,根據(jù)精度表示,讓計算資源和帶寬接近滿負(fù)荷進行計算,從而將混合精度網(wǎng)絡(luò)下的計算資源和帶寬的利用率逼近極限,高效支持多種混合精度的神經(jīng)網(wǎng)絡(luò)?!?br>“另外一方面,人工智能算法,除了神經(jīng)網(wǎng)絡(luò)中卷積層,全連接層等邏輯,還有非神經(jīng)網(wǎng)絡(luò)計算邏輯。傳統(tǒng)ai芯片架構(gòu)強調(diào)了神經(jīng)網(wǎng)絡(luò)邏輯的計算效率,卻忽視了非神經(jīng)網(wǎng)絡(luò)邏輯的計算效率。清微的ai芯片針對神經(jīng)網(wǎng)絡(luò)部分和非神經(jīng)網(wǎng)絡(luò)均進行了計算效率考慮。針對非神經(jīng)網(wǎng)絡(luò)處理邏輯,從算法數(shù)據(jù)流圖進行空間映射,以接近asic效率計算。同時,通過配置形成不同的電路結(jié)構(gòu)來動態(tài)處理不同非神經(jīng)網(wǎng)絡(luò)計算邏輯,在保證靈活性前提下,計算效率有極大提升?!?歐陽鵬進一步表示。
雷鋒網(wǎng)了解到,具備上述特性的清微tx210采用tsmc40ulp工藝,支持wlcsp和qfn兩種產(chǎn)品封裝,多級喚醒模式也很大程度降低了芯片功耗,工作功耗為mw級,vad功耗僅uw級。同時,tx210結(jié)構(gòu)靈活,支持多比特dnn神經(jīng)網(wǎng)絡(luò),可以支持1-16bit位寬的神經(jīng)網(wǎng)絡(luò)計算,也支持fft/mel filter等。還有一個顯著特點就是用極小的芯片面積支持豐富的接口和電源管理。
清微tx210 參數(shù)
除了硬件,清微也能在算法方面有所布局,采取自研+與科研院所合作的思路。目前清微與中科院、清華大學(xué)、喬治理工大學(xué)等開展了深入合作。自研方面,清微在算法壓縮,量化以及硬件友好化設(shè)計方面有長期的積累。
軟件方面,cgra軟件開發(fā)平臺兼容通用的tensorflow/caffe/mexnet等ai框架,用戶無需改變他們的編程環(huán)境和習(xí)慣,軟件開發(fā)平臺可以自動完成轉(zhuǎn)換、解析、編譯、生成等過程,給用戶提供友好的開發(fā)支持。
雖然用戶可以實現(xiàn)無縫遷移,但王博還表示:“我們有一套自己的編譯平臺,用戶可以從其它的框架直接遷移到我們芯片里。但我們內(nèi)部還會做一些包括量化、壓縮等與芯片相關(guān)的優(yōu)化工作?!?br>王博強調(diào),可重構(gòu)芯片能否達到非常高的能效值,很大一部分決定于軟件、工具鏈優(yōu)化、調(diào)度的好壞。
根據(jù)清微的說法,采用算法+芯片的協(xié)同設(shè)計優(yōu)化,tx210在典型信噪比下,喚醒識別率95%,誤識別率小于24小時一次。據(jù)悉,tx210正式上市前,清微已與一些大型的互聯(lián)網(wǎng)公司,智能手機及家電廠商建立了合作關(guān)系。
雷鋒網(wǎng)了解到,除了語音芯片,清微智能在下半年還會發(fā)布面向圖像識別的低功耗視覺芯片,面向智能家居、智能安防和新零售等領(lǐng)域。
王博認(rèn)為,可重構(gòu)芯片的商業(yè)化,不僅可以替代現(xiàn)有的產(chǎn)品,還能夠擴展現(xiàn)有產(chǎn)品的應(yīng)用場景,更好地滿足低功耗ai芯片市場的需求。隨著我們產(chǎn)品在邊緣端的落地,基于cgra軟硬件工具鏈以及生態(tài)也不斷完善,未來我們也會將cgra架構(gòu)算力可擴展、高能效、靈活的優(yōu)勢拓展至云端市場。
據(jù)王博介紹,在可重構(gòu)云端芯片方面,核心團隊在5年前就開始做技術(shù)預(yù)研和芯片驗證,面向云端人工智能算法的推理、訓(xùn)練、數(shù)據(jù)分析、數(shù)據(jù)庫操作等應(yīng)用。這些成果有助于清微快速進入對算力、靈活性、功耗以及生態(tài)要求更高的服務(wù)器和云計算市場。
數(shù)據(jù)流ai芯片或成未來主流
不過,目前cpu、gpu、fpga、asic在ai芯片市場激烈競爭,哪一種芯片能夠成為最大的受益者還難以得出結(jié)論??芍貥?gòu)計算架構(gòu)芯片在市場落地中優(yōu)勢如何?王博指出,可重構(gòu)技術(shù)可以很大程度的延長芯片的生命周期。目前終端的ai算法還在不斷演進,應(yīng)用也非常碎片化。而基于可重計算構(gòu)架的芯片具有低功耗、靈活、高效的優(yōu)勢,如果有新的神經(jīng)網(wǎng)絡(luò)算法出來,可重構(gòu)芯片在很長時間內(nèi)也能支持,并且是以接近asic的功耗滿足需求。不需要針對新的應(yīng)用重新流片,能夠大大節(jié)省成本。
更為重要的是,可重構(gòu)芯片代表的是采用的是數(shù)據(jù)驅(qū)動下的空域執(zhí)行模式,區(qū)別于cpu、gpu、npu諾依曼架構(gòu)的時域計算模式,數(shù)據(jù)流驅(qū)動的芯片從架構(gòu)上就可以避免了馮諾依曼架構(gòu)的限制。
“指令驅(qū)動”的時域計算模式 v.s. “數(shù)據(jù)驅(qū)動、動態(tài)重構(gòu)”的空間計算模式
王博用通俗的方式解釋數(shù)據(jù)流驅(qū)動的芯片,數(shù)據(jù)流直白的理解就像水流一樣,在流動過程中直接把計算完成,不用等待,非常高效。對比指令驅(qū)動的方式,因為它需要取值、譯碼、存在開銷,同時,這種方式使得中間的數(shù)據(jù)流被不斷打斷,執(zhí)行效率低。
王博認(rèn)為,數(shù)據(jù)流驅(qū)動的芯片在未來將會在ai以及對算力需求比較大的領(lǐng)域?qū)⒊蔀橹髁?。他表示:“因為這些場景需要的是強算力而非強邏輯,數(shù)據(jù)流驅(qū)動芯片特別適合。而之所以可重構(gòu)芯片和數(shù)據(jù)流驅(qū)動的芯片直到近年來才受到了比較多的關(guān)注,可能是因為學(xué)界和工業(yè)界的人之前都想讓它去完全替代馮諾依曼架構(gòu)。但如今ai讓大家回歸理性,認(rèn)識到計算密集型的場景最適合數(shù)據(jù)流驅(qū)動的芯片,我們也看到現(xiàn)在數(shù)據(jù)流驅(qū)動的芯片業(yè)都是圍繞密集計算?!?br>不過,想要真正發(fā)揮可重構(gòu)架構(gòu)的優(yōu)勢,讓數(shù)據(jù)流驅(qū)動的芯片成為主流仍需解決一些問題。王博指出,如果理解了可重構(gòu)的原理,不同的人都可以把各個pe以某種形式連接起來,關(guān)鍵是如何連接這些pe能更加靈活,編譯器的設(shè)計怎么能更加的提高效率,同時,數(shù)據(jù)流驅(qū)動的芯片同樣需要提升數(shù)據(jù)訪存效率的問題。清微的優(yōu)勢就在于有清華大學(xué)微電子學(xué)研究所多年的研究作為基礎(chǔ),我們的編譯系統(tǒng)非常完善,這是我們的軟件的優(yōu)勢。因此,我們能夠在可重構(gòu)架構(gòu)硬件優(yōu)勢的基礎(chǔ)上結(jié)合完善的軟件,最大程度發(fā)揮可重構(gòu)架構(gòu)芯片的優(yōu)勢。
雷鋒網(wǎng)小結(jié)
ai作為一個新的領(lǐng)域,無論是芯片還是算法都區(qū)別于傳統(tǒng)的數(shù)字、模擬等芯片,由此帶來的機會也催生了ai芯片的創(chuàng)業(yè)熱潮。在競爭還不夠充分的ai芯片市場,ai芯片的benchmark發(fā)布不久、ai算法的飛速演進,應(yīng)用沒有標(biāo)準(zhǔn),這么多的尚未確定也是ai芯片初創(chuàng)公司的機會所在。
但正如王博接受采訪時所說:“芯片研發(fā)是一個特別需要積累的過程,一款成熟的芯片要考慮功耗、發(fā)熱以及量產(chǎn)等各方面的問題,除了技術(shù)的更迭速度,還要經(jīng)受市場的考驗,用‘十億起步,十年結(jié)果‘形容一點不為過。”十億的成本投入以及十年的時間是芯片公司成功的要素,但將技術(shù)的獨特性轉(zhuǎn)換為產(chǎn)品的優(yōu)勢同樣是吸引用戶的關(guān)鍵。
作為一種新類別的ai芯片,清微量產(chǎn)的可重構(gòu)語音芯片能否推動相關(guān)應(yīng)用市場的爆發(fā),我們拭目以待。我們也期待數(shù)據(jù)流驅(qū)動的芯片更好地滿足密集計算場景需求,與馮諾依曼架構(gòu)芯片一起加速ai的普及。
創(chuàng)業(yè)成為時代的潮流,愛喜豆水族讓創(chuàng)業(yè)更有保障
如果沒有學(xué)歷沒有技能該如何創(chuàng)業(yè)
供應(yīng)Mentholatum/曼秀雷敦0防曬霜FDA注冊
2019年第23屆國際被動房大會吉祥物正式發(fā)布
龍頭企業(yè)幾字鋼大棚骨架生產(chǎn)基地
首發(fā) | 全新類別AI芯片量產(chǎn),清微的可重構(gòu)芯片將成市場主流?
鼎展金業(yè)全國招代理
二手六軸機械人批發(fā)-物流搬運機器人廠家-二手測試工業(yè)機器人
160PPR管 110PPR管材 110PPR熱水管
山東螺桿冷水機生產(chǎn)廠家,環(huán)保節(jié)能,制冷效果好,銷量行業(yè)領(lǐng)先
開聚財營養(yǎng)粥鋪店怎么樣?有什么好的營銷方法?
云南玉溪市稻田養(yǎng)殖小龍蝦苗
從Switch花落企鵝說起:騰訊的決心、任天堂的野望與白熱化的戰(zhàn)爭
720度球幕投影活動帳篷 展會慶典篷房
80后創(chuàng)業(yè)選擇什么好 投資加盟洗車人家洗車美容為你定制成功
承接工程義馬市外墻真石漆施工專業(yè)
無機玻璃鋼風(fēng)管用的地方越來越多
河南木漿海綿區(qū)域代理,正規(guī)經(jīng)銷商
開石材店利潤是多少 如何做好投資
泡沫玻璃管,泡沫玻璃管殼,泡沫玻璃管價格,AB級泡沫玻璃管