這家企業做可重構計算芯片,3年量產3顆,清華團隊創建
“以軟件定義硬件”為主要特征的可重構計算架構正成為芯片的新風潮之一。
美國提出的旨在支撐美國2025-2030年電子技術能力的“電子復興計劃”,其核心關鍵技術就是可重構計算;基于該技術的核心團隊斯坦福大學的SambaNova,目前是全球估值最高的AI芯片獨角獸企業;英特爾、英偉達、賽靈思等企業也紛紛開始布局可重構架構相關芯片業務。
隨著芯片行業的發展,昔日被奉為圭臬的摩爾定律正面臨失效討論。在萬物互聯時代,數據激增,對算力提出更高要求。可重構計算芯片等新型架構出現,也可謂是恰逢其時,相比傳統計算架構,它有百倍性能提升。
在國內,清微智能是可重構計算芯片的領軍企業,這家依托于清華微電子所在可重構計算領域內近二十年技術積累的企業,在成立的三年時間內,已有三顆芯片量產,上千萬顆芯片落地應用,成為全球商業應用規模最大的可重構計算芯片企業。從清微智能的創業歷程與發展脈絡,我們也能一窺可重構計算芯片的發展潛力與未來趨勢,一條解決芯片國產化問題的差異化道路。
依托清華微電子所技術積累,開啟第二次創業
“如果當年大學選擇物理專業,也許就沒有今天的創業了。”在回憶創業時,清微智能創始人王博笑著調侃道。
大學報志愿時,因為對通信行業前景的看好,王博放棄自己擅長的物理專業,選擇了北京郵電大學。
他是一名跨領域的連續創業者。畢業之后,王博在導師公司參與研究中國第一代數字交換機、路由器。2006年,他又進入云計算領域,成為漢柏科技CTO。漢伯科技在人臉識別技術等領域亦是行業先行者,并進行了廣泛落地應用。
清微智能成立則源于在漢柏科技期間,王博帶著團隊想找一款高性能、低功耗的AI芯片,但調研了許多企業,都不盡如人意。
后來,在好友介紹下,王博認識了清華大學微電子所副所長、Thinker芯片團隊帶頭人尹首一,兩人深聊之后,都希望將可重構芯片進行產業化落地。彼時,清華微電子所是可重構計算架構學術領域的先行者,深耕已久——2006年清華可重構實驗室成立;2015年起,清華微電子所將可重構架構應用在AI計算、神經網絡計算場景,并設計了一系列AI芯片。
2018年,王博帶領清華大學可重構計算團隊創辦了清微智能。“那時候雖然還沒有貿易戰,但我始終覺得芯片產業技術密集、產值巨大,屬于高端產業,中國人必須要把核心的東西掌握在自己手里。而可重構計算計算一是底層技術,二是核心知識產權在我們自己手里,三是通用靈活,適合智能化程度越來越高的時代需求,我們有希望走出一條不同于國外的路線。”王博說
截至目前,面向AIOT的產品系列,其高性能,強大的靈活性已經得到了市場驗證,在一些細分領域,甚至能占據60%以上的市場份額。清微智能也已經順利完成三輪融資,背后包括國開裝備、百度戰投、君海創芯等一眾知名投資機構。
今年三月,清微智能完成數億元B輪融資,由國開裝備基金領投,商湯國香資本、明智資本、北京集成電路尖端芯片基金及原股東君海創芯、卓源資本跟投。
目前,清微智能共有邊緣端的TX2系列、TX5系列芯片和用于服務器領域的TX8系列三類芯片。
其中,TX2和TX5系列芯片產品已應用至智能安防、金融支付、智能穿戴,智能機器人等多個領域,涵蓋多家品牌客戶和數百方案商。
TX8系列芯片則是面向云端數據中心、智算中心等場景,用可重構數據流提供無限擴展能力和高密度高能效計算能力,目前,已與多家重點企業簽署了戰略合作協議。
用可重構計算架構,突破芯片瓶頸
原清華大學微電子所所長、IEEE Fellow魏少軍,也是第一代可重構計算架構的締造者,他曾解釋稱,可重構芯片不屬于CPU、GPU、FPGA 或 ASIC,它是一種全新類別的芯片,其特點是軟件硬件都可以編程、混合粒度、芯片的硬件功能隨軟件的變化而變化,應用改變軟件、軟件再改變硬件。
此外,傳統的計算架構采用的是指令驅動的時域計算模式,在指令執行過程中需要頻繁的搬運數據、訪問存儲器,這些高頻的操作會導致芯片的功耗過高。
據悉,在傳統的計算芯片里面,將近占80%的系統資源都是用來做數據存儲或者做計算前的準備,僅有20%用于計算。對比之下,可重構計算計算芯片則可以將系統資源用于計算,極大提升效率。
但須知可重構計算并非新鮮事物。公開資料顯示,20世紀60年代末,加利福尼亞大學的Geraid Estrin首次提出重構計算,彼時受限于技術未能實現。據維基百科,上世紀八十年代面世的FPGA可算得上是“可重構”概念的產物。
可重構計算被《國際半導體技術路線圖》評為最具前景的未來計算架構,美國電子復興計劃(ERI)將可重構計算技術列為未來美國在電子行業一直保持領導地位的核心關鍵技術,是后摩爾時代的顛覆性技術之一。
王博介紹,相比傳統架構,可重構計算在算力越大的場景里,優勢越明顯。同時它具備即時重構、高能效、低功耗、通用性、靈活性等諸多特點。以用戶端感受而言,在使用手機時,電話降噪效果更好、待機時間更長。
他舉例介紹道,可重構計算芯片在可穿戴設備里面代替了傳統DSP,在音頻降噪算法上,相比傳統DSP,能降低5~10倍能耗。
“同樣的功耗限制之下,我們可以提供更大的算力,比如傳統架構上,每瓦大約三至五個個T的算力,我們是每瓦十個T的算力水平。”王博說。
以傳統安防廠商為例,通過可重構計算芯片,可以提供靈活可編程的ISP能力,跑更復雜的算法,在人臉識別、車輛識別上等場景達到更高的精準度。
而到了云端大算力場景,會面臨更大算力和更加靈活多樣的任務需求,計算系統會越來越復雜,功耗成了更大的挑戰,兼顧靈活性以及更高能效比的可重構芯片優勢會更加明顯。
依托于清華微電子所深厚的技術積累,王博的第二次創業可謂是開展迅速,但初期在產品上,他還是踩了一個很大的“坑”。
2019年6月,清微智能推出的第一顆可重構計算架構芯片——超功耗智能芯片TX210,這款芯片具備超高能效特性支持always-on語音識別,待機時間超過40小時,并在三年內取得數百萬顆的銷量。
但后續市場發生了一個劇烈變化,許多知名企業很聰明的在主芯片上做了TX210的功能集,用戶不再愿意為一個單獨的芯片付費。
“這是公司最大的的一次試錯。”也讓王博深刻認識到:尋找一個長期穩定的方向,做“硬通貨”產品。
整體來看,清微智能沿著小算力、中算力、大算力的產品路徑進行研發,今年正在研發的面向云端服務的TX8系列芯片,可重構計算具有天然可擴展性,通過資源擴展增加算力,適配云端AI復雜算法應用需求時,其一次性配置的代價邊際,會隨著在當前配置下的硬件被多次執行而降低。同時,面對云端應用算法的數據流特性,基于CGRA的調度,以空域并行的方式執行,可以大大提高CGRA資源的利用率,提高云端應用的吞吐量,解決數據中心規模不斷擴大帶來的能效問題。目前,清微智能芯片銷售超千萬顆,客戶含阿里、騰訊、海康,華為、國網,商湯,小米等,去年營收數千萬,今年營收預計在兩個億左右。
資本涌入、搶芯片人才……機遇挑戰并存
作為國內可重構計算芯片的先行者,王博說,清微智能TX8系列芯片的目標是做中國的英偉達。
雖然是榜樣,但英偉達等巨頭企業入局,王博也并不慌張,除了清華微電子所十余年的技術積累,他認為創業公司的唯一優勢是“天生沒有包袱”。“巨頭公司,需要延續歷史的兼容性,只能從很小的一些點去切入,進行技術升級。但我們現在做的TX8系列芯片,改變原有的以存儲為中心,通過交換機擴展的架構方式,采用完全的數據可重構,不需要大量的存儲器開銷,在寄存器直接傳導數據,這種高度靈活的數據流重構能力,大大提高了計算效率。”
“不可否認,芯片行業正面臨時代機遇,但也難免會產生泡沫。”王博說,政策紅利、資本涌入,會助力企業加速發展,但同樣也會推高成本,還要看企業如何抉擇。
疫情之下,王博說,企業也面臨諸多挑戰,比如下游工廠因封控造成的供應鏈緊張,但更大的挑戰來自于人才。
“資本涌入,芯片人才供不應求,讓行業的平均投入推高了至少一倍。企業之間挖墻腳、搶芯片人才的現象幾乎每天都在上演……”王博介紹,除了提升員工薪資水平之外,也會通過期權承諾、員工福利關懷等多種途徑穩定“軍心”。
人才成本劇增引起的多米諾骨牌效應之一便是,企業追求低端化市場,將面臨一定危機。
“隨著芯片售價下降,生產成本又居高不下,芯片行業的另一挑戰在于毛利下降,盈利空間變小。”王博認為,從另一個角度而言,倒逼產業鏈升級,推動整個行業朝著高端化方向發展。
資本涌入的另一影響在于,企業的發展速度要更快。“資本重押之下,壓力肯定是有的,你會發現每個細分賽道上都有很多創業公司在做同樣的事情,這時候你要跑的更快,更加貼近你的客戶需求。”
B輪融資之后,王博介紹,清微智能將進一步夯實已有市場,快速推出新一代通用TX8大算力芯片。有消息稱:清微TX8隊伍目前已匯集了在Intel、蘋果等公司工作多年的主架構師,還有不少來自英偉達、阿里的工程技術骨干,產品力爭明年下半年進行小范圍交付。