回顧科大訊飛“平臺化”十年:AI生態(tài)發(fā)展生生不息,平臺開放開源
每年的10月24日,是程序員的盛會;“1024開發(fā)者節(jié)”則是科大訊飛的技術盛宴。
“1024開發(fā)者節(jié)”是全球首個以AI人工智能技術開發(fā)者為主要受眾群體的行業(yè)盛會,由科大訊飛主辦,一直為全球各地的開發(fā)者們提供交流,探索前沿科技成果的科技平臺。2017年,科大訊飛舉辦了第一屆“1024開發(fā)者節(jié)”,今年已經(jīng)是第四屆。
在今年的“1024開發(fā)者節(jié)”上,科大訊飛宣布開放由磐石平臺和擎天平臺組成的訊飛AI平臺。
十年前,也是在十月份,科大訊飛發(fā)布了全球首個同時提供語音合成、語音搜索、語音聽寫等智能語音交互能力的移動互聯(lián)網(wǎng)智能交互平臺“訊飛語音云”。
十年的成長,訊飛開放平臺已經(jīng)具備334種復雜的AI能力,應用終端數(shù)已超過20億個,開發(fā)者團隊也已增長至150萬支以上。
可以說,科大訊飛的十年“平臺化”,見證了中國前沿科技從移動互聯(lián)網(wǎng)向人工智能的轉變。在人口紅利逐步弱化,移動互聯(lián)網(wǎng)時代退場同時,人工智能技術紅利期隨之而來。科大訊飛董事長劉慶峰談及人工智能紅利期的衡量標準是表示,在人工智能從技術到應用落地過程中,有越來越多的領域紅利都在實實在在地兌現(xiàn),而判斷AI紅利是否到來的三大標準,一是有具體的場景;二是有能夠規(guī)模化推廣的產品;三是能證明產品和服務可以創(chuàng)造一定的社會價值。
“一個企業(yè)的成功,絕不是單獨成為一個帝國,做帝國注定會衰落。只有愿意以自己為核心,開放出自己的資源和能力,形成的產業(yè)鏈,形成的生態(tài)體系,才能夠生生不息的去發(fā)展。我們一直堅定不移的認為,只有生態(tài)才能生生不息。”劉慶峰談到。
科大訊飛這十年,也是在構建AI開發(fā)者生態(tài),技術生態(tài)全方位探索和布局的十年。在2020科大訊飛全球1024開發(fā)者節(jié)上,科大訊飛高級副總裁、消費者事業(yè)群總裁胡國平現(xiàn)場公布了訊飛開放平臺聯(lián)合艾瑞咨詢共同發(fā)布的《2020中國人工智能API經(jīng)濟白皮書》。
根據(jù)《2020中國人工智能API經(jīng)濟白皮書》,2019年中國人工智能開放平臺市場規(guī)模104億,預計2020年市場規(guī)模可達222億。A.I.開放平臺目前仍處于初級階段,未來仍將保持高速增長,艾瑞預計未來5年CAGR在41%左右。
科大訊飛“平臺化”的十年
在科大訊飛“1024開發(fā)者節(jié)”的現(xiàn)場,有一條長長的時間走廊,記錄著科大訊飛這十年來的“平臺化”成果。
2010年10月28日,科大訊飛首次科大訊飛首次向行業(yè)發(fā)布基于互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)的語音識別和語音合成引擎,即“訊飛語音云”。 科大訊飛副總裁于繼棟回憶道,“最初的訊飛語音云只有語音合成和識別兩個通用能力。”
到2012年,訊飛推出語音助手,在2012年到2013年一年間的裝機量就已經(jīng)達到了1.2億。第二年,訊飛語音助手的語音交互語音交互速度提高到200毫秒以內,縮短至人能夠反映的極限水平。同年,科大訊飛在語種識別領域研發(fā)出BN-ivec技術。
2014年,科大訊飛正式啟動“訊飛超腦計劃”,研發(fā)基于類神經(jīng)網(wǎng)絡的認知智能系統(tǒng)。到2015年,人工智能開源熱潮來臨,科大訊飛發(fā)布人工智能時代的人機交互界面AIUI。此后,科大訊飛基于深度學習AI向各領域滲透。
2017年,科技部公布了首批百度、阿里云、騰訊云、科大訊飛四家國家新一代人工智能開放創(chuàng)新平臺名單。
“從2016年開始,我們整個開發(fā)者進入了一個快速增長階段,在2019年首次突破了百萬開發(fā)者。通過對百萬開發(fā)者的優(yōu)化服務,我們把能力和方案進行大面積的擴展。目的是讓開發(fā)者能夠輕松快捷的開發(fā)出自己符合自己場景需要的這樣一些應用出來。所以,從2019年開始,我們不斷的在平臺上擴展能力和解決方案,到現(xiàn)在為止我們已經(jīng)達到了334項的能力和方案。已經(jīng)覆蓋到了230萬的開發(fā)者和生態(tài)合作伙伴。”于繼棟說道。
在開發(fā)者服務上,從最早支持安卓、iOS系統(tǒng),到今年,科大訊飛也率先在行業(yè)支持了鴻蒙OS的語音識別和語音合成。此外,在行業(yè)的探索上,科大訊飛還開放了涵蓋翻譯、直播、農業(yè)、無接觸、數(shù)據(jù)標注、司法、醫(yī)療、智慧城市等14個行業(yè)的專題,整合了包括AI中臺、數(shù)字中臺等一些中臺,并對開發(fā)者開放。
在過去10年,訊飛開放平臺從早期的只有語音合成和識別兩個通用能力,到今天可以呈現(xiàn)334種更復雜的A.I.的能力;從最早不到10萬的應用終端數(shù),到今天的20多億應用終端數(shù);從最早創(chuàng)業(yè)者只有十幾個團隊創(chuàng)業(yè)者,到如今的150多萬開發(fā)者團隊……科大訊飛董事長劉慶峰表示,正是這樣一個又一個的登頂和攀登的過程,使開發(fā)者們看到了越來越遠、越來越大的未來。
訊飛開放平臺發(fā)布訊飛AI
今年的疫情作為一場“黑天鵝事件”,強推全民進入數(shù)字化生存時代。“在疫情穩(wěn)定之后,我們發(fā)現(xiàn)基于訊飛開放平臺上的開發(fā)者進入了一個更加快的增長節(jié)奏,連續(xù)三個季度的復合增長率已經(jīng)超過了53%,這是一個繼2016年以來的又一次的一個快速增長。”在于繼棟看來,這一次的快速增長離不開人工智能的大面積普及,以及新基建帶來的機遇。
對此,于繼棟表示,當前,智能升級、數(shù)字轉型、創(chuàng)新融合企業(yè)數(shù)字化升級的終局是智能化。“A.I.+大數(shù)據(jù)”已經(jīng)成為企業(yè)拓寬新局面的決定性因素。以數(shù)據(jù)為引擎,A.I.將驅動企業(yè)實現(xiàn)內生增長,從業(yè)務智能化到商業(yè)決策優(yōu)化,企業(yè)將在人工智能助力下發(fā)現(xiàn)新的價值空間。
針對企業(yè)更加個性化的定制需求,基于訊飛開放平臺十年技術積累,于繼棟在本次平臺產品發(fā)布會上發(fā)布了訊飛AI云。據(jù)了解,訊飛AI云由磐石平臺和擎天平臺組成。
其中,磐石平臺主要針對AI服務,能夠對云主機集群進行103項專業(yè)優(yōu)化,降低成本、提升效率。同時,它還擁有多重認證與加密,能夠保障專屬云用戶的接入安全。
擎天平臺則主要為企業(yè)客戶提供數(shù)據(jù)標注、模型訓練、引擎托管、服務編排等服務,以在全方位滿足不同行業(yè)客戶面對不同業(yè)務場景的AI需求。
經(jīng)過兩年半發(fā)展,訊飛開放平臺已經(jīng)引入了超過500家優(yōu)質服務商,通過AI+招聘、培訓、財務、營銷、門店(新零售)、客服等方式,幫助上游企業(yè)客戶解決他們在發(fā)展過程中遇到的場景定制化問題。
五大板塊構建AI科技樹
如何保持核心技術領先,如何實現(xiàn)技術上的不斷突破?科大訊飛AI研究院常務副院長劉聰提出了“AI科技樹”的構筑理念。
劉聰表示,“AI科技樹”包括五大板塊,分別是語音識別、語音合成、圖像識別OCR、多語種方向以及行業(yè)認知方向,并向開發(fā)者開放相關內容。
在語音識別板塊,劉聰認為語音識別需要持續(xù)的去挑戰(zhàn)更加復雜的場景,去實現(xiàn)從語音到聲音,從單純的文字內容的識別,到音頻的全場景解析。而語音識別的另外一個趨勢,可以通過自學習更新的方式,實現(xiàn)各種層次的個性化能力。
對此,訊飛推出了一個多維度自學習的平臺,提供給開發(fā)者進行模型方案的更新,以及針對某些產品,實現(xiàn)在端側直接實現(xiàn)用戶無感知的個性化訓練。
在語音合成板塊,劉聰提到,語音合成技術的發(fā)展方向不能只以單純追求自然度為目標,而是要追求用戶可感知的技術,同時技術的呈現(xiàn)也需擁有更高的表現(xiàn)力。因此,語音合成也需要實現(xiàn)從語音到聲音的全場景音頻合成。
在這一個板塊,訊飛一方面基于自然語言理解技術,從文本當中分析到合適的情感焦點以及角色相關的信息,并通過語音的方式呈現(xiàn)出來;另一方面,針對不同場景打造不同的背景音樂及音效,并通過單一的情感合成升級到面向交互場景的解決方案,呈現(xiàn)出一個全場景的合成音頻。
在圖像識別OCR領域,訊飛基于第四代OCR技術框架,結合圖神經(jīng)卷及網(wǎng)絡等結構話分析,以及基于對抗生成網(wǎng)絡的圖文數(shù)據(jù)生成技術,實現(xiàn)高精度的文檔恢復等行業(yè)痛點。劉聰表示,訊飛也將各種場景、各種細分能力的OCR能力提供給開發(fā)者。“截止今年九月份,此相關能力的調用量已經(jīng)超過10億次,并且呈快速發(fā)展的趨勢。“
在多語種板塊,訊飛將開放60個語種的語音合成系統(tǒng)、69個語種的語音識別系統(tǒng)、56個語種的圖文識別系統(tǒng)等多語種能力。其中,語音識別系統(tǒng)平均識別率超80%。
在行業(yè)認知方向,訊飛達布了認知中臺,能夠降低問題定義的難度,大幅度提升場景定制的效率。劉聰表示,認知中臺將在近期上線,未來訊飛也將持續(xù)開放更多的產品和功能。
“除了上述的幾個方向,伴隨著科技樹枝葉的持續(xù)點亮,訊飛科技樹的全景已經(jīng)展現(xiàn)在大家的眼前,我想從原始的一顆種子發(fā)展到參天大樹,科技樹的每一片枝葉、每一個技術背后都蘊含了大量的付出和努力。”劉聰坦言,未來,會一如既往的讓科技樹更加茂盛,并通過行業(yè)應用反哺,持續(xù)發(fā)揮價值。
平臺化趨勢,打造技術生態(tài)
除了在本次“1024開發(fā)者節(jié)”上發(fā)布并表示開放的平臺外,科大訊飛還擁有AI全棧服務開放平臺“能力星云”和iFLYHOME OS開放平臺。
“能力星云”以云端一體化技術框架iFLY-AIKit為基礎,給開發(fā)者提供服務,AI引擎開發(fā)者可用iFLY-AIKit所提供的引擎平臺,將自己開發(fā)的AI算法模型接入訊飛能力星云,實現(xiàn)快速服務化。
iFLYHOME OS包括Home SAMS和Home SLS兩大子系統(tǒng),Home SAMS(Screen Ability Mall System)致力于為核心屏(大屏)本身的應用服務提供交互基礎能力,具備海量終端覆蓋、核心能力可定制優(yōu)化、交互內容支持一鍵生成、用戶聚類服務精準營銷等優(yōu)勢。
Home SLS(Screen Link System)則針對核心屏周邊的各類設備,可為設備間互聯(lián)互通提供協(xié)議及管理支持,此外,Home SLS還具備藍牙/WiFi/蜂窩網(wǎng)絡多協(xié)議支持、終端認證+敏感詞過濾保障內容安全、可提供標準化控制信令和展示模板、支持設備聯(lián)動場景編輯等優(yōu)勢。
此外,在“1024開發(fā)者節(jié)”上,科大訊飛還正式發(fā)布“訊飛·‘順風耳’圖聆工業(yè)云平臺”據(jù)悉,訊飛·“順風耳”圖聆工業(yè)云平臺作為跨行業(yè)、跨領域的A.I.工業(yè)互聯(lián)網(wǎng)平臺,結合了人工智能、5G、IIoT等新技術,圍繞設備預測性維護、產品質檢、人機交互、安全生產、工藝參數(shù)優(yōu)化等工業(yè)應用場景,構建了面向能源化工、機械制造等眾多行業(yè)的全棧式A.I.賦能平臺,可為各類企業(yè)提供標準A.I.能力、工業(yè)A.I.模型訓練平臺和相關的工業(yè)物聯(lián)設備。
從科大訊飛的財報中,也不難看出科大訊飛的“平臺化”趨勢,在2020年6月份的半年報中,科大訊飛開放平臺收入達5.58億,占總營收比例為12.83%,而在2019年6月份的半年報中,開放平臺營收額為4.58億,占比11.51%。
從科大訊飛產品業(yè)務線來看,科大訊飛開放平臺已經(jīng)成為繼教育領域、智慧城市、政務法務后,第四大產品收入來源。
和百度、華為、阿里、騰訊等行業(yè)頭部企業(yè)一樣,科大訊飛成立這20年的時間,歷經(jīng)了中國互聯(lián)網(wǎng)時代的繁盛與衰落,也見證了人工智能時代在中國的初現(xiàn)。從互聯(lián)網(wǎng)到人工智能時代,科大訊飛也一直在“平臺化”的道路上耕耘著,就像李彥宏在《智能經(jīng)濟》一書中提到,“這是一個大生態(tài)、大協(xié)同、大成長的時代,開放開源,共生協(xié)同,各得其所,是面向未來的態(tài)度。”
猜你喜歡
天津與百度深化合作背后:人工智能,給城市帶來了什么?
復盤過往全球各座城市的興衰規(guī)律,其背后最關鍵的一個要素便是“新技術”帶來的“新產業(yè)”。如果哪座城市率先在“新技術”領域占據(jù)先發(fā)優(yōu)勢,誰就會贏來一次巨大的城市躍遷機遇。中國AI加速出海,科大訊飛香港公司開業(yè)布局全球
6月24日,科大訊飛香港公司在香港數(shù)碼港開幕,標志著其國際總部正式落戶香港。科大訊飛:2024年營收233.43億元,毛利同比增長18.7%至99.5億元
現(xiàn)金流創(chuàng)下歷史新高,截至2024年末,全年經(jīng)營性現(xiàn)金流凈流入24.95億元,同比增長超6倍。智譜AI啟動上市:累計融資超200億,虧損約20億
智譜有望在2025年底前遞交申報材料,成為北交所的“AI大模型第一股”。