思必馳迎來產(chǎn)品化全面收獲期,堅定源頭技術(shù)創(chuàng)新及研發(fā)
自成立以來,思必馳通過“終端+AI”、“行業(yè)+AI”等方式深度賦能各行業(yè)場景,促進(jìn)諸多應(yīng)用落地。
作為一家對話式人工智能平臺公司,思必馳深諳“技術(shù)為王,創(chuàng)新為本”的重要性。
如今的思必馳擁有全鏈路的智能語音語言技術(shù),自主研發(fā)了新一代人機(jī)交互平臺(DUI)和人工智能芯片(TH1520);為車聯(lián)網(wǎng)、IoT及政務(wù)、金融等眾多行業(yè)場景合作伙伴提供自然語言交互解決方案。
憑借雄厚的AI技術(shù)實力與廣泛的產(chǎn)品落地業(yè)務(wù),2020年,思必馳完成Pre-IPO輪融資,隨后完成股份制改造。
此時的思必馳,依然保持沉著,穩(wěn)中求進(jìn)地進(jìn)行著核心技術(shù)的研發(fā)與升級,并探索更多場景的落地。
升級與進(jìn)化:讓交互有溫度,讓使用更便捷
2021年,思必馳在多項核心技術(shù)上取得進(jìn)展。在保持這一良好發(fā)展勢頭的同時,今年以來,思必馳繼續(xù)不斷突破自我。
發(fā)音人音色定制平臺
音色,是每個人獨有的聲音特色,也是虛擬人表達(dá)情感、對外溝通不可或缺的部分。強(qiáng)大的音色定制能力讓虛擬偶像更為鮮活。然而,當(dāng)前市場上傳統(tǒng)人工合成音色定制服務(wù)通常流程較為復(fù)雜,技術(shù)門檻較高,需要大量人力相互配合,定制成本與定制周期也讓很多使用者望而卻步。
今年3月,思必馳推出易操作的發(fā)音人音色定制平臺。該平臺是思必馳提供的一項進(jìn)行音色定制訓(xùn)練的平臺服務(wù),旨在賦能用戶自主完成語音合成音色模型定制,降低語音合成定制門檻。使用者只需要根據(jù)自身場景需要,上傳一定量符合規(guī)定標(biāo)準(zhǔn)的音頻,即可一站式完成自動標(biāo)注、模型定制、質(zhì)量評測。
目前,該平臺支持定制中英文、成人男女、兒童等類別,以及幽默、嚴(yán)肅、甜美、中性等各種情感風(fēng)格的音色,可以滿足客戶在在消費電子產(chǎn)品、明星動漫熱門IP、數(shù)字人客服、有聲讀物、新聞播報等多個領(lǐng)域的應(yīng)用需求。
DUI標(biāo)注訓(xùn)練一體化平臺2.0
為幫助企業(yè)在智能化轉(zhuǎn)型中,擁有更高的技術(shù)自主性,思必馳曾推出DUI標(biāo)注訓(xùn)練一體化平臺,通過平臺化的方式開放智能語音算法能力,賦能不同類行業(yè)/企業(yè)在使用語音服務(wù)中,擁有數(shù)據(jù)標(biāo)注、模型訓(xùn)練能力,持續(xù)提升場景識別效果。目前平臺提供語音技術(shù)定制化服務(wù),在會議、航空通訊、醫(yī)療、城市交通、門店質(zhì)檢等垂直場景里運用。用以提升企業(yè)服務(wù)、管理效率。
而經(jīng)過一年的使用實踐,目前平臺也迎來了2.0的版本升級。升級后,公有云版正式開放,同時推出便攜一體機(jī)版本,擁有更強(qiáng)的擴(kuò)展性,隨用隨調(diào),使用更便捷。更低的平臺使用門檻,減輕研發(fā)人員投入。升級后的平臺支持公有云、私有云、便攜一體機(jī)等多種靈活的接入形式,服務(wù)均可定制化。
接下來,思必馳DUI標(biāo)注訓(xùn)練一體化平臺將持續(xù)深入語音識別優(yōu)化鏈路,持續(xù)推動DUI平臺從“服務(wù)賦能”向“能力賦能”轉(zhuǎn)變,賦予用戶更大的自主權(quán)。
直面喚醒+智能降噪+聲紋識別
針對在全屋智能一體化家居場景或賣場場景下多設(shè)備的情況,思必馳新推出“直面喚醒”方案,通過模擬人耳的算法模型可以幫助用戶優(yōu)先喚醒其中某一個設(shè)備,避免幾個設(shè)備同時被喚醒,判斷更精準(zhǔn)、更符合用戶的交互習(xí)慣。該方案近期也入選了長三角2021年度人工智能產(chǎn)業(yè)“十大科技事件”。
在綜合運用信號處理、回聲消除、聲源定位等技術(shù),并且配合AI語音專用芯片TH1520及麥克風(fēng)陣列,思必馳在家居、車載、辦公等多領(lǐng)域落地了智能降噪案例,憑借強(qiáng)大的AI性能,提升語音通話質(zhì)量,為用戶帶來更純凈的語音交互。
值得一提的是,疫情之下,聲紋識別技術(shù)填補了遠(yuǎn)程身份驗證的市場需求,在銀行數(shù)字化轉(zhuǎn)型里大放異彩。除了作為全新的身份認(rèn)證“活密碼”為金融安全保駕護(hù)航,思必馳聲紋識別技術(shù)更在出行場景中,有了新嘗試。
運用于電動兩輪車領(lǐng)域的思必馳聲紋解鎖方案誕生,讓出行更自由?;诠潭ㄎ谋?隨機(jī)驗證碼認(rèn)證,融合文本相關(guān)和文本半相關(guān)的聲紋識別方案,獲得了比固定文本更高的聲紋識別率,且有效防止被提前錄音,具備了更高的安全性。
成就與榮譽:從算法到芯片,多項技術(shù)均獲行業(yè)認(rèn)可
經(jīng)過多年的積累與沉淀,思必馳擁有全鏈路的智能對話核心技術(shù)。強(qiáng)大的技術(shù)創(chuàng)新能力,也讓思必馳的多項語音技術(shù)均獲得行業(yè)認(rèn)可。
在各項榮譽里,今年2-3月,思必馳連續(xù)登頂中文醫(yī)療權(quán)威榜單CBLUE2.0。
在各類賽事上,思必馳也屢獲佳績。思必馳-上海交大人機(jī)交互聯(lián)合實驗室團(tuán)隊(AISP-SJTU,下稱:聯(lián)合實驗室)在繼去年6月份取得Text-to-SQL任務(wù)英文基準(zhǔn)榜單Spider第一名后,今年4月又取得Text-to-SQL任務(wù)中文千言榜單第一名。就在2022年國際口語機(jī)器翻譯評測比賽(簡稱IWSLT)中,聯(lián)合實驗室憑借卓越的技術(shù)優(yōu)勢,獲得“英-中同聲傳譯”(Speech-to-Text)賽道冠軍。值得一提的是,IWSLT是國際上最具影響力的口語機(jī)器翻譯評測比賽之一,今年設(shè)置了同聲傳譯、離線語音翻譯等7個任務(wù)。
在學(xué)術(shù)交流中,聯(lián)合實驗室在相關(guān)方向的頂級國際會議上已發(fā)表多篇論文。例如,針對Text-to-SQL任務(wù)中用戶問句和數(shù)據(jù)庫模式的聯(lián)合異構(gòu)圖編碼挑戰(zhàn),提出了基于線圖增強(qiáng)的LGESQL模型,相關(guān)成果發(fā)表于ACL 2021主會;針對單輪問答式Text-to-SQL任務(wù)不同領(lǐng)域之間,由詞表差異引發(fā)的領(lǐng)域遷移和泛化問題,提出了ShadowGNN模型,將結(jié)構(gòu)和語義信息解耦,相關(guān)成果已發(fā)表于NAACL 2021主會等等。
而在行業(yè)標(biāo)準(zhǔn)與測評中,思必馳先后參與國家標(biāo)準(zhǔn)《中文語音合成互聯(lián)網(wǎng)服務(wù)接口規(guī)范》與行業(yè)標(biāo)準(zhǔn)《中文語音合成服務(wù)系統(tǒng)評估規(guī)范》的制定,并成為全國首批通過評估測評的公司之一。
思必馳中文語音識別系統(tǒng)、聲紋識別服務(wù)、智能對話等多項技術(shù)均通過中國信通院認(rèn)證,獲得《語音識別服務(wù)能力專項評估證書》《聲紋識別服務(wù)能力基礎(chǔ)評估證書》《智能對話系統(tǒng)等級評估證書》《智能對話產(chǎn)品評估能力證書》。
這些成就與榮譽的達(dá)成,與思必馳堅持產(chǎn)學(xué)研一體化道路緊密關(guān)聯(lián)。
此前思必馳在智慧辦公產(chǎn)品發(fā)布會上表示,將堅持從三大方面做對話式人工智能技術(shù):
一是全鏈路語音交互技術(shù),覆蓋從信號處理、語音識別、語音合成到語義理解、對話管理等鏈路,從感知智能走向認(rèn)知智能;
二是堅持軟硬一體化,配套算法技術(shù)方案,協(xié)同自研AI芯片,思必馳為大量產(chǎn)品做了軟硬件協(xié)同優(yōu)化;
三是大規(guī)模可定制,基于自研的大量遷移學(xué)習(xí)技術(shù),從對特定場景或設(shè)備進(jìn)行快速定制。
落地與破局:“終端+AI”、“行業(yè)+AI”兩手抓
自成立以來,思必馳已通過“終端+AI”、“行業(yè)+AI”方式深度賦能各行業(yè)場景,促進(jìn)諸多應(yīng)用落地。
與此同時,思必馳也在不斷修煉內(nèi)功,探索提升自身的產(chǎn)品力。
除了在智能家居、智能汽車、消費電子等領(lǐng)域探索,思必馳更在AI+新場景思路下不斷嘗試,今年在智慧辦公領(lǐng)域也帶來別樣驚喜。
今年2月,思必馳拓展在智慧辦公領(lǐng)域的探索,針對個人用戶,推出了靈活便攜的智能硬件產(chǎn)品360°降噪會議麥克風(fēng)音箱,聚焦在遠(yuǎn)程辦公、線上學(xué)習(xí)的使用場景,目前已上線京東售賣。
5月,思必馳又發(fā)布了智能會議解決方案,賦能政企邁入智慧辦公新發(fā)展階段。
針對政企用戶的數(shù)智化辦公升級,推出智能會議解決方案及智能辦公終端產(chǎn)品AIMIC-M12、轉(zhuǎn)寫一體機(jī)T1,帶來通話降噪、收音擴(kuò)音、實時語音轉(zhuǎn)寫等服務(wù)。
無論是針對個人用戶的會議麥克風(fēng)音箱,還是針對政企服務(wù)的智能會議解決方案及產(chǎn)品,無不說明著,在車載和家庭兩大消費市場排兵布陣后,思必馳對于社會生產(chǎn)生活、政企服務(wù)領(lǐng)域的重視和展望。
據(jù)相關(guān)數(shù)據(jù)顯示,2020年的智慧辦公行業(yè)市場規(guī)模達(dá)548.5億元,年復(fù)合增長率高達(dá)14.5%。未來五年,預(yù)計中國智慧辦公行業(yè)將以12.8%的增長率持續(xù)增長,并于2023年達(dá)到829億元左右的市場規(guī)模。
路漫漫其修遠(yuǎn)兮,思必馳又將如何“上下求索”,時間自有答案。