再見,我的萬元配音設備;你好,耳朵經濟先行者“聲咖”
你喜歡的網絡小說,一直沒有轉換成有聲讀物?
先來看兩組數據:第六屆中國網絡文學論壇曾經公布一組數據,2020年全國網絡文學網站超過550家,作家1750萬人,網絡小說2500萬部;參考頭豹研究院的調研,58%的有聲閱讀用戶希望提高音頻質量,比“減少廣告推送”、“豐富品類和內容”分別高出6.9%、8.5%。
換言之,以當前有聲閱讀產品的形態,聽感這一關還沒過,如何能夠提升產量?
現在網絡閱讀平臺上有兩種聽書模式,一種是機器為主,直接將文字由AI轉為語音;一種是人力為主,由配音演員錄制。前者可以轉化所有小說,但情感不足,不夠生動,收聽體驗有待提高;后者情感充沛,體驗較好,但成本高,數量受限。
那么,是否有將機器和人優勢結合的方式,實現數量和質量的二合一,最終達到省時、省錢、省事的目的?
近日,騰訊PCG AI交互部旗下的音視頻創作平臺——聲咖,發布了AI 有聲小說配音功能,機器的低成本、高效率與“人聲”的充沛情感、高質量融合在AI下,成為首款針對有聲小說配音的AI制作平臺。
技術聲優時代,即將到來。
效率風潮
這兩天,李念(化名)將好不容易湊齊的專業錄音設備掛到了閑魚上。
2018年大三時,沒了繁重課業負擔的他開始網絡創作。一方面在晉江平臺發布網文作品,一方面錄制相關有聲小說。在言情小說的圈子,也算小有名氣。
剛開始,他的精力集中在文字創作上,后來,投入經費將宿舍改造為錄音室。很快,李念意識到了問題。話筒、耳機、放大器、監聽音箱……設備還沒全部到位,已經花了超過10000元,而他平時創作使用的電腦,加上鼠標、機械鍵盤、外接曲面屏顯示器,一共也不到8000元。
“錄制有聲小說的投入產出比很低。”只是貴了點,李念也就忍了,可是配音需要大量的練習與試錯,逐漸侵占他文字創作的時間。能賺錢的沒時間安排,不賺錢的還要繼續搭錢,在這樣的困境中掙扎了四年,他還是放棄了。
配音的確門檻很高。傳統錄制場景中,配音員是關鍵因素,錄音設備是必備條件,匯集兩樣外部資源后,經過角色分析、內容錄制、后期剪輯等全制作周期,才能產出優質作品。解決這些問題對專業人士也是挑戰,何況李念這樣的“門外漢”。
而像李念這樣的內容創作者們,是有聲小說的重要來源之一。錄音設備昂貴、制作周期長的高門檻,“攔住”無數參與者們,直接導致有聲小說的產出效率過低。在以配音員為核心的生產模式下,提升產量的方式是找到更多人,談何容易?
如果找不到那么多人,通過技術手段在網絡空間實現功能虛擬化,能否解決這些問題?
之前,有企業借助AI的TTS技術,將文本文案轉制為聲音文案,比如訊飛快讀、配音娃、配音員吧等應用,在一定程度上緩解了有聲文本對配音員的依賴,降低了制作成本。然而段落切分與主要角色識別的問題,仍然需要眾多人力實現。
眼下,騰訊PCG AI交互部將所有問題匯總后,給出了進一步的解決方案。
“技術手段確實提升了效率。”接觸到“聲咖”之后,李念對各項功能進行體驗。在后臺自動完成“AI配音”基礎上,他還能手動調節停頓、語速以及詞組連續性,朗讀更加流暢自然,情緒也更加飽滿。
在這些功能幫助下,AI配音不再是過去的文字“流水賬”,而是變為一種能夠理清主線,區分角色,合理表達情感的定制化流程。這為有聲讀物擺脫了對人的高度依賴,告別產出難題提供了極大的想象空間。
這樣看來,在有聲讀物領域,聲咖正在卷起一場技術引領的效率風潮。
“729”成全民標配
只要有效率,所有問題都能迎刃而解嗎?未必,這一點在廣播劇《三體》上體現得非常充分。
在原創小說大獲成功后,喜馬拉雅開始策劃制作廣播劇。一經發行,即獲得眾多原著粉的追捧。有統計數據顯示,截至2021年中旬,《三體》六季廣播劇播放量超過7070萬次,超過227萬人訂閱專輯。
《三體》廣播劇的成功離不開原著精彩的故事,更少不了幕后精心制作。制作方邀請了729聲工場參與制作,專業聲優對劇情、人物、感情的理解非常深刻,且擁有高水平的演繹技巧,這是吸引用戶的關鍵。
然而專業的背后,是全劇高昂的制作成本,以及漫長的制作周期。千萬級的投入,疊加長達數年的錄制,天然決定著有聲精品的產量不會太高。精品需要由專業的配音員,用更長的時間打造,他們具有不可替代性。
“聲音是一種觸覺,幫我們打開更加性感的文學維度。”正如北京大學中文系教授邵燕君所言,用戶需要的不只是“聲音填滿碎片化時間”,還有更加優質的聽覺體驗。
對于這個問題,聲咖也給出了解決方案。它采用跨說話人風格的遷移技術,形成了多情感、多方言配音員的音色模型,這些模型使用層級VAE (Variational Auto-encoder,變分編碼器)編碼語音中的韻律信息,解耦其中的音色和韻律信息,讓聲音有了性格。
目前,聲咖能模擬幾十種小說配音員,具備渾厚、磁性、溫婉、親切、成熟等不同的音質,能夠講出東北話、陜西話、四川話、天津話等方言,表達開心、憤怒、悲傷、驚訝、恐懼、厭惡等6種情緒。
同時,聲咖還能夠智能識別全文角色,并將這些不同的聲音分配給不同角色;此外,通過技術能力識別文章中對話的說話人和情緒,進而實現多角色、多情感的合成,進而實現效率、高質二合一。
有聲小說示例音頻: 進度條 00:00 / 00:43 后退15秒 倍速 快進15秒
更為突出的是,聲咖全線功能限時免費,輔以更加友善的操作界面與強大的計算能力,沖破原本束之高閣的專業壁壘。
“一千個讀者眼中就會有一千個哈姆雷特”,如今創新技術給了他們機會,創造最符合他們想象的有聲讀物。
“聲音自由”
每當出現一款熱門作品,發行部門總會盡快協調資源,盡快填補門類空缺,以覆蓋更多用戶的體驗訴求,有聲讀物是其中重要門類。
現實中并不缺少成熟案例。以熱門IP《斗破蒼穹》為例,2010年該作品一經發布就獲得了眾多讀者的追捧,熱度始終不減。隨即,發行方推出有聲讀物,同樣獲得理想成績,參考網絡來源的數據,《斗破蒼穹》站內播放量累計已超過10億次。
某種意義上,網絡文學已經超越了作者寫作、讀者閱讀的“產出-供給”短線關系,形成了平臺方集合各類資源,圍繞成熟IP進行長周期、多品類開發,滿足多元需求的價值體系。換言之,只要作品質量上乘,就能在平臺見到相應有聲讀物,唯一的問題就是時間。
當一個市場成長的動力,不是企業在前面拉,而是需求在身后推,快速發展是必然的事情。正如某研究院的觀點,部分上游出版企業和音頻制作企業逐步向中游有聲閱讀業務滲透,產業鏈上中游呈現一體化發展趨勢,行業將迎來快速發展期。
任何一個產業的快速發展,都離不開生產工具的迭代,對于有聲小說來說,依靠愛好者、配音公司的純“人力”生產模式已不再匹配行業發展的需求,“人力+AI”是大勢所趨,各種AI工具的出現讓有聲小說內容創作者們離“聲音自由”更進一步。而對于聲咖來說,它的價值從來不是“小眾圈子的玩具”,而是實現“聲音自由”的生產工具之一。
結語
某種意義上,騰訊PCG AI交互部的“聲咖”有聲小說配音功能,是一次AI在垂直行業的探索。在“耳朵經濟”需求,內容產出不斷,以及AI降低制作門檻下,有聲小說從小眾到大眾還有多遠?
水大才能魚大,當上游“開閘”,有聲小說產業鏈上的版權方、平臺方、用戶,都將從中受益。