他呆了一瞬,才打開新聞,拉下去細看。
整篇新聞的口吻帶有一種明明很激動卻強自抑制的感覺,這小編也真是厲害,用特別理性客觀的文字把回聲從上到下夸了一個遍,還不著痕跡地介紹了新軟件的各種功能。
軟件的名字很普通,就叫回聲配音,和之前一模一樣。
只不過之前的回聲配音是個網頁程序,這回有了客戶端。
“基于這種劃時代語音合成技術,回聲科技目前僅發布‘回聲配音’一項產品,僅僅是這一款軟件,已經展現出令人震驚的功能效果。這一技術的后續開發非常值得期待。”
邵逸明看完軟件,強壓著內心的驚疑不定,去應用商店下載了手機a。
移動端的a設計非常簡單,就是輸入一段文字轉換成語音,帶有簡單的參數調試功能。
ai配音對硬件的要求相當高,手機端不能一次轉換太多內容,一次輸入僅限五十字。
邵逸明第一時間想到那個剛剛通過海選的動畫劇本,隨意從劇本中拉出一句詞輸入進去。
文字輸入完畢,蹦出挑選音色的選項,預置音色有最基本的童音、少年、青年、中年、老年,每一樣都分男女。
點擊某個音色,就直接輸出聲音。
僅僅是一句簡短的對話,邵逸明點開每一個音色來回聽了三遍,越聽越覺得難以置信。
是語音合成,真正的語音合成。
和軟件唱歌不一樣,語音合成不是簡單的聲音排列組合,還需要自然語言處理,識別文字語義等等。現在,程序識別出了某句話的語義,根據語義配置了合理的起伏、韻律和聲調,然后播放出來。
逼真程度之高,就像是有一個真人在手機里說話一樣!
程序的表達不一定最動聽,但絕對是符合語境的,讓人找不出違和感。
換句話說,軟件不具有頂尖配音演員的實力,但是卻具有普通配音演員的能力。
邵逸明強自鎮定,安慰自己說平平無奇,沒有靈魂。別怕別怕。
機器終歸是機器,就算能配音,也只是套路化模仿人的語氣,配不出有力量的情感表達。就像是演技拙劣的演員非要去演戲
他隨便選了一個音色,點擊確認,來到了下一個頁面——情感選擇。
下面有四個滑條,分別是喜悅、激動、憤怒、恐懼。
邵逸明滑動這四個滑條的時候,感覺異常不真實,就好像在滑動圖片的rbg滑條一樣。
滑動之后,實時生成的語音果然出現了微妙的語氣變化。
這一頁下面還有一樣小字“登陸電腦客戶端,調節更多情感維度,還可以自行設計維度模型,保存參數建立情感濾鏡。”
邵逸明猶豫了一下,沒有理會,點擊確定來到下一個頁面。
這一步的名字叫“音頻液化”,選擇一個參數,在屏幕上生成一條曲線,手指涂抹就可以改變曲線的形狀,縱軸是該項參數,橫軸是時間。
音量是一條直線,用手指向上抹出一個小山包,山包對應的時間段的音量就會發生變化。
語調是曲線,可以用手指涂抹直接改變聲調的上揚或下抑。