五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言

首頁 > 機器人資訊 > 為了讓機器聽懂你的聲音,深度學習是如何發揮作用的?

為了讓機器聽懂你的聲音,深度學習是如何發揮作用的?

日期:2019-03-06   人氣:  來源:互聯網
簡介:為了讓機器聽懂你的聲音,深度學習是如何發揮作用的? 深度學習在2006年嶄露頭角后,近幾年取得了快速發展,在學術界和工業界均呈現出指數級增長的趨勢;伴隨著這項技術的不斷成熟,深度學習在智能語音領域率先發力,取得一系列成功的應用。本文將重點分享……

為了讓機器聽懂你的聲音,深度學習是如何發揮作用的?

深度學習在2006年嶄露頭角后,近幾年取得了快速發展,在學術界和工業界均呈現出指數級增長的趨勢;伴隨著這項技術的不斷成熟,深度學習在智能語音領域率先發力,取得一系列成功的應用。本文將重點分享近年來深度學習在語音生成問題中的新方法,圍繞語音合成和語音增強兩個典型問題展開介紹。

一、深度學習在語音合成中的應用

語音合成主要采用波形拼接合成和統計參數合成兩種方式。波形拼接語音合成需要有足夠的高質量發音人錄音才能夠合成高質量的語音,它在工業界中得到了廣泛使用。統計參數語音合成雖然整體合成質量略低,但是在發音人語料規模有限的條件下,優勢更為明顯。在上一期我們重點介紹了深度學習在統計參數語音合成中的應用,本期將和大家分享基于波形拼接的語音合成系統,圍繞Siri近期推出的語音合成系統展開介紹,它是一種混合語音合成系統,選音方法類似于傳統的波形拼接方法,它利用參數合成方法來指導選音,本質上是一種波形拼接語音合成系統。

單元選擇是波形拼接語音合成系統的基本難題,需要在沒有明顯錯誤的條件下將合適的基元組合在一起。語音合成系統通常分為前端和后端兩個部分,前端模塊對于提高語音合成系統的表現力起到非常重要的作用。前端模塊將包含數字、縮寫等在內的原始文本正則化,并對各個詞預測讀音,解析來自文本的句法、節奏、重音等信息。因此,前端模塊高度依賴于語言學信息。后端通過語言學特征預測聲學參數,模型的輸入是數值化的語言學特征。模型的輸出是聲學特征,例如頻譜、基頻、時長等。在合成階段,利用訓練好的統計模型把輸入文本特征映射到聲學特征,然后用來指導選音。在選音過程中需要重點考慮以下兩個準則:(1)候選基元和目標基元的特征必須接近;(2)相鄰兩個基元的邊界處必須自然過渡。可以通過計算目標代價和拼接代價評估這兩個準則;然后通過維特比算法計算最優路徑確定最終的候選基元;最后通過波形相似重疊相加算法找出最佳拼接時刻,因此生成平滑且連續合成語音。

Siri的TTS系統的目標是訓練一個基于深度學習的統一模型,該模型能自動準確地預測數據庫中單元的目標成本和拼接成本。因此該方法使用深度混合密度模型來預測特征值的分布。這種網絡結構結合了常規的深度神經網絡和高斯混合模型的優勢,即通過DNN對輸入和輸出之間的復雜關系進行建模,并且以概率分布作為輸出。系統使用了基于MDN統一的目標和拼接模型,該模型能預測語音目標特征(譜、基頻、時長)和拼接成本分布,并引導基元的搜索。對于元音,有時語音特征相對穩定,而有些時候變化又非常迅速,針對這一問題,模型需要能夠根據這種變化性對參數作出調整,因此在模型中使用嵌入方差解決這一問題。系統在運行速度、內存使用上具有一定優勢,使用快速預選機制、單元剪枝和計算并行化優化了它的性能,可以在移動設備上運行。

二、深度學習在語音增強中的應用

通過語音增強可以有效抑制各種干擾信號,增強目標語音信號;有效的語音增強算法一方面可以提高語音可懂度和話音質量,另一方面有助于提高語音識別和聲紋識別的魯棒性。經典的語音增強方法包括譜減法、維納濾波法、最小均方誤差法,上述方法基于一些數學假設,在真實環境下難以有效抑制非平穩噪聲的干擾;诿し蛛x的非負矩陣分解方法也得到了一定關注,但是這類方法計算復雜度相對較高;近年來,基于深度學習的語音增強方法得到了越來越多的關注,接下來重點介紹幾種典型的基于深度學習的語音增強方法。

1.預測幅值譜信息

這類方法通過深層神經網絡模型建立帶噪語音和干凈語音譜參數之間的映射關系,模型的輸入是帶噪語音的幅值譜相關特征,模型的輸出是干凈語音的幅值譜相關特征,通過深層神經網絡強大的非線性建模能力重構安靜語音的幅值譜相關特征;神經網絡模型結構可以是DNN/BLSTM-RNN/CNN等;相比于譜減、最小均方誤差、維納濾波等傳統方法,這類方法可以更為有效的利用上下文相關信息,對于處理非平穩噪聲具有明顯的優勢。

2.預測屏蔽值信息

采用這類方法建模時模型的輸入可以是聽覺域相關特征,模型的輸出是二值型屏蔽值或浮點型屏蔽值,最常用的聽覺域特征是Gamma濾波器相關特征,這種方法根據聽覺感知特性將音頻信號分成不同子帶提取特征參數;對于二值型屏蔽值,如果某個時頻單元能量是語音主導,則保留該時頻單元能量,如果某個時頻單元能量是噪聲主導,則將該時頻單元能量置零;采用這種方法的優勢是,共振峰位置處的能量得到了很好的保留,而相鄰共振峰之間波谷處的能量雖然失真誤差較大,但是人耳對這類失真并不敏感;因此通過這種方法增強后的語音具有較高的可懂度;浮點值屏蔽是在二值型屏蔽基礎上進一步改進,目標函數反映了對各個時頻單元的抑制程度,進一步提高增強后語音的話音質量和可懂度。

3.預測復數譜信息

目前主流的語音增強方法更多的關注于對幅值譜相關特征的增強而保留原始語音的相位譜,隨著信噪比的降低相位譜失真對聽感的影響明顯增強,在低信噪比條件下,有效的相位重構方法可以有助于提高語音可懂度;一種典型的相位重構方法是利用基音周期線索對濁音段的相位進行有效修復,但是這類方法無法有效估計清音段的相位信息;復數神經網絡模型可以對復數值進行非線性變換,而語音幀的復數譜能夠同時包含幅值譜信息和相位譜信息,可以通過復數神經網絡建立帶噪語音復數譜和干凈語音復數譜的映射關系,實現同時對幅值信息和相位信息的增強。

4.PIT說話人分離

通過說話人分離技術可以將混疊語音中不同的說話人信息有效分離出來,已有的基于深度學習的說話人分離模型受限于說話人,只能分離出特定說話人的聲音;采用具有置換不變性的訓練方法得到的說話人分離模型不再受限于特定說話人;這種方法通過自動尋找分離出的信號和標注的聲源之間的最佳匹配來優化語音增強目標函數;模型的輸入是混疊語音的譜參數特征,模型的輸出包含多個任務,每個任務對應一個說話人;在訓練過程中,對于訓練集中一個樣本內,每個任務固定對應某個說話人;可以采用BLSTM-RNN模型結構建模。

5.DeepClustering說話人分離

基于深度聚類的說話人分離方法是另一種說話人無關的分離模型,這種方法通過把混疊語音中的每個時頻單元結合它的上下文信息映射到一個新的空間,并在這個空間上進行聚類,工業機器人維修,使得在這一空間中屬于同一說話人的時頻單元距離較小可以聚類到一起;將時頻單元映射到新的空間跟詞矢量抽取的思想有些類似,可以通過k均值聚類的方法對時頻單元分組,然后計算二值型屏蔽值分離出不同說話人的語音,也可以通過模糊聚類的方法描述不同的時頻單元,工業機器人維修,然后計算浮點型屏蔽值后分離混疊語音。基于深層聚類的方法和基于PIT的方法有著各自的優勢,為了更有效的解決問題,可能需要將兩種方法有效的結合。

6.基于對抗網絡的語音增強

免責聲明:本網部分文章和信息來源于互聯網,本網轉載出于傳遞更多信息和學習之目的。如轉載稿涉及版權等問題,請立即聯系網站所有人,我們會予以更改或刪除相關文章,保證您的權利。
五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言
日本视频在线一区| 97精品国产97久久久久久久久久久久| 亚洲日本在线a| av欧美精品.com| 中文字幕一区二区不卡| 国产精品一区二区视频| 国产精品久久夜| 欧美日本一区二区三区四区| 亚洲一区二区三区四区中文字幕| 欧美日韩三级在线| 日本不卡中文字幕| 精品三级在线观看| 色婷婷av久久久久久久| 亚洲一卡二卡三卡四卡| 91精品国产品国语在线不卡| 久久国产剧场电影| 日韩欧美国产一区二区在线播放| 奇米精品一区二区三区四区| 国产欧美日韩在线| 91丨porny丨国产| 日韩电影免费一区| 亚洲自拍偷拍网站| 久久精品视频一区二区三区| 欧美三级一区二区| 91在线观看美女| 国产剧情一区二区| 日本vs亚洲vs韩国一区三区二区| 国产午夜亚洲精品不卡| 欧美日韩国产首页| 色综合天天做天天爱| 国产一区二区在线电影| 午夜精品123| 亚洲欧美另类图片小说| 久久久久青草大香线综合精品| 欧美中文字幕一二三区视频| 国产成人精品一区二区三区四区| 亚洲一区二区三区精品在线| 国产精品丝袜黑色高跟| 精品国产一区久久| 欧美一区二区视频网站| 欧美性猛交xxxx黑人交| 99久久国产免费看| 成人黄色一级视频| 国产成人av一区二区三区在线| 秋霞午夜av一区二区三区| 亚洲成av人片在线观看无码| 最新久久zyz资源站| 久久久久久久久99精品| 日韩精品资源二区在线| 欧美一二三四在线| 91精品国产麻豆国产自产在线| 欧美亚洲综合网| 91成人网在线| 欧美亚洲精品一区| 欧美特级限制片免费在线观看| 色婷婷久久久久swag精品| 菠萝蜜视频在线观看一区| 国产盗摄精品一区二区三区在线| 国产尤物一区二区| 国产福利一区二区三区视频 | 亚洲制服欧美中文字幕中文字幕| 综合中文字幕亚洲| 亚洲午夜免费福利视频| 首页亚洲欧美制服丝腿| 免费观看在线综合| 黄一区二区三区| 欧美一卡二卡三卡四卡| 91精品婷婷国产综合久久性色| 国产精品亚洲综合一区在线观看| 久久99九九99精品| 国产麻豆精品95视频| 国产乱码精品一区二区三| 九九国产精品视频| 国产精品系列在线观看| 成人av手机在线观看| 色婷婷综合视频在线观看| 欧美综合色免费| 91精品国产一区二区三区香蕉| 91精品国产麻豆| 国产亚洲污的网站| 亚洲美女视频一区| 日韩影院免费视频| 国产精品996| 91精品福利在线| 日韩免费视频线观看| 中文字幕二三区不卡| 亚洲图片欧美视频| 国产一区在线观看麻豆| 不卡免费追剧大全电视剧网站| 日本精品一区二区三区四区的功能| 欧美日韩在线三级| 国产午夜久久久久| 五月激情综合色| 国产91露脸合集magnet| 在线精品国精品国产尤物884a| 91蜜桃免费观看视频| 717成人午夜免费福利电影| 精品日韩av一区二区| 国产欧美日韩不卡| 日韩精品五月天| 韩国一区二区视频| 国产69精品一区二区亚洲孕妇| 在线一区二区三区| 2021中文字幕一区亚洲| 亚洲欧洲精品天堂一级| 久久超碰97人人做人人爱| 不卡电影一区二区三区| 欧美电影免费观看高清完整版在| 日韩美女视频一区| 国产一区二区三区四区五区入口 | 欧美精品在线视频| 久久久久久久性| 天天av天天翘天天综合网| 久久丁香综合五月国产三级网站| 国产原创一区二区| 欧美xxxxxxxx| 亚洲国产美女搞黄色| www.性欧美| 久久九九久久九九| 久久av老司机精品网站导航| 欧美日韩三级视频| 一区二区三区欧美在线观看| 国产成人精品影视| 久久婷婷久久一区二区三区| 无吗不卡中文字幕| 欧美亚洲国产一区二区三区va | 亚洲va中文字幕| eeuss鲁片一区二区三区在线看| 日韩精品一区二区三区三区免费| 亚洲一区二区精品视频| 91色porny在线视频| 中文字幕不卡在线播放| 国产成人午夜电影网| 久久久久久麻豆| 国产一区二区在线影院| 精品久久久久久久久久久久包黑料 | 欧美三区在线观看| 亚洲综合无码一区二区| 色先锋资源久久综合| 亚洲视频香蕉人妖| 在线日韩av片| 亚洲五码中文字幕| 欧美日韩一区二区三区在线| 一区二区视频在线看| 在线免费观看日韩欧美| 亚洲精品亚洲人成人网| 色综合激情久久| 手机精品视频在线观看| 日韩欧美色综合网站| 精品一区二区在线视频| 久久久久九九视频| 丰满少妇久久久久久久| 国产精品麻豆网站| 欧美视频在线一区二区三区 | 婷婷综合另类小说色区| 在线电影一区二区三区| 久久国产麻豆精品| 一区二区中文字幕在线| 欧美视频精品在线| 免费在线观看日韩欧美| 欧美精品一区二区高清在线观看| 国产在线精品免费av| 国产精品视频一二三| 色域天天综合网| 男男视频亚洲欧美| 亚洲丝袜精品丝袜在线| 欧美特级限制片免费在线观看| 蜜桃在线一区二区三区| 日本一区二区三区免费乱视频| 91麻豆免费看| 久久免费午夜影院| 成人激情动漫在线观看| 亚洲视频一二区| 欧美男人的天堂一二区| 九九精品一区二区| 一区二区三区四区在线播放| 日韩欧美一区二区免费| 成人高清伦理免费影院在线观看| 亚洲综合视频网| 精品国产人成亚洲区| 色综合中文字幕国产 | 欧美日本精品一区二区三区| 日韩av在线免费观看不卡| 在线视频国产一区| 日本午夜精品一区二区三区电影| 91精品国产综合久久久蜜臀粉嫩| 国产一区在线看| 亚洲一级二级三级在线免费观看| 日韩精品在线一区| 色综合天天在线| 国产suv精品一区二区三区| 亚洲电影中文字幕在线观看| 日本一区二区三区电影| 日韩亚洲欧美一区| 欧美在线观看视频在线| 国产盗摄精品一区二区三区在线| 视频精品一区二区| 亚洲国产一二三| 亚洲精品国产品国语在线app| 国产欧美一区视频|