注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件工程及軟件方法學(xué)復(fù)雜環(huán)境下語(yǔ)音信號(hào)處理的深度學(xué)習(xí)方法

復(fù)雜環(huán)境下語(yǔ)音信號(hào)處理的深度學(xué)習(xí)方法

復(fù)雜環(huán)境下語(yǔ)音信號(hào)處理的深度學(xué)習(xí)方法

定 價(jià):¥168.00

作 者: 張曉雷 著
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787302590002 出版時(shí)間: 2022-01-01 包裝:
開(kāi)本: 頁(yè)數(shù): 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  語(yǔ)音降噪處理是信號(hào)處理的重要分支領(lǐng)域。近年來(lái),該領(lǐng)域在人工智能與深度學(xué)習(xí)技術(shù)的驅(qū)動(dòng)下取得了突破性進(jìn)展?!稄?fù)雜環(huán)境下語(yǔ)音信號(hào)處理的深度學(xué)習(xí)方法》系統(tǒng)總結(jié)語(yǔ)音降噪處理的深度學(xué)習(xí)方法,盡可能涵蓋該方法的前沿進(jìn)展。全書(shū)共分8章。第1章是緒論;第2章介紹深度學(xué)習(xí)的基礎(chǔ)知識(shí)和常見(jiàn)的深度網(wǎng)絡(luò)模型;第3~6章集中介紹基于深度學(xué)習(xí)的語(yǔ)音降噪處理前端算法,其中,第3章介紹語(yǔ)音檢測(cè),第4章介紹單通道語(yǔ)音增強(qiáng),第5章介紹多通道語(yǔ)音增強(qiáng),第6章介紹多說(shuō)話人語(yǔ)音分離;第7章和第8章分別介紹基于深度學(xué)習(xí)的語(yǔ)音降噪處理在聲紋識(shí)別和語(yǔ)音識(shí)別方面的應(yīng)用,其中著重介紹基于深度學(xué)習(xí)的現(xiàn)代聲紋識(shí)別、語(yǔ)音識(shí)別基礎(chǔ)和前沿進(jìn)展?!稄?fù)雜環(huán)境下語(yǔ)音信號(hào)處理的深度學(xué)習(xí)方法》專業(yè)性較強(qiáng),主要面向具備一定語(yǔ)音信號(hào)處理和機(jī)器學(xué)習(xí)基礎(chǔ)、致力于從事智能語(yǔ)音處理相關(guān)工作的高年級(jí)本科生、研究生和專業(yè)技術(shù)人員。

作者簡(jiǎn)介

  張曉雷,西北工業(yè)大學(xué)教授,博士生導(dǎo)師。清華大學(xué)博士,美國(guó)俄亥俄州立大學(xué)博士后。入選國(guó)家與省部級(jí)青年人才計(jì)劃。主要從事語(yǔ)音信號(hào)處理、機(jī)器學(xué)習(xí)、人工智能的研究工作。在Neural Networks、IEEE TPAMI、IEEE TASLP、IEEE TCYB、Computer Speech and Language等國(guó)際期刊和會(huì)議發(fā)表論文六十余篇。出版專著和譯著各一部。主持國(guó)家和省部級(jí)項(xiàng)目十余項(xiàng)。獲授權(quán)發(fā)明專利十余項(xiàng)。曾獲國(guó)際神經(jīng)網(wǎng)絡(luò)學(xué)會(huì)與Neural Networks期刊2020年度論文獎(jiǎng)、亞太信號(hào)與信息處理學(xué)會(huì)杰出講者、北京市科學(xué)技術(shù)一等獎(jiǎng)等獎(jiǎng)項(xiàng)。研究成果成功應(yīng)用于國(guó)內(nèi)三大電信運(yùn)營(yíng)商和金融、交通、保險(xiǎn)等行業(yè)的二十余家主流企業(yè)。擔(dān)任Neural Networks、IEEE TASLP、EURASIP Journal on Audio, Speech,and Music Processing等國(guó)際期刊的編委,IEEE信號(hào)處理學(xué)會(huì)語(yǔ)音與語(yǔ)言技術(shù)委員會(huì)委員,中國(guó)人工智能學(xué)會(huì)模式識(shí)別專業(yè)委員會(huì)委員,中國(guó)計(jì)算機(jī)學(xué)會(huì)語(yǔ)音對(duì)話與聽(tīng)覺(jué)專業(yè)委員會(huì)委員。

圖書(shū)目錄

第1章 緒論
第2章 深度學(xué)習(xí)基礎(chǔ)
2.1 有監(jiān)督學(xué)習(xí)
2.2 單層神經(jīng)網(wǎng)絡(luò)
2.2.1 基本模型
2.2.2 激活函數(shù)
2.3 前饋深度神經(jīng)網(wǎng)絡(luò)
2.3.1 反向傳播算法
2.3.2 正則化
2.4 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4.1 循環(huán)神經(jīng)網(wǎng)絡(luò)基礎(chǔ)
2.4.2 長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)
2.4.3 門(mén)控循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4.4 深層RNN結(jié)構(gòu)
2.4.5 序列數(shù)據(jù)的RNN建??蚣?br />2.5 卷積神經(jīng)網(wǎng)絡(luò)
2.5.1 卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)
2.5.2 其他卷積形式
2.5.3 殘差神經(jīng)網(wǎng)絡(luò)
2.5.4 時(shí)序卷積網(wǎng)絡(luò)
2.6 神經(jīng)網(wǎng)絡(luò)中的歸-化
2.6.1 批歸-化
2.6.2 層歸-化
2.7 神經(jīng)網(wǎng)絡(luò)中的注意力機(jī)制
2.7.1 編碼器-解碼器框架
2.7.2 編碼器,注意力機(jī)制一解碼器框架
2.7.3 單調(diào)注意力機(jī)制
2.7.4 Transformer
2.8 生成對(duì)抗網(wǎng)絡(luò)
2.8.1 基本結(jié)構(gòu)
2.8.2 模型訓(xùn)練
2.9 本章小結(jié)
第3章 語(yǔ)音檢測(cè)
3.1 引言
3.2 基本知識(shí)
3.2.1 信號(hào)模型
3.2.2 評(píng)價(jià)指標(biāo)
3.3 語(yǔ)音檢測(cè)模型
3.3.1 語(yǔ)音檢測(cè)模型的基本框架
3.3.2 基于深度置信網(wǎng)絡(luò)的語(yǔ)音檢測(cè)
3.3.3 基于降噪深度神經(jīng)網(wǎng)絡(luò)的語(yǔ)音檢測(cè)
3.3.4 基于多分辨率堆棧的語(yǔ)音檢測(cè)模型框架
3.4 語(yǔ)音檢測(cè)模型的損失函數(shù)
3.4.1 最小化交叉熵
3.4.2 最小均方誤差
3.4.3 最大化ROC曲線下面積
3.5 語(yǔ)音檢測(cè)的聲學(xué)特征
3.5.1 短時(shí)傅里葉變換的頻帶選擇
3.5.2 多分辨率類耳蝸頻譜特征
3.6 模型的泛化能力
3.7 本章小結(jié)
第4章 單通道語(yǔ)音增強(qiáng)
4.1 引言
4.2 基本知識(shí)
4.2.1 信號(hào)模型
4.2.2 評(píng)價(jià)指標(biāo)
4.3 頻域語(yǔ)音增強(qiáng)
……
第5章 多通道語(yǔ)音增強(qiáng)
第6章 多說(shuō)話人語(yǔ)音分離
第7章 聲紋識(shí)別
第8章 語(yǔ)音識(shí)別
參考文獻(xiàn)

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)