注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計算機(jī)/網(wǎng)絡(luò)人工智能說話人識別模型與方法

說話人識別模型與方法

說話人識別模型與方法

定 價:¥53.00

作 者: 吳朝暉,楊瑩春 著
出版社: 清華大學(xué)出版社
叢編項: 中國計算機(jī)學(xué)會學(xué)術(shù)著作叢書
標(biāo) 簽: 人工智能

ISBN: 9787302189688 出版時間: 2009-03-01 包裝: 平裝
開本: 16開 頁數(shù): 329 字?jǐn)?shù):  

內(nèi)容簡介

  說話人識別是根據(jù)語音波形中反映說話人生理和行為的特征的語音參數(shù),自動識別說話人身份的技術(shù)。本書作者結(jié)合多年的科研丁作,分5個部分介紹了說話人識別的基本概念、方法以及最新研究進(jìn)展。第1部分概括介紹說話人識別的主要概念、基本原理、研究歷史與現(xiàn)狀,以及測試語料庫的構(gòu)建;第2部分介紹作者對特征提取提出的不同改進(jìn)方法,包括特征組合與特征變換;第3部分是作者提出的新的說話人識別模型,包括支持向量機(jī)、動態(tài)貝葉斯網(wǎng)絡(luò)、主成分分析;第4部分介紹作者在基于信息融合的說話人識別上的創(chuàng)新工作;第5部分介紹作者開發(fā)的一個軟件平臺及其基礎(chǔ)上的兩個具體應(yīng)用系統(tǒng),最后是全書總結(jié)并展望發(fā)展趨勢。本書可供信息工程、電子工程、計算機(jī)科學(xué)與技術(shù)、公安、軍事偵察等領(lǐng)域的科技工作者參考,也可以作為高等院校信號與信息處理、通信與電子系統(tǒng)、模式識別、生物醫(yī)學(xué)等學(xué)科專業(yè)的研究生或高年級本科生的教學(xué)參考書。

作者簡介

暫缺《說話人識別模型與方法》作者簡介

圖書目錄

第一篇 緒論
第1章 背景與概述
1.1 研究背景及意義
1.1.1 說話人識別介紹
1.1.2 說話人識別的優(yōu)勢與應(yīng)用前景
1.2 研究進(jìn)展與趨勢
1.2.1 研究歷史
1.2.2 研究現(xiàn)狀
1.2.3 發(fā)展趨勢
1.2.4 存在的問題
1.3 本書結(jié)構(gòu)
參考文獻(xiàn)
第2章 技術(shù)基礎(chǔ)與理論
2.1 背景知識
2.2 說話人識別系統(tǒng)結(jié)構(gòu)
2.3 特征提取
2.3.1 預(yù)處理
2.3.2 美爾倒譜特征
2.3.3 線性預(yù)測系數(shù)
2.3.4 Delta特征和Delta_Dclta特征的計算
2.3.5 聲門特征
2.4 說話人識別模型
2.4.1 高斯混合模型
2.4.2 隱馬爾可夫模型
2.4.3 動態(tài)時間規(guī)整模型
2.4.4 向量量化模型,
2.5 得分規(guī)整
2.6 系統(tǒng)性能評價
2.6.1 評價指標(biāo)
2.6.2 性能與用戶規(guī)模的關(guān)系
2.6.3 實際使用要求
2.7 小結(jié)
參考文獻(xiàn)
第3章 說話人識別語料庫
3.1 常用語料庫
3.2 面向移動互聯(lián)環(huán)境的說話人識別語料庫(SRMC)
3.2.1 SRMC的設(shè)計思路
3.2.2 SRMC錄音方案
3.2.3 SRMC錄音內(nèi)容
3.2.4 SRMC存儲與標(biāo)注
3.3 電話語音庫(PHONE)
3.4 多模態(tài)說話人識別庫
3.5 NOISEX-92數(shù)據(jù)庫
3.6 小結(jié)
參考文獻(xiàn)
第二篇 特征提取
第4章 說話人特征分析與優(yōu)化
4.1 特征性能分析
4.1.1 階數(shù)的影響
4.1.2 幀長的影響
4.1.3 結(jié)論
4.2 特征參數(shù)優(yōu)化
4.2.1 語音包絡(luò)檢測
4.2.2 包絡(luò)最小長度限制
4.2.3 預(yù)加重參數(shù)選取
4.2.4 語音起始點的去除
4.2.5 Delta特征的引入
4.2.6 訓(xùn)練音長度的影響
4.2.7 結(jié)論
4.3 特征組合
4.3.1 單一特征組合
4.3.2 不同特征組合(小規(guī)模用戶)
4.3.3 不同特征組合(中等規(guī)模用戶)
4.4 二次特征提取
4.5 小結(jié)
參考文獻(xiàn)
第5章 基于主成分分析(PCA)的說話人特征變換
5.1 高維說話人特征的缺陷
5.2 說話人特征與PCA變換
5.2.1 說話人特征
5.2.2 PCA變換的流程與效果
5.2.3 說話人特征的PCA變換
5.3 PCA特征變換應(yīng)用于說話人鑒別
5.3.1 傳統(tǒng)的說話人鑒別系統(tǒng)
5.3.2 基于PCA特征變換的可行性
5.4 局部PCA特征變換
5.4.1 基于局部PCA特征變換的說話人鑒別系統(tǒng)
5.4.2 實驗結(jié)果分析
5.4.3 結(jié)論
5.5 全局PCA特征變換
5.5.1 基于全局PCA特征變換的說話人鑒別系統(tǒng)
5.5.2 實驗結(jié)果分析
5.5.3 結(jié)論
5.6 基準(zhǔn)系統(tǒng)、局部PCA變換與全局PCA變換的比較
5.6.1 可擴(kuò)充性比較
5.6.2 識別性能比較
5.7 小結(jié)
參考文獻(xiàn)
第6章 基于線性判別分析(LDA)的說話人特征變換
6.1 LDA變換與PCA變換的聯(lián)系與區(qū)別
6.1.1 LDA轉(zhuǎn)換公式與PCA轉(zhuǎn)換公式
6.1.2 LDA變換和PCA變換的原理的比較
6.1.3 用LDA對說話人特征進(jìn)行變換
6.2 LDA特征變換
6.2.1 基于LDA特征變換的說話人鑒別系統(tǒng)
6.2.2 實驗結(jié)果分析
6.2.3 結(jié)論
6.3 基準(zhǔn)系統(tǒng)、全局PCA變換與LDA變換的比較
6.3.1 可擴(kuò)充性比較
6.3.2 識別性能比較
6.4 小結(jié)
參考文獻(xiàn)
第7章 基于軌線模型的說話人特征時序性發(fā)掘
7.1 基于段模型的說話人特征時序性發(fā)掘
7.1.1 段模型
7.1.2 段模型在語音識別中的應(yīng)用
7.1.3 說話人特征時序性發(fā)掘方法
7.1.4 時序性發(fā)掘?qū)嶒?br />7.2 基于TrendedHlMM的文本相關(guān)說話人識別
7.2.1 TrendedHMM
7.2.2 TrendedH1VIM在語音識別中的應(yīng)用
7.2.3 文本相關(guān)的說話人識別
7.2.4 TrendedHMM與VIV
7.2.5 TrendedHMM優(yōu)缺點
7.3 小結(jié)
參考文獻(xiàn)
第三篇 識別模型
第8章 基于支持向量機(jī)的識別模型
8.1 研究意義
8.2 支持向量的區(qū)域描述
8.2.1 閉集與開集
8.2.2 支持向量的區(qū)域描述
8.2.3 說話人辨認(rèn)
8.3 支持向量機(jī)的概率輸出
8.3.1 概率
8.3.2 支持向量機(jī)的概率輸出
8.3.3 內(nèi)嵌支持向量機(jī)(SVM)的隱馬爾可夫模型(HMM)
8.3.4 支持向量機(jī)(SVM)與高斯混合模型((3MM)的混合模型
8.4 基于向量量化(VQ)模型的核方法
8.5 基于GMM模型的核方法
8.6 多SVM混合模型
8.7 小結(jié)
參考文獻(xiàn)
第9章 基于動態(tài)貝葉斯網(wǎng)絡(luò)的識別模型
9.1 動態(tài)貝葉斯網(wǎng)絡(luò)
9.1.1 表達(dá)
9.1.2 推導(dǎo)
9.1.3 學(xué)習(xí)
9.1.4 結(jié)論
9.2 基于動態(tài)貝葉斯網(wǎng)絡(luò)(DBN)的說話人識別
9.2.1 基于動態(tài)貝葉斯網(wǎng)絡(luò)的識別框架
9.2.2 實驗和討論
9.3 小結(jié)
參考文獻(xiàn)
第10章 基于主成分分析分類器的說話人識別
10.1 說話人分類常用算法的局限性
10.2 主成分分析分類原理
10.2.1 主成分分析的遞歸定義
10.2.2 主成分分析的分類依據(jù)
10.3 兩種主成分分析分類器及其決策融合
10.3.1 基于主成分子空間的分類器
10.3.2 基于截斷誤差子空間的分類器
10.3.3 兩種主成分分析分類器的決策融合
10.4 主成分分析分類器應(yīng)用于說話人鑒別

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號