注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當前位置: 首頁出版圖書科學(xué)技術(shù)計算機/網(wǎng)絡(luò)人工智能聲紋技術(shù):從核心算法到工程實踐

聲紋技術(shù):從核心算法到工程實踐

聲紋技術(shù):從核心算法到工程實踐

定 價:¥99.00

作 者: 王泉 著
出版社: 電子工業(yè)出版社
叢編項:
標 簽: 暫缺

ISBN: 9787121395291 出版時間: 2020-09-01 包裝: 平裝
開本: 16開 頁數(shù): 292 字數(shù):  

內(nèi)容簡介

  這是第一本系統(tǒng)性地介紹聲紋識別、聲紋分割聚類及聲紋在語音識別、語音合成、人聲分離等領(lǐng)域中應(yīng)用的技術(shù)書。本書內(nèi)容全面且緊隨時代前沿,不僅涵蓋了早至 20世紀 60 年代的經(jīng)典方法,而且以大量篇幅著重介紹了深度學(xué)習(xí)時代的新技術(shù)。本書注重理論與實踐的結(jié)合,除了配備大量實踐案例與習(xí)題,還有專門章節(jié)介紹聲紋技術(shù)在實際工程部署方面的諸多課題。 本書面向大學(xué)與研究機構(gòu)的學(xué)生、教研人員,以及企事業(yè)單位從事聲紋技術(shù)相關(guān)工作的工程師、架構(gòu)師和產(chǎn)品經(jīng)理等。

作者簡介

  王泉,美國谷歌公司資深軟件工程師、聲紋識別與語言識別團隊主管。作者畢業(yè)于清華大學(xué)自動化系,后取得美國倫斯勒理工學(xué)院計算機工程專業(yè)博士學(xué)位,曾在美國亞馬遜公司參與亞馬遜智能音箱語音助手Alexa的研發(fā)。在谷歌任職期間,作者帶領(lǐng)團隊將先進的聲紋技術(shù)部署到了大量產(chǎn)品中,使得谷歌智能音箱成為市面上第一款支持多用戶模式的同類產(chǎn)品。此外,作者在聲紋識別、聲紋分割聚類、人聲分離、語音檢測、語言識別及語音合成等諸多領(lǐng)域擁有大量專利,發(fā)表過多篇重量級論文,并開創(chuàng)了監(jiān)督式聲紋分割聚類及聲紋定向人聲分離這兩個新興研究方向。作者的工作曾被VentureBeat、TechCrunch、Engadget、CNET等國際著名科技媒體專題報道。

圖書目錄

1 聲紋技術(shù)的前世今生 1
1.1 什么是聲紋1
1.2 最早的聲紋技術(shù)2
1.3 聲紋技術(shù)的發(fā)展 5
1.4 大變革:深度學(xué)習(xí)時代的來臨 10
1.5 新的機遇:智能語音助手的普及 11
2 音頻信號處理基礎(chǔ) 14
2.1 欲懂聲紋,先學(xué)音頻 14
2.2 聲學(xué)基礎(chǔ)15
2.3 音頻信號基礎(chǔ)概念 24
2.4 從信號到特征:短時分析38
2.5 常用的音頻特征 42
3 聲紋識別技術(shù) 54
3.1 聲紋識別:聲紋技術(shù)的核心 54
3.2 聲紋識別的評價指標 60
3.3 深度學(xué)習(xí)之前的方法 65
3.4 基于深度學(xué)習(xí)的方法 78
3.5 聲紋識別中的數(shù)據(jù)處理 102
3.6 聲紋驗證 112
3.7 常用數(shù)據(jù)集 115
4 聲紋識別的工程部署 120
4.1 從模型到產(chǎn)品120
4.2 聲紋識別常見工程問題 126
4.3 全設(shè)備端部署 139
4.4 全服務(wù)器端部署 144
4.5 復(fù)合式部署 151
5 聲紋分割聚類技術(shù) 156
5.1 分割聚類:更好地理解對話語音 156
5.2 聲紋分割聚類與多說話人識別 163
5.3 聚類分析 167
5.4 二次分割方法 180
5.5 監(jiān)督式方法 182
5.6 聲紋分割聚類的評價指標 203
5.7 常用數(shù)據(jù)集 206
6 聲紋技術(shù)的其他應(yīng)用 211
6.1 聲紋的力量 211
6.2 用于語音識別 212
6.3 用于語音合成 214
6.4 用于語音檢測 220
6.5 用于人聲分離 221
6.6 聲紋轉(zhuǎn)換 226
6.7 聲紋還原度測試 227
7 聲紋技術(shù)的未來 231
7.1 概述 231
7.2 聲紋技術(shù)的挑戰(zhàn) 231
7.3 對更多數(shù)據(jù)的需求 235
7.4 聲紋技術(shù)的未來研究方向 238
7.5 結(jié)語 246
中英詞匯對照 248
參考文獻 259

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號 鄂公網(wǎng)安備 42010302001612號