注冊(cè) | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)人工智能深度學(xué)習(xí):語(yǔ)音識(shí)別技術(shù)實(shí)踐

深度學(xué)習(xí):語(yǔ)音識(shí)別技術(shù)實(shí)踐

深度學(xué)習(xí):語(yǔ)音識(shí)別技術(shù)實(shí)踐

定 價(jià):¥89.00

作 者: 柳若邊 著
出版社: 清華大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買這本書可以去


ISBN: 9787302516927 出版時(shí)間: 2019-04-01 包裝: 平裝
開本: 16 頁(yè)數(shù): 292 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  語(yǔ)音識(shí)別已經(jīng)逐漸進(jìn)入人們的日常生活。語(yǔ)音識(shí)別技術(shù)是涉及語(yǔ)言、計(jì)算機(jī)、數(shù)學(xué)等領(lǐng)域的交叉學(xué)科。《深度學(xué)習(xí):語(yǔ)音識(shí)別技術(shù)實(shí)踐》介紹了包括C#、Perl、Python、Java在內(nèi)的多種編程語(yǔ)言實(shí)踐,開源語(yǔ)音識(shí)別工具包Kaldi的使用與代碼分析,深度學(xué)習(xí)的開發(fā)環(huán)境搭建,卷積神經(jīng)網(wǎng)絡(luò),以及語(yǔ)音識(shí)別中常見的語(yǔ)言模型——N元模型和依存模型等,讓讀者快速了解語(yǔ)音識(shí)別基礎(chǔ),掌握開發(fā)語(yǔ)音識(shí)別程序的算法。 《深度學(xué)習(xí):語(yǔ)音識(shí)別技術(shù)實(shí)踐》從語(yǔ)音識(shí)別的基礎(chǔ)開始講起,并輔以翔實(shí)的案例,既適合需要具體實(shí)現(xiàn)語(yǔ)音識(shí)別的程序員使用,也適合有一定機(jī)器學(xué)習(xí)或語(yǔ)音識(shí)別基礎(chǔ)的學(xué)生、研究者或從業(yè)者閱讀。

作者簡(jiǎn)介

  柳若邊獵兔搜索團(tuán)隊(duì)核心成員,曾供職于中國(guó)萬(wàn)網(wǎng)、三星等多家業(yè)內(nèi)知名公司,現(xiàn)任某教育培訓(xùn)機(jī)構(gòu)專業(yè)講師。獵兔搜索創(chuàng)立于2004年,專注于自然語(yǔ)言處理等人工智能領(lǐng)域的技術(shù)開發(fā)與實(shí)現(xiàn)。在北京和上海等地均有獵兔培訓(xùn)的學(xué)員,獵兔搜索出版的相關(guān)技術(shù)圖書讀者遍及全國(guó)各省(市、區(qū))及海外華人圈。

圖書目錄

目 錄



第1章 語(yǔ)音識(shí)別技術(shù) 1
1.1 總體結(jié)構(gòu) 1
1.2 Linux基礎(chǔ) 2
1.3 安裝Micro編輯器 4
1.4 安裝Kaldi 5
1.5 yesno例子 6
1.5.1 數(shù)據(jù)準(zhǔn)備 7
1.5.2 詞典準(zhǔn)備 8
1.6 構(gòu)建一個(gè)簡(jiǎn)單的ASR 12
1.7 Voxforge例子 21
1.8 數(shù)據(jù)準(zhǔn)備 23
1.9 加權(quán)有限狀態(tài)轉(zhuǎn)換 34
1.9.1 FSA 35
1.9.2 FST 35
1.9.3 WFST 37
1.9.4 Kaldi對(duì)OpenFst的改進(jìn) 38
1.10 語(yǔ)音識(shí)別語(yǔ)料庫(kù) 39
1.10.1 TIMIT語(yǔ)料庫(kù) 39
1.10.2 LibriSpeech語(yǔ)料庫(kù) 40
1.10.3 中文語(yǔ)料庫(kù) 40
1.11 Linux shell腳本基礎(chǔ) 40
1.11.1 Bash 41
1.11.2 AWK 44
第2章 C#開發(fā)語(yǔ)音識(shí)別 46
2.1 準(zhǔn)備開發(fā)環(huán)境 46
2.2 計(jì)算卷積 47
2.3 記錄語(yǔ)音 48
2.4 讀入語(yǔ)音信號(hào) 52
2.5 離散傅里葉變換 53
2.6 移除靜音 54
第3章 Perl開發(fā)語(yǔ)音識(shí)別 58
3.1 變量 58
3.1.1 數(shù)字 58
3.1.2 字符串 59
3.1.3 數(shù)組 60
3.1.4 散列表 60
3.2 多維數(shù)組 62
3.3 常量 62
3.4 操作符 63
3.5 控制流 66
3.6 文件與目錄 67
3.7 例程 68
3.8 執(zhí)行命令 69
3.9 正則表達(dá)式 69
3.9.1 基本類型 69
3.9.2 正則表達(dá)式模式 70
3.10 命令行參數(shù) 72

第4章 Python開發(fā)語(yǔ)音識(shí)別 73
4.1 Windows操作系統(tǒng)下安裝Python 73
4.2 Linux操作系統(tǒng)下安裝Python 75
4.3 選擇版本 76
4.4 開發(fā)環(huán)境 76
4.5 注釋 77
4.6 變量 77
4.6.1 數(shù)值 77
4.6.2 字符串 79
4.7 數(shù)組 80
4.8 列表 80
4.9 元組 80
4.10 字典 81
4.11 控制流 81
4.11.1 條件判斷 81
4.11.2 循環(huán) 82
4.12 模塊 83
4.13 函數(shù) 84
4.14 讀寫文件 86
4.15 面向?qū)ο缶幊? 87
4.16 命令行參數(shù) 88
4.17 數(shù)據(jù)庫(kù) 90
4.18 日志記錄 90
4.19 異常處理 92
4.20 測(cè)試 92
4.21 語(yǔ)音活動(dòng)檢測(cè) 93
4.22 使用numpy 93
第5章 Java開發(fā)語(yǔ)音識(shí)別 94
5.1 實(shí)現(xiàn)卷積 95
5.2 KaldiJava 96
5.2.1 使用Ant 97
5.2.2 使用Maven 99
5.2.3 使用Gradle 100
5.2.4 概率分布函數(shù) 102
5.3 TensorFlow的Java接口 104
5.3.1 在Windows操作系統(tǒng)下使用TensorFlow 104
5.3.2 在Linux操作系統(tǒng)下使用TensorFlow 106
第6章 語(yǔ)音信號(hào)處理 109
6.1 使用FFmpeg 109
6.2 標(biāo)注語(yǔ)音 110
6.3 時(shí)間序列 112
6.4 端點(diǎn)檢測(cè) 113
6.5 動(dòng)態(tài)時(shí)間規(guī)整 114
6.6 傅里葉變換 117
6.6.1 離散傅里葉變換 117
6.6.2 快速傅里葉變換 120
6.7 MFCC特征 124
6.8 說(shuō)話者識(shí)別 125
6.9 解碼 125
第7章 深度學(xué)習(xí) 132
7.1 神經(jīng)網(wǎng)絡(luò)基礎(chǔ) 132
7.1.1 實(shí)現(xiàn)多層感知器 135
7.1.2 計(jì)算過程 143
7.2 卷積神經(jīng)網(wǎng)絡(luò) 150
7.3 搭建深度學(xué)習(xí)開發(fā)環(huán)境 156
7.3.1 使用Cygwin模擬環(huán)境 156
7.3.2 使用CMake 157
7.3.3 使用Keras 158
7.3.4 安裝TensorFlow 161
7.3.5 安裝TensorFlow的Docker容器 162
7.3.6 使用TensorFlow 164
7.3.7 一維卷積 208
7.3.8 二維卷積 210
7.3.9 擴(kuò)張卷積 213
7.3.10 TensorFlow實(shí)現(xiàn)簡(jiǎn)單的語(yǔ)音識(shí)別 214
7.4 nnet3實(shí)現(xiàn)代碼 216
7.4.1 數(shù)據(jù)類型 217
7.4.2 基本數(shù)據(jù)結(jié)構(gòu) 219
7.5 編譯Kaldi 230
7.6 端到端深度學(xué)習(xí) 232
7.7 Dropout解決過度擬合問題 232
7.8 矩陣運(yùn)算 235
第8章 語(yǔ)言模型 238
8.1 概率語(yǔ)言模型 238
8.1.1 一元模型 240
8.1.2 數(shù)據(jù)基礎(chǔ) 240
8.1.3 改進(jìn)一元模型 249
8.1.4 二元詞典 251
8.1.5 完全二叉樹數(shù)組 257
8.1.6 三元詞典 261
8.1.7 N元模型 262
8.1.8 生成語(yǔ)言模型 264
8.1.9 評(píng)估語(yǔ)言模型 265
8.1.10 平滑算法 266
8.2 KenLM語(yǔ)言模型工具包 271
8.3 ARPA文件格式 275
8.4 依存語(yǔ)言模型 278

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)