定 價:¥129.80
作 者: | 李蓀,曾然然,殷治綱 |
出版社: | 人民郵電出版社 |
叢編項: | |
標 簽: | 暫缺 |
ISBN: | 9787115579089 | 出版時間: | 2021-12-01 | 包裝: | |
開本: | 16開 | 頁數(shù): | 249 | 字數(shù): |
第 1章 從人際交流到人機對話 001
1.1 語言“塑造”了人類 002
1.1.1 語言在人類進化過程中的作用 003
1.1.2 語言的功能 004
1.2 語言與語言科學 005
1.2.1 人類語言概況 005
1.2.2 和語言有關(guān)的科學與技術(shù) 007
1.3 語音的產(chǎn)生與感知 008
1.3.1 語音交互與言語鏈 008
1.3.2 語音的聲學基礎 009
1.3.3 語音產(chǎn)生的生理基礎 015
1.4 人與機器的對話 021
1.4.1 人類語言交際的轉(zhuǎn)向 021
1.4.2 語音的數(shù)字化表達 022
第 2章 智能語音基本技術(shù) 027
2.1 主流的語音交互技術(shù) 028
2.1.1 語音識別 029
2.1.2 聲紋識別 048
2.1.3 語音合成 060
2.1.4 自然語言處理 070
2.1.5 對話管理 082
2.1.6 角色分離 086
2.1.7 語音增強 091
2.2 深度學習成為加速器:新技術(shù)到“黑科技” 106
2.2.1 端到端技術(shù) 106
2.2.2 預訓練機制 110
2.2.3 模型壓縮和輕量化部署 117
第3章 智能語音產(chǎn)業(yè)發(fā)展 125
3.1 產(chǎn)業(yè)環(huán)境 126
3.1.1 產(chǎn)業(yè)發(fā)展歷程 126
3.1.2 重點政策解析 127
3.1.3 發(fā)展規(guī)劃布局 132
3.1.4 創(chuàng)新合作模式 133
3.2 市場及生態(tài) 134
3.2.1 行業(yè)市場價值逐漸釋放 134
3.2.2 生態(tài)格局呈現(xiàn)多元化 137
3.2.3 企業(yè)成長方面的一些思考 146
3.3 標準及規(guī)范 148
3.3.1 技術(shù)評估指標介紹 148
3.3.2 國內(nèi)外標準制定現(xiàn)狀 153
3.3.3 標準需求及發(fā)展趨勢 160
3.4 產(chǎn)業(yè)應用創(chuàng)新實踐 161
3.4.1 “AI語音+終端”:消費級市場潛力顯現(xiàn),
疫情催發(fā)新業(yè)態(tài) 162
3.4.2 “AI語音+服務”:智能語音深度賦能平臺
服務 171
3.4.3 “AI語音+場景”:突破價值釋放“最后
一公里” 180
第4章 AI語音與熱點話題和技術(shù):千絲萬縷的聯(lián)系 207
4.1 語音+大數(shù)據(jù)+云 208
4.1.1 我們身邊的大數(shù)據(jù) 208
4.1.2 語音的特殊身份 209
4.1.3 數(shù)據(jù)類型與存儲 210
4.1.4 語音結(jié)構(gòu)化 213
4.2 語音+安全 220
4.2.1 語音欺詐,又一個潘多拉盒子 220
4.2.2 知己知彼:了解和研究語音欺詐、攻擊
手段 221
4.2.3 降維打擊 :抗攻擊防欺詐的一張盾牌 225
4.2.4 國內(nèi)政策法規(guī)的保護臂膀 227
4.2.5 個人語音數(shù)據(jù)全生命周期的安全建議 228
4.3 語音+普惠服務 229
4.3.1 新技術(shù)的應用要做到普惠 229
4.3.2 智能語音技術(shù)可以提供什么樣的普惠服務 230
4.3.3 科技和人類的和諧共生 235
4.4 語音+多模態(tài)交互 235
4.4.1 語音交互新挑戰(zhàn)和探索 235
4.4.2 多模態(tài)交互成為趨勢 236
4.4.3 語音助手向智慧助手發(fā)展 237
結(jié)束語 239
參考文獻 245