注冊(cè) | 登錄讀書(shū)好,好讀書(shū),讀好書(shū)!
讀書(shū)網(wǎng)-DuShu.com
當(dāng)前位置: 首頁(yè)出版圖書(shū)科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)人工智能深度學(xué)習(xí)圖像搜索與識(shí)別

深度學(xué)習(xí)圖像搜索與識(shí)別

深度學(xué)習(xí)圖像搜索與識(shí)別

定 價(jià):¥109.00

作 者: 潘攀 著
出版社: 電子工業(yè)出版社
叢編項(xiàng):
標(biāo) 簽: 暫缺

購(gòu)買(mǎi)這本書(shū)可以去


ISBN: 9787121407499 出版時(shí)間: 2021-03-01 包裝: 平裝
開(kāi)本: 16開(kāi) 頁(yè)數(shù): 228 字?jǐn)?shù):  

內(nèi)容簡(jiǎn)介

  圖像搜索和識(shí)別是計(jì)算機(jī)視覺(jué)領(lǐng)域一個(gè)非常重要且基礎(chǔ)的題目。本書(shū)對(duì)構(gòu)成圖像搜索和識(shí)別系統(tǒng)的各個(gè)算法基礎(chǔ)模塊一一做了介紹,并在最后一章以拍立淘為例說(shuō)明了各個(gè)模塊是怎樣一起工作的。針對(duì)每個(gè)算法模塊,本書(shū)不僅深入淺出地解釋了算法的工作原理,還對(duì)算法背后的演進(jìn)機(jī)理和不同方法的特點(diǎn)進(jìn)行了說(shuō)明,在第2章至第8章最后均提供了經(jīng)典算法的PyTorch 代碼和相關(guān)參考資料。 本書(shū)既適合圖像搜索和識(shí)別領(lǐng)域的初學(xué)者,也適合在某個(gè)單一任務(wù)方面有經(jīng)驗(yàn)但是想擴(kuò)充知識(shí)面的讀者。

作者簡(jiǎn)介

  潘攀,花名啟磐。 阿里巴巴集團(tuán)資深算法專(zhuān)家,達(dá)摩院視覺(jué)理解&互動(dòng)視覺(jué)負(fù)責(zé)人,負(fù)責(zé)電商領(lǐng)域的視覺(jué)技術(shù)研發(fā)。 拍立淘以圖搜圖的負(fù)責(zé)人和創(chuàng)始人之一,為拍立淘、淘寶直播&短視頻、虛擬主播、閑魚(yú)等業(yè)務(wù)提供核心技術(shù)。 博士畢業(yè)于美國(guó)伊利諾伊大學(xué)芝加哥分校,研究領(lǐng)域包括深度學(xué)習(xí)和計(jì)算機(jī)視覺(jué)等。 曾先后在美國(guó)三菱研究院和北京富士通研發(fā)中心從事視覺(jué)技術(shù)研發(fā)工作。 已發(fā)表20余篇論文,擁有10余授權(quán)專(zhuān)利,并獲得WebVision分類(lèi),COCO檢測(cè),DAVIS分割等國(guó)際計(jì)算機(jī)視覺(jué)競(jìng)賽冠軍。

圖書(shū)目錄

1 概述 1
1.1 圖像搜索與識(shí)別概述 1
1.2 圖像搜索與識(shí)別技術(shù)的發(fā)展和應(yīng)用 3
1.3 深度學(xué)習(xí)與圖像搜索和識(shí)別 4
1.4 本書(shū)結(jié)構(gòu) 6
2 深度卷積神經(jīng)網(wǎng)絡(luò) 8
2.1 概述 8
2.1.1 深度學(xué)習(xí)背景 8
2.1.2 深度卷積神經(jīng)網(wǎng)絡(luò) 9
2.2 CNN基礎(chǔ)操作 11
2.2.1 卷積操作 11
2.2.2 池化操作 12
2.2.3 全連接層 13
2.2.4 激活層 14
2.2.5 批歸一化層 14
2.2.6 小結(jié) 16
2.3 常見(jiàn)的CNN模型結(jié)構(gòu) 16
2.3.1 網(wǎng)絡(luò)結(jié)構(gòu)超參數(shù) 17
2.3.2 單分支網(wǎng)絡(luò)結(jié)構(gòu) 19
2.3.3 多分支網(wǎng)絡(luò)結(jié)構(gòu) 24
2.3.4 小結(jié) 38
2.4 常見(jiàn)目標(biāo)損失函數(shù) 38
2.5 本章總結(jié) 40
2.6 參考資料 40
3 圖像分類(lèi) 43
3.1 概述 43
3.2 單標(biāo)記分類(lèi) 44
3.2.1 常用數(shù)據(jù)集及評(píng)價(jià)指標(biāo) 44
3.2.2 損失函數(shù) 45
3.2.3 提升分類(lèi)精度的實(shí)用技巧 47
3.2.4 基于搜索的圖像分類(lèi) 50
3.3 細(xì)粒度圖像分類(lèi) 51
3.3.1 概述 51
3.3.2 基于部件對(duì)齊的細(xì)粒度分類(lèi)方法 52
3.3.3 基于高階特征池化的細(xì)粒度分類(lèi)方法 55
3.3.4 小結(jié) 56
3.4 多標(biāo)記圖像分類(lèi) 56
3.4.1 概述 56
3.4.2 baseline:一階方法 58
3.4.3 標(biāo)記關(guān)系建模 59
3.4.4 小結(jié) 60
3.5 代碼實(shí)踐 61
3.6 本章總結(jié) 63
3.7 參考資料 63
4 目標(biāo)檢測(cè) 66
4.1 概述 66
4.2 兩階段目標(biāo)檢測(cè)算法 68
4.2.1 候選框生成 69
4.2.2 特征抽取 71
4.2.3 訓(xùn)練策略 73
4.2.4 小結(jié) 76
4.3 單階段目標(biāo)檢測(cè)算法 76
4.3.1 YOLO算法 76
4.3.2 SSD算法 78
4.3.3 RetinaNet算法 81
4.3.4 無(wú)錨點(diǎn)框檢測(cè)算法 83
4.3.5 小結(jié) 87
4.4 代碼實(shí)踐 88
4.5 本章總結(jié) 91
4.6 參考資料 92
5 圖像分割 95
5.1 概述 95
5.2 語(yǔ)義分割 96
5.2.1 概述 96
5.2.2 全卷積神經(jīng)網(wǎng)絡(luò) 97
5.2.3 空洞卷積 99
5.2.4 U-Net結(jié)構(gòu) 100
5.2.5 條件隨機(jī)場(chǎng)關(guān)系建模 101
5.2.6 Look Wider to See Better 103
5.2.7 Atrous Spatial Pyramid Pooling算法 104
5.2.8 Context Encoding for Semantic Segmentation 104
5.2.9 多卡同步批歸一化 107
5.2.10 小結(jié) 107
5.3 實(shí)例分割 108
5.3.1 概述 108
5.3.2 FCIS 109
5.3.3 Mask R-CNN 111
5.3.4 Hybrid Task Cascade框架 113
5.3.5 小結(jié) 115
5.4 代碼實(shí)踐 115
5.5 本章總結(jié) 120
5.6 參考資料 120
6 特征學(xué)習(xí) 124
6.1 概述 124
6.2 基于分類(lèi)識(shí)別的特征訓(xùn)練 126
6.2.1 Sigmoid函數(shù) 127
6.2.2 Softmax函數(shù) 128
6.2.3 Weighted Softmax函數(shù) 129
6.2.4 Large-Margin Softmax函數(shù) 130
6.2.5 ArcFace函數(shù) 132
6.2.6 小結(jié) 133
6.3 基于度量學(xué)習(xí)的特征訓(xùn)練 134
6.3.1 Contrastive損失函數(shù) 135
6.3.2 Triplet損失函數(shù) 137
6.3.3 三元組損失函數(shù)在行人再識(shí)別中的應(yīng)用 139
6.3.4 Quadruplet損失函數(shù) 140
6.3.5 Listwise Learning 141
6.3.6 組合損失函數(shù) 142
6.3.7 小結(jié) 142
6.4 代碼實(shí)踐 143
6.5 本章總結(jié) 143
6.6 參考資料 144
7 向量檢索 147
7.1 概述 147
7.2 局部敏感哈希算法 149
7.2.1 預(yù)處理 150
7.2.2 搜索 151
7.2.3 小結(jié) 152
7.3 乘積量化系列算法 152
7.3.1 PQ算法 153
7.3.2 IVFPQ算法 155
7.3.3 OPQ算法 156
7.3.4 小結(jié) 157
7.4 圖搜索算法 157
7.4.1 NSW算法 158
7.4.2 Kgraph算法 161
7.4.3 HNSW算法 163
7.4.4 圖搜索算法實(shí)驗(yàn)對(duì)比 165
7.4.5 小結(jié) 165
7.5 代碼實(shí)踐 166
7.6 本章總結(jié) 167
7.7 參考資料 168
8 圖文理解 171
8.1 概述 171
8.2 圖文識(shí)別 172
8.2.1 概述 172
8.2.2 數(shù)據(jù)集和評(píng)測(cè)標(biāo)準(zhǔn) 174
8.2.3 特征融合方法 176
8.2.4 小結(jié) 182
8.3 圖文搜索 182
8.3.1 概述 182
8.3.2 數(shù)據(jù)集和評(píng)測(cè)標(biāo)準(zhǔn) 184
8.3.3 Dual Attention Networks 185
8.3.4 Bottom-Up Attention 187
8.3.5 圖文搜索的損失函數(shù) 189
8.3.6 小結(jié) 190
8.4 代碼實(shí)踐 191
8.5 本章總結(jié) 194
8.6 參考資料 194
9 阿里巴巴圖像搜索識(shí)別系統(tǒng) 197
9.1 概述 197
9.2 背景介紹 198
9.3 圖像搜索架構(gòu) 200
9.3.1 類(lèi)目預(yù)測(cè)模塊 200
9.3.2 目標(biāo)檢測(cè)和特征聯(lián)合學(xué)習(xí) 201
9.3.3 圖像索引和檢索 205
9.4 實(shí)驗(yàn)和結(jié)果分析 207
9.5 本章總結(jié) 210
9.6 參考資料 211

本目錄推薦

掃描二維碼
Copyright ? 讀書(shū)網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)