国产精品一久久香蕉产线看/亚洲图区欧美/亚洲国产精品电影人久久网站/欧美日韩在线视频一区

歡迎光臨中圖網 請 | 注冊
> >
計算機視覺:從感知到重建

包郵 計算機視覺:從感知到重建

出版社:上海科學技術出版社出版時間:2024-02-01
開本: 16開 頁數: 387
中 圖 價:¥87.9(5.9折) 定價  ¥149.0 登錄后可看到會員價
加入購物車 收藏
開年大促, 全場包郵
?新疆、西藏除外
本類五星書更多>

計算機視覺:從感知到重建 版權信息

  • ISBN:9787547864951
  • 條形碼:9787547864951 ; 978-7-5478-6495-1
  • 裝幀:平裝-膠訂
  • 冊數:暫無
  • 重量:暫無
  • 所屬分類:>

計算機視覺:從感知到重建 本書特色

本書以作者教學經驗和研究成果為基礎,配合大量插圖,詳細講解傳統計算機視覺方法,基于手動特征的經典算法,并深入介紹*前沿的深度學習技術。將傳統的知識與深度學習的力量相結合應對不斷變化的挑戰。
閱讀本書,您既能夠理解計算機視覺的基本原理,又能夠掌握當今*激動人心的技術。

計算機視覺:從感知到重建 內容簡介

本書主要介紹和探討計算機視覺的一系列核心主題,包括相機成像,圖像處理、分析和感知,三維重建等。首先介紹了相機模型、成像過程以及圖像的顏色模型、照射模型、渲染模型等;然后系統性地介紹了圖像濾波、特征提取、圖像和視頻感知與理解等多種任務,不僅詳細講解了各任務中的經典方法,還全面地介紹了前沿的基于深度學習的方法;*后介紹了三維重建中涉及的幾何原理、重建步驟以及基于深度學習的新方法。本書針對每一個核心問題單獨成章,并著重講解基本概念。通過大量的彩圖,幫助讀者理解問題。適合作為本科及研究生的計算機視覺和數字圖像處理課程的教材,并且可以作為深度學習課程的參考書。同時,也可供對計算機視覺感興趣的相關專業人

計算機視覺:從感知到重建 目錄

第1章 相機成像模型 /1
1.1 引言 /1
1.2 簡單的相機模型 /2
1.2.1 相機數學模型 /2
1.2.2 相機的內參 /4
1.2.3 相機的外參 /6
1.2.4 相機成像公式 /7
1.2.5 相機成像畸變 /7
1.3 圖像的顏色 /10
1.3.1 基于拜爾濾波器的顏色感知 /10
1.3.2 RGB顏色模型 /11
1.3.3 HSV顏色模型 /12
1.4 圖像的亮度 /14
1.4.1 空間中的光 /14
1.4.2 物體表面的光線反射 /16
1.4.3 薄透鏡成像的輻射度學 /17
1.4.4 數字成像過程 /19
1.5 渲染 /20
1.5.1 渲染方程 /20
1.5.2 光線追蹤算法 /20
1.6 本章小結 /23
第2章 圖像空間濾波 /24
2.1 引言 /24
2.2 卷積和互相關 /25
2.2.1 卷積 /25
2.2.2 互相關 /26
2.3 圖像的平滑 /28
2.3.1 鄰域均值濾波 /28
2.3.2 加權均值濾波 /28
2.3.3 高斯均值濾波 /29
2.3.4 中值濾波 /30
2.3.5 雙邊濾波 /30
2.4 圖像的銳化 /32
2.4.1 梯度銳化 /32
2.4.2 拉普拉斯算子的二階微分銳化 /33
2.4.3 非銳化掩膜與高頻提升濾波 /34
2.5 本章小結 /35
第3章 圖像特征提取 /36
3.1 引言 /36
3.2 基于非學習方法的邊緣檢測 /37
3.2.1 邊緣、導數和梯度 /39
3.2.2 邊緣的卷積形式計算 /40
3.2.3 噪聲對邊緣檢測的影響和處理方法 /41
3.2.4 Canny邊緣檢測算子 /43
3.3 基于深度學習的邊緣檢測 /45
3.3.1 HED/45
3.3.2 RCF/47
3.3.3 CASENet/49
3.4 基于非學習方法的關鍵點檢測 /51
3.4.1 角點檢測原理 /53
3.4.2 Harris角點檢測 /54
3.4.3 Harris角點檢測的優勢與不足 /58
3.4.4 高斯拉普拉斯算子 /59
3.4.5 高斯差分算子 /64
3.5 基于深度學習的語義關鍵點檢測 /65
3.5.1 基于深度學習的人臉關鍵點檢測 /65
3.5.2 人體關鍵點檢測 /69
3.5.3 房間布局估計 /74
3.6 基于非學習方法的直線檢測 /78
3.6.1 *小二乘法 /78
3.6.2 基于RANSAC的直線擬合 /82
3.6.3 霍夫變換 /84
3.7 基于深度學習的線段檢測 /87
3.7.1 基于圖表示的線段檢測 /87
3.7.2 基于向量場表示的線段檢測 /88
3.7.3 語義直線檢測及應用 /89
3.8 本章小結 /91
參考文獻 /91
第4章 圖像分類 /94
4.1 引言 /94
4.2 圖像表達 /97
4.3 基于手動特征的圖像表達 /98
4.3.1 基于顏色直方圖的圖像表達 /98
4.3.2 基于經典的視覺詞袋模型的圖像表達 /99
4.3.3 基于空間金字塔匹配模型的圖像表達 /104
4.3.4 基于壓縮感知的圖像表達 /105
4.3.5 基于高斯混合模型的圖像特征編碼 /107
4.4 基于支持向量機的圖像分類 /108
4.4.1 面向線性可分數據的支持向量機分類 /108
4.4.2 面向非線性可分數據的支持向量機分類 /114
4.4.3 基于支持向量機的多分類實現 /116
4.4.4 基于視覺詞袋模型和支持向量機的圖像分類 /116
4.5 基于自編碼器的圖像表達 /117
4.5.1 多層感知機 /118
4.5.2 自編碼器 /120
4.5.3 降噪自編碼器 /121
4.6 基于卷積神經網絡的圖像分類 /122
4.6.1 卷積神經網絡的組件 /122
4.6.2 神經網絡的訓練 /128
4.6.3 代表性圖像分類卷積神經網絡 /131
4.7 基于膠囊網絡的圖像分類 /143
4.7.1 CapsNet/144
4.7.2 堆疊膠囊自編碼器 /147
4.8 基于Transformer的圖像分類 /149
4.8.1 自然語言處理中的Transformer/149
4.8.2 基于Transformer的圖像分類 /151
4.9 本章小結 /159
參考文獻 /159
第5章 圖像中目標檢測 /164
5.1 引言 /164
5.2 基于手動特征的目標檢測 /171
5.2.1 ViolaJones人臉檢測算法 /172
5.2.2 基于DPM的目標檢測 /176
5.3 基于卷積神經網絡的目標檢測 /183
5.3.1 兩階段目標檢測算法 /185
5.3.2 單階段目標檢測算法 /190
5.3.3 無錨框的目標檢測算法 /195
5.4 基于Transformer的目標檢測 /199
5.4.1 DETR/199
5.4.2 Pix2seq/201
5.5 本章小結 /203
參考文獻 /204
第6章 圖像分割 /207
6.1 引言 /207
6.2 基于手動特征的圖像分割算法 /209
6.2.1 基于圖論的圖像分割 /209
6.2.2 基于聚類的圖像分割 /213
6.3 語義分割 /216
6.3.1 FCN/218
6.3.2 U Net/219
6.3.3 DeepLab/220
6.3.4 PSPNet/223
6.4 實例分割 /223
6.4.1 MaskR CNN/225
6.4.2 YOLACT/225
6.4.3 SOLO/227
6.5 全景分割 /228
6.5.1 PanopticFPN/229
6.5.2 UPSNet/230
6.6 點云分割 /232
6.6.1 用于圖的卷積神經網絡 /234
6.6.2 基于點云的語義分割 /238
6.7 本章小結 /244
參考文獻 /244
第7章 視頻分類和行為識別 /248
7.1 引言 /248
7.2 基于手動特征的視頻分類 /253
7.2.1 基于詞袋模型的視頻表達和分類 /254
7.2.2 基于光流特征的視頻表達和分類 /254
7.3 基于循環神經網絡的視頻分類 /263
7.3.1 循環神經網絡 /263
7.3.2 雙向循環神經網絡 /264
7.3.3 長短期記憶網絡 /266
7.3.4 門控制循環單元 /267
7.3.5 基于LSTM的視頻表達 /267
7.4 基于卷積神經網絡的視頻分類 /270
7.4.1 單分支網絡 /270
7.4.2 多分支網絡 /278
7.5 基于Transformer的視頻分類 /282
7.5.1 ViViT/282
7.5.2 TimeSFormer/285
7.5.3 VideoSwinTransformer/286
7.5.4 VideoCLIP/288
7.5.5 VLM/290
7.6 時序動作定位 /291
7.6.1 單階段方法 /292
7.6.2 自頂向下的多階段方法 /295
7.6.3 自底向上的多階段方法 /299
7.7 本章小結 /304
參考文獻 /304
第8章 圖像三維重建 /311
8.1 引言 /311
8.2 對極幾何 /313
8.3 相機標定 /317
8.4 基于傳統算法的多視圖立體重建 /321
8.4.1 簡單的基于匹配三維點空間坐標求解方法 /321
8.4.2 基于平面掃描的場景深度估計 /322
8.4.3 基于視差的深度估計 /323
8.4.4 基于PatchMatch的立體重建 /325
8.5 基于深度學習的多視角重建 /328
8.5.1 MVSNet/329
8.5.2 Fast MVSNet/330
8.6 基于深度學習的場景的單目深度估計 /332
8.6.1 有監督學習的單目深度估計 /332
8.6.2 自監督學習的單目視頻深度估計 /335
8.7 深度學習對基于不同形狀表達的三維重建 /338
8.7.1 基于體素的顯式三維表達 /338
8.7.2 基于多邊形網格的顯式三維表達 /344
8.7.3 基于隱函數的隱式物體表達 /348
8.7.4 基于神經立體渲染的多視角重建 /353
8.8 本章小結 /370
參考文獻 /370
展開全部

計算機視覺:從感知到重建 作者簡介

高盛華簡介:
上海科技大學信息科學與技術學院教授,長期從事計算機視覺與機器學習領域研究,發表多篇高水平計算機視覺領域學術論文。
厲征鑫簡介:
上海科技大學信息科學與技術學院副研究員,博士畢業于江南大學,長期從事機器視覺、異常檢測相關研究,發表多篇計算機視覺領域論文。

商品評論(0條)
暫無評論……
書友推薦
本類暢銷
編輯推薦
返回頂部
中圖網
在線客服