深度學習技術的引入使得多模態(tài)信息處理領域取得了巨大的突破。本書在介紹多模態(tài)信息處理的基礎概念和典型任務的基礎上,重點介紹 通用、 基礎的基于深度學習的多模態(tài)信息處理技術。本書內容包括初識多模態(tài)信息處理、單模態(tài)深度學習表示技術、多模態(tài)深度學習基礎技術、多模態(tài)預訓練技術4部分:初識多模態(tài)信息處理部分介紹多模態(tài)信息處理的基礎概念和典型任務;單模態(tài)深度學習表示技術部分介紹多模態(tài)深度學習模型中常用的文本表示和圖像表示技術;多模態(tài)深度學習基礎技術部分介紹多模態(tài)表示、對齊、融合和轉換這4種技術;多模態(tài)預訓練技術部分介紹多模態(tài)預訓練技術。此外,為了讓讀者 好地理解理論的細節(jié)并實踐這些多模態(tài)深度學習技術,本書提供了4個可運行的完整的實戰(zhàn)案例,分別對應多模態(tài)表示、對齊、融合和轉換這4種技術。本書既可作為多模態(tài)信息處理、多模態(tài)深度學習等相關課程的教學參考書,適用于高等院校智能科學與技術和人工智能等專業(yè)的本科生、研究生,同時可供為對多模態(tài)深度學習技術感興趣的工程師和研究人員參考。