本書在國家社科重大招標項目“大規(guī)模英漢平行語料庫的建立與加工”的框架下,匯報大數(shù)據背景下大規(guī)模平行語料庫的加工、檢索和應用若干問題的研究進展。第一,深度探討大數(shù)據背景下大規(guī)模平行語料庫的加工問題。本書以大數(shù)據作為背景,對面向大規(guī)模英漢平行語料庫加工的元信息標記、詞法標注、句法標注與雙語對齊的語言學原理、標注規(guī)范和自動加工方法進行闡釋。第二,從大數(shù)據視角探討“大規(guī)模英漢平行語料庫檢索平臺”的設計開發(fā)及其應用問題。第三,基于大規(guī)模英漢平行語料庫開展了某些句法結構及其漢譯的研究,主要以科技文體英文被動結構為例,考察其語言特征及其在漢語中的對譯形式,試圖從結構形式、句法、語義和文體四個維度揭示被動結構由英語向漢語的翻譯轉換過程所呈現(xiàn)的趨勢和特征。