第1節(jié) 抽樣設計與追蹤情況
本調(diào)查的被訪樣本是通過分層多階段的抽樣方式,從首都高校學籍數(shù)據(jù)庫隨機取得的,直接抽取到學生個人(具體的抽樣方法見《中國大學生成長報告2012》)。首輪的調(diào)查中,項目組直接派調(diào)查員到各個學校,由學生工作部門協(xié)作通知被抽中學生到指定場所,集中現(xiàn)場填寫問卷。這在同類調(diào)查研究中是非常難得的。當前關于大學生的調(diào)查并不少,有的調(diào)查樣本規(guī)模甚至達到數(shù)十萬級別,但多數(shù)調(diào)查都難以保證樣本的隨機性,將抽樣名單明確到學生個人。一些調(diào)查通過學校行政系統(tǒng)或者學生網(wǎng)絡系統(tǒng)發(fā)放,對具體填答對象和填答過程缺乏控制。一些調(diào)查限于各方面的原因,采用了設計效應更大的整群抽樣,表面上看樣本規(guī)模很大,實際有效的樣本規(guī)模并不大。還有一些調(diào)查直接將問卷放到互聯(lián)網(wǎng)上供人自由填寫。這些研究設計都相對缺乏對于抽樣過程的實際控制,既難以明確實際的抽樣總體,也難以評估樣本的平均代表性。在這一點上,本調(diào)查有相對最為完備的抽樣框和詳細的學生名單,保證了抽樣過程的可控性和隨機性,從而能夠較好地排除各種人為因素和潛在選擇性因素帶來的偏差。
本調(diào)查采用追蹤調(diào)查(longitudinal survey)設計,凡初次參與了調(diào)查的學生都被邀請參與后續(xù)年份的調(diào)查。這種調(diào)查設計,有利于記錄學生大學期間以及畢業(yè)之后的變化,從而在一定程度上超越截面調(diào)查(cross-sectional survey)在因果推論方面的不足。本調(diào)查具體涵蓋的學校以及各個學校的抽樣數(shù)、初訪成功樣本數(shù)、此后歷年的追蹤樣本數(shù)和追訪率情況見表1—1到表1—3。
表1—1 首都大學生成長追蹤調(diào)查涵蓋學校及各年追訪情況(全體樣本)

說明:各輪追訪率都是相對于基期成功調(diào)查樣本的。表1—2、1—3相同。
表1—2 首都大學生成長追蹤調(diào)查涵蓋學校及各年追訪情況(2006級樣本)


表1—3 首都大學生成長追蹤調(diào)查涵蓋學校及各年追訪情況(2008級樣本)

本調(diào)查以2009年為基準年,包括當時的大一(2008級)及大三(2006級)兩個年級的代表性樣本,其后在2010年、2011年和2012年進行了3次追蹤調(diào)查。對于2008級而言,這四年反映的是他們整個大學時代的成長經(jīng)歷;對于2006級而言,四年經(jīng)歷反映了他們從大學走向社會的過程。
可以看到,無論是基期調(diào)查還是后續(xù)追蹤調(diào)查,本調(diào)查都保證了很高的成功率。這在同類調(diào)查中是非常難得的。當然本調(diào)查也存在樣本丟失的情況,在2006級更為嚴重(見圖1—1)。因為四輪調(diào)查都在學校,2008級的樣本丟失相對較少,預計因為畢業(yè)后聯(lián)系方式的變化,在2013年第五輪調(diào)查中會有較大變化。

圖1—1 首都大學生成長追蹤調(diào)查歷年追訪率
數(shù)據(jù)分析發(fā)現(xiàn),樣本的丟失(如果第四輪調(diào)查仍被調(diào)查到則不為丟失,即便中間有個別輪次丟失)存在一定的選擇性。從基本屬性上看,來自城市,特別是地級市和直轄市的學生更有可能退出調(diào)查。對于2006級而言,不同性別、民族、專業(yè)、學校(除郵電大學外)的學生丟失的差異不明顯。從包含更多家庭背景及個人特征變量的探索模型3可以看到,在其他情況相同的情況下,家庭條件較好、在校期間得過獎勵的學生更有可能保留在樣本中(見表1—4)。樣本的丟失具有一定的“選擇性”。2008級學生截止到2012年的丟失比例相對較小。但是,男生、人文學科以及中央民族大學的學生更有可能缺席后來的調(diào)查。第一輪調(diào)查收集的家庭背景變量及個人特征變量對預測該年級學生是否會退出本調(diào)查沒有明顯的意義。當我們將這些家庭背景和個人屬性更換為2011年也就是他們大三時的信息時(模型5)??梢钥吹?,是否退出本追蹤調(diào)查與個體政治面貌、是否獲得獎勵、價值觀及社團活動時間有一定的關系。參照2006級的情況,其中有些變量的影響可能是合理的,另一些變量的影響可能是上述信息替換造成的??傮w而言,樣本丟失有一定的選擇性,但各模型的偽確定系數(shù)都很?。ㄒ姳?—4),表明各變量對丟失事件的解釋效果較差,選擇性在上述各個方面并不特別明顯。
表1—4 首都大學生成長追蹤調(diào)查樣本追訪失敗Logistic模型


注:* p<0.05,** p<0.01,*** p<0.001。
說明:限于篇幅,截距省略了。模型5中的個人政治面貌及以下的變量取值為第三輪調(diào)查時的取值,如果第三輪調(diào)查時樣本已經(jīng)丟失,則為最后一次調(diào)查時的回答取值。所謂大學特殊入學渠道,指大學入學時享受過保送、加分、降分或者增投志愿等特殊待遇。
樣本丟失最主要的直接原因是無法聯(lián)系到受訪者。因為大學生的追蹤調(diào)查不同于居民戶的調(diào)查。前者沒有固定的生活場所,尤其受畢業(yè)事件的影響,我們只有通過手機、電話、郵件等方式來聯(lián)系受訪者。2011年對2008級學生的調(diào)查中,截至當年7月18日有162名受訪者未填寫問卷,其中61人為無法聯(lián)系上。同年針對2006級的追訪中,截至當年10月22日尚未填答問卷的408名受訪者中,聯(lián)系不上的有299人,聯(lián)系上但因為各種原因未填的92人,明確表示拒絕的只有17人。
聯(lián)系方式的改變是造成這種問題的主要原因,尤其是畢業(yè)前后,聯(lián)系方式的變化更普遍。畢業(yè)后一年內(nèi)能夠聯(lián)系上的2006級學生手機聯(lián)系方式發(fā)生變化的比例將近1/3。那些未聯(lián)系上因而缺席當年調(diào)查的受訪者,他們中多數(shù)電話無法接通。2008級學生在校期間,每年更換手機聯(lián)系方式的比例也超過10%。郵件聯(lián)系方式的改變更為頻繁,2010—2011年有超過30%的學生更改主要郵箱聯(lián)系方式。網(wǎng)易163和126、騰訊QQ、新浪和Gmail是使用率排在前五位的郵箱,其中網(wǎng)易郵箱相對更為穩(wěn)定,在大學生中的市場占有率也比較穩(wěn)定。
除了聯(lián)系方式的改變會影響到與受訪者的聯(lián)系外,短信和郵件的到達率也是影響追蹤聯(lián)系的重要原因。隨著反垃圾郵件和垃圾短信力度的加大,追蹤調(diào)查中的集中郵件通知和短信通知很容易被當作垃圾信息遭到屏蔽。這在最近輪次的調(diào)查中表現(xiàn)得特別明顯。
表1—5 首都大學生成長追蹤調(diào)查受訪者手機聯(lián)系方式變更比例

在抽樣與追蹤介紹部分的最后,需要就一個問題做一些說明:僅僅使用北京地區(qū)的資料能夠代表中國大學畢業(yè)生的普遍狀況嗎?關于這個問題,第一,我們認為利用北京市大學生樣本洞悉大學生的發(fā)展狀況是有意義的。第二,我們也在努力將中國教育追蹤調(diào)查擴展到全國及各個教育階段。而這已經(jīng)不完全是一個研究設計問題。在科研資源有限以及當前高等教育投資與招生制度背景下,使用任一局部地區(qū)(甚至多個具有代表性的局部地區(qū))的大學生樣本討論大學生問題,都面臨著學生來源的選擇性問題。高等教育資源的地區(qū)差異越大,就業(yè)制度的地區(qū)差異越大,地區(qū)發(fā)展越不均衡,一個地區(qū)的大學生的在校成長與畢業(yè)后的發(fā)展就越具有特殊意義。通過抽樣調(diào)查概括出全國平均面貌,要么容易流于膚淺,要么需要海量的投入。我們相信,基于不同區(qū)域的比較同樣能夠為認識全國的面貌提供豐富的支持。這里我們至少呈現(xiàn)了一個地區(qū)的面貌。我們的能力是有限的,但抱負是遠大的。
而且,對于北京這樣一個特殊的教育空間的研究,即便完全不能將結(jié)論推論到其他地區(qū),也因為其政治上的敏感性以及在高等教育中的特殊地位而具有充分的研究價值。北京作為中國的首都,集政治、經(jīng)濟、文化中心為一體,是我國高等教育資源最為集中的地區(qū)。這里集中了全國39所985高校中的8所,112所211高校中的26所,占到全國同類高??倲?shù)的20%以上。這里每年的研究生招生人數(shù)占全國招生人數(shù)的14.8%。每年畢業(yè)的高校學生達到將近16萬,且其中2/3為外地生源,而畢業(yè)找工作的學生中有80%首選在北京找工作。我們承認在北京上大學的學生都是選擇的結(jié)果,而北京的學生畢業(yè)后的出路也必然具有獨特性。但這種情況在哪里不是一樣呢?我國高校集中的大城市(如上海、西安、武漢等等)普遍面臨類似的境況,只不過程度不同罷了。在這個意義上講,利用北京高校學生的數(shù)據(jù)來研究大學生不僅具有典型性,也具有代表性。而且北京不僅有中國最好的高校,也有相對差的學校,學校之間的層次是非常明顯的,這對于研究不同高校及其他不同類別的學生的發(fā)展都具有重要意義。