正文

第78節(jié):找到屬于自己的關(guān)鍵詞(2)

揭秘微軟亞洲研究院:微軟的夢(mèng)工場(chǎng) 作者:微軟亞洲研究院


第二年:“掌握擴(kuò)大戰(zhàn)果的本領(lǐng)”

發(fā)表第一篇文章固然重要,但是如何排除幸運(yùn)的因素,真正具有持續(xù)發(fā)表SIGIR論文的實(shí)力更加重要。這方面,微軟亞洲研究院的國(guó)際化平臺(tái)給了我很大的幫助。每年,研究院都會(huì)吸引大量國(guó)外的知名學(xué)者來(lái)進(jìn)行訪問交流,我正是借助這樣的機(jī)會(huì)認(rèn)識(shí)了楊益銘教授。

楊益銘教授是美國(guó)卡耐基梅隆大學(xué)的教授,是文本分類領(lǐng)域的專家。我有幸在她訪問研究院期間和她合作了的一篇論文。當(dāng)我把初稿寫出來(lái)讓她修改的時(shí)候,她來(lái)來(lái)回回和我討論了5遍“引言”怎么寫。其實(shí)她完全可以直接幫我把這一章改好,所花的力氣要少很多。但是楊老師耐心地給我提意見,讓我自己一點(diǎn)一點(diǎn)修改。這個(gè)過程使我意識(shí)到有了好的技術(shù),還要清晰準(zhǔn)確地表達(dá)出來(lái),恰到好處地突出自己的貢獻(xiàn)。這對(duì)我日后的論文寫作以及給學(xué)生改論文都有很大的幫助。至今仍然十分羨慕楊老師的境界:“寫論文其實(shí)是一件很享受的事情,寫起來(lái)象清泉流水一樣,禁不住要把那么好的研究成果和別人分享”。

和楊老師合作在SIGKDD Explorations 上發(fā)表了一篇關(guān)于大規(guī)模文本分類的論文之后,我又開始了獨(dú)立準(zhǔn)備下一年度SIGIR論文的階段。不過,這次明顯感覺與以往不同了:不再是為了量身定做一篇論文而找題目做,而是圍繞著自己正在做的研究題目寫論文。

這次我準(zhǔn)備的兩篇文章一篇講的是基于隨機(jī)補(bǔ)的網(wǎng)絡(luò)圖排序,另外一篇?jiǎng)t是關(guān)于文檔檢索的新算法。它們都不是有關(guān)經(jīng)驗(yàn)比較的論文,也沒有像第一年那樣按照SIGIR的“范式文本”來(lái)寫,但是這兩篇文章也都被SIGIR 2006錄用了。

經(jīng)過這個(gè)過程,我感覺自己真的入門了:至少知道什么樣的工作是SIGIR這個(gè)領(lǐng)域真正認(rèn)可的工作,也知道如何寫出具有自己風(fēng)格的論文來(lái)。

第三年:“找到屬于自己的關(guān)鍵詞”

入行兩年發(fā)表了3篇SIGIR論文,其實(shí)并不是一件容易的事情,因?yàn)檫@個(gè)會(huì)議競(jìng)爭(zhēng)非常激烈,每年全球范圍內(nèi)只收錄幾十篇文章,而且無(wú)疑來(lái)自美國(guó)的論文占了絕大多數(shù)。也因此,我慢慢被一些外面的學(xué)者認(rèn)可,也接觸到了更多的同行朋友。

一次開會(huì)的時(shí)候,和幾個(gè)同行聚在一次聊天,各自介紹自己的研究方向。到我表達(dá)的時(shí)候,發(fā)現(xiàn)只能用“信息檢索”這樣的大詞來(lái)形容,因?yàn)樽约鹤鲞^的3篇SIGIR論文相關(guān)性并不大,很難找到更貼切的描述。一個(gè)朋友說(shuō):你要有自己的關(guān)鍵詞,比如美國(guó)伊利諾斯大學(xué)香檳分校的翟老師的關(guān)鍵詞就是語(yǔ)言模型,卡內(nèi)基梅隆的楊老師的關(guān)鍵詞就是文本分類,你的關(guān)鍵詞是什么?

這個(gè)問題給了我很大的觸動(dòng)。仔細(xì)想想,確實(shí)知名學(xué)者多半都有他們自己的成名之作,有很集中的研究方向。而我目前的狀態(tài)似乎還是有點(diǎn)為了發(fā)論文而發(fā)論文,沒有真正地去規(guī)劃屬于自己的研究方向。如果繼續(xù)這樣下去,可能接下來(lái)的幾年里我還會(huì)發(fā)表更多的SIGIR論文,但是當(dāng)再次被別人問及同樣的問題時(shí),我仍然無(wú)法避免這種尷尬。所以,我決定要集中火力,做有影響力的,可以作為自己關(guān)鍵詞的研究方向。

我和我的經(jīng)理就此進(jìn)行了一次長(zhǎng)談。談話中,一方面他向我強(qiáng)調(diào)了微軟亞洲研究院開放的研究氛圍,對(duì)我表示了極大的支持;另一方面,和我分享了“l(fā)ess is more”的道理,并和我一起分析和確定了主攻的研究方向??紤]到我的數(shù)學(xué)基礎(chǔ)比較扎實(shí),對(duì)機(jī)器學(xué)習(xí)和優(yōu)化理論比較熟悉,同時(shí)考慮到不論對(duì)信息檢索領(lǐng)域還是對(duì)微軟公司的搜索引擎而言,排序(ranking)都是一個(gè)核心的問題,我們最終把研究的重點(diǎn)放在了排序?qū)W習(xí)(learning to rank)上。

在此基礎(chǔ)上,我對(duì)自己和實(shí)習(xí)生的研究方向做了較大的調(diào)整:大家的研究方向都圍繞著排序?qū)W習(xí)展開,比如:排序?qū)W習(xí)的損失函數(shù)研究,基于多平面的排序?qū)W習(xí)方法,排序?qū)W習(xí)中的特征選擇問題,基于排序?qū)W習(xí)的序列融合等等。我們也再接再厲在SIGIR 2007上發(fā)表了3篇論文。這三篇論文由于都是關(guān)于排序?qū)W習(xí)的,被安排在了同一個(gè)分會(huì)上宣講。這個(gè)分會(huì)上總共只有4篇文章,因此我們的表現(xiàn)受到了很大的關(guān)注。我也從此有了自己的關(guān)鍵詞:排序?qū)W習(xí)。


上一章目錄下一章

Copyright ? 讀書網(wǎng) ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)