人大副教授:本科生一定要做科研嗎?九大靈魂拷問(本科階段有必要做科研嗎)
??
作者:趙鑫中國(guó)人民大學(xué)副教授
原標(biāo)題:計(jì)算機(jī)系本科生開展科研學(xué)習(xí)的九問九答
學(xué)術(shù)如苦旅,我亦是行人。
寫這篇文章的初衷,是與本科生的接觸過程中看到了一些對(duì)于科研的困惑或者誤區(qū),所以想大概介紹一下本科生的科研之路第一腳該從哪里走起。所以本篇文章的定位不是側(cè)重學(xué)術(shù)性,也不會(huì)側(cè)重于教育性,而是一些個(gè)人經(jīng)驗(yàn)的分享。
由于是個(gè)人的經(jīng)驗(yàn),希望大家?guī)е械慕嵌热プx,但是兼聽則明,很愿意和各位本科生做進(jìn)一步的交流。全文寫的比較口語,盡量不包含學(xué)術(shù)名詞。
話不多說,下面我開始自問自答。
1. 本科階段一定要科研嗎?
我自己大概是在大三下學(xué)期真正開始接觸科研。大三上學(xué)期之前,如果不是學(xué)有余力,不建議太早開展科研,除非已經(jīng)有了較強(qiáng)的動(dòng)手能力。本科生教學(xué)的核心目標(biāo),不是以培養(yǎng)能夠發(fā)表A類論文的同學(xué)為最終目標(biāo)。我始終也不認(rèn)為,一位同學(xué)如果本科階段能夠發(fā)A類論文就意味著絕對(duì)的強(qiáng)、絕對(duì)的適合做科研。相反,我強(qiáng)烈建議大一大二的同學(xué)一定把課程學(xué)好。本科的課程體系非常豐富,而研究生逐漸聚焦。要利用好本科的時(shí)間打好基礎(chǔ),多看看計(jì)算機(jī)的大千世界。特別推薦每門計(jì)算機(jī)課程都盡量閱讀一本國(guó)外經(jīng)典教材;特別建議打好數(shù)據(jù)結(jié)構(gòu)與算法的基礎(chǔ),嘗試一些ACM或者相似性質(zhì)的競(jìng)賽;特別推薦加強(qiáng)數(shù)學(xué)基礎(chǔ)的學(xué)習(xí),很多理論性的學(xué)習(xí)所帶來的收益要用很長(zhǎng)時(shí)間才能發(fā)現(xiàn)。
如果大一大二已經(jīng)將基礎(chǔ)打好,我建議可以跟隨性的開展科研?,F(xiàn)在國(guó)內(nèi)計(jì)算機(jī)科研水平在逐步提升,很多學(xué)校都有一些很好的實(shí)驗(yàn)室,我建議本科生早些加入實(shí)驗(yàn)室,哪怕只是聽聽報(bào)告會(huì)或者參與讀書都是很有好處的。任何科研的入門都需要時(shí)間浸染,尋找興趣也需要時(shí)間和機(jī)會(huì),那么可以從加入實(shí)驗(yàn)室開始。因?yàn)檫@個(gè)時(shí)間段,絕大部分同學(xué)還是以一種觀望的、旁聽的角度參與學(xué)習(xí),我想這個(gè)過程能夠較好地幫助大家熟悉科研,也能較為輕松地進(jìn)行入門。我也建議在大三下學(xué)期開始就要做好轉(zhuǎn)型,因?yàn)檠芯可膶W(xué)習(xí)不再是GPA驅(qū)動(dòng),而是真正的實(shí)力說話:是否具有科研實(shí)力、是否具有完成大型項(xiàng)目的能力、是否具有解決復(fù)雜問題的能力、是否具有快速學(xué)新知識(shí)的能力等等。這個(gè)轉(zhuǎn)型會(huì)讓很多本科生迷惑,特別是一些專注于考試成績(jī)的“學(xué)霸”:因?yàn)椴辉儆泄潭ǖ膮⒖紩?、固定的科研方法以及科研途徑等,要進(jìn)行二次轉(zhuǎn)型,及早地進(jìn)入研究生的生活。也不要太過于焦急,覺得不做科研,自己的學(xué)習(xí)就拖后了。科研需要持續(xù)專注的投入,早開始半年或者一年,不會(huì)有太多的優(yōu)勢(shì)。
2. 本科階段成績(jī)不好, 科研完全沒有優(yōu)勢(shì)?
科研和GPA沒有直接關(guān)聯(lián)。有關(guān)聯(lián)的是,基礎(chǔ)知識(shí)、編程能力、思維能力、強(qiáng)烈的學(xué)習(xí)動(dòng)力等。盡管很多人吐槽GPA,但是我想,GPA能夠反映出上述的部分能力。當(dāng)然,我見過很多厲害的同學(xué),GPA不高,但是其他能力真的很強(qiáng)。所以結(jié)論是,不要將成績(jī)與科研綁定,而是看自己的核心能力是否真正具備了開展科研學(xué)習(xí)的基礎(chǔ)。不要因?yàn)槌煽?jī)低就妄自菲薄,放棄了嘗試科研的機(jī)會(huì)。
3. 我很聰明, 科研一定沒問題?
這一問題明顯是否定的。我覺得科研是一場(chǎng)天賦與努力并持的慢跑。天賦存在的目的在于入門的快慢以及努力可以達(dá)到的極限,例如,不是所有人拼盡全力都可以獲得圖靈獎(jiǎng)。但是,絕大部分科研者離圖領(lǐng)獎(jiǎng)的水平相距甚遠(yuǎn),當(dāng)進(jìn)入軌道之后,在大眾科研者的馬拉松比賽中,天賦的作用基本上不明顯了。對(duì)于正常人來說,起主導(dǎo)角色的是努力。而且有趣的是,你會(huì)發(fā)現(xiàn)天資平凡的我們,隨著不斷努力,似乎也會(huì)越來越聰明,貌似天賦與悟性也提升了。這就是學(xué)習(xí)與努力的力量,讓你的天賦也得到了加持。
其實(shí),這一問題也會(huì)出現(xiàn)在高中進(jìn)入大學(xué)的轉(zhuǎn)型過程中。常常看到類似“我高中不用聽老師講課都能拿到滿分,大學(xué)數(shù)學(xué)不在話下”、“這個(gè)東西看一眼就會(huì),不用做練習(xí)了”之類的話。我實(shí)際很不認(rèn)同這類看法,因?yàn)榇_實(shí)看到了一些學(xué)生從高中的狀元成為了大學(xué)的傷仲永的實(shí)例,替他們惋惜。很多時(shí)候,學(xué)生的認(rèn)識(shí),包括我自己現(xiàn)在,我覺得都是非常有限的,只能在一些熟悉的事情上做得較好。天才是有,但是真的很少??蒲械暮芏嗖襟E都不能省略,不能靠聰明完全搞定。聰明只能偶爾加速這個(gè)過程,但是只有努力才能導(dǎo)致質(zhì)變。
4. 讀研究生就是做科研嗎?
讀研究生就是做科研嗎?這一問題有點(diǎn)像,剛上本科的同學(xué)被問“計(jì)算機(jī)系同學(xué)畢業(yè)就要去互聯(lián)網(wǎng)大公司嗎?”。研究生培養(yǎng)應(yīng)該是多樣的。不少學(xué)校有學(xué)碩、工碩以及一些其他類型的碩士,這也反應(yīng)在招生政策里。即使是學(xué)碩,不少學(xué)生到最后可能從來沒有真正做過科研,很多學(xué)校的畢業(yè)要求也沒有任何發(fā)表論文的限制。我覺得所有正在夏令營(yíng)的學(xué)生還是要與實(shí)驗(yàn)室老師進(jìn)行一定的溝通,到底自己畢業(yè)要干什么、自己的人生計(jì)劃是怎樣的。研究生還是要做好從學(xué)校到社會(huì)的過渡、做好能量和能力的儲(chǔ)備,這是最關(guān)鍵的,而科研未必是所有人最適合的培養(yǎng)方式。
但是我還是建議所有讀研究生的同學(xué)至少試著去按照科研的思路學(xué)習(xí)和訓(xùn)練。這一過程涉及到思維訓(xùn)練、寫作訓(xùn)練等等全方位的訓(xùn)練。設(shè)想一下,如果工作之后有這樣的一個(gè)綜合能力培訓(xùn)班,它的學(xué)費(fèi)可能大的驚人;而且如果之后不從事科研,這就是你人生中唯一一段對(duì)于科研的體驗(yàn),以后再以難以尋找。
老實(shí)說,做科研在不喜歡的人看來,其實(shí)很枯燥;但是真正享受其中的人也是快樂的。每天刷著各種論文,如同刷游戲攻略一樣;每天調(diào)試以及書寫代碼,如同打怪通關(guān)。但是對(duì)于初學(xué)者來說,這其實(shí)大部分時(shí)間就是枯燥的。舉一個(gè)例子,大家經(jīng)常在朋友圈立下一個(gè)flag,從今天開始我就要開始健身了,并且花了高價(jià)辦了健身卡,還試圖請(qǐng)教練監(jiān)督。最后,健身卡又經(jīng)常被轉(zhuǎn)賣了。大家都知道健身有意義,羨慕健康的身體以及漂亮的肌肉,但是堅(jiān)持過程中確實(shí)挺枯燥,也沒有太多捷徑可走。
5. 我適合科研嗎,要讀博士嗎?
很多同學(xué)不止一次都問過我這個(gè)問題。我自己覺得這是一個(gè)抉擇性的問題,不是一個(gè)二元判定的問題。設(shè)想你去了一個(gè)公司,但是公司都是新業(yè)務(wù),需要你學(xué)習(xí),那么你能要求只能接受自己適應(yīng)的任務(wù)嗎?人生的局限很多都是自身的認(rèn)識(shí)所限,自身的安逸所致,而不是自己真的不適合。所以讀博士一樣,這是一種選擇,會(huì)影響著你人生下半場(chǎng)的軌跡,而不是是否適合的問題,也沒有對(duì)錯(cuò)。不快樂的人即使不選擇讀博士,最后可能也不快樂。只要這樣想,我想很多同學(xué)就會(huì)輕松很多,因?yàn)橹辽俨粫?huì)再輕易否定自己不適合做科研。
但是確實(shí)有一些痕跡可以初步判斷一個(gè)人是否適合讀博士。我建議讀博士前問一下自己:
(1)我是否愿意為一個(gè)事情反復(fù)折騰,每次只是將這個(gè)事情做得好了一點(diǎn);
(2)我是否能夠承受短時(shí)間高強(qiáng)度的工作,自己的身體和心理能否承受;
(3)我是否能夠安靜地做一些思考,而不是盲從別人的意見;
(4)我是否有強(qiáng)烈的自我驅(qū)動(dòng)能力,假使沒有人提醒和安排,仍能夠有做事的動(dòng)力;
(5)我是否有強(qiáng)烈的責(zé)任感,愿意將分配給自己的事情完成,或者自己承擔(dān)的工作努力做到最好;(6)我是否能夠長(zhǎng)時(shí)間專注的做一件事,即使里面的正反饋可能很少或者很慢。
6. 讀博士和碩士到底有什么差別?
其實(shí)說差別,我覺得真的有點(diǎn)難,需要根據(jù)具體的導(dǎo)師以及具體的學(xué)生來看。但是可以說一下具體的培養(yǎng)目標(biāo)其實(shí)不一樣。對(duì)于碩士來說,一般是掌握初步的科研方法,能夠勝任某一特定問題的解決即可。而博士來說,則是一個(gè)全方面的訓(xùn)練過程,所以才需要那么長(zhǎng)的時(shí)間來完成,可能包括需要提升的能力主要為分析解決問題的能力、獨(dú)立科研的能力以及溝通表達(dá)的能力等。我自己認(rèn)為一個(gè)合格的博士應(yīng)該是,有一項(xiàng)代表性的技術(shù)或者工作,有2至3篇高質(zhì)量的發(fā)表論文,能夠獨(dú)立找到研究方向并且獨(dú)立完成,能夠有能力帶領(lǐng)學(xué)生做科研。能夠給別人講授課程以及培養(yǎng)別人做科研的能力,這是一個(gè)博士向教職過渡所需要的能力。一般來說,應(yīng)該是在讀博士結(jié)束之后就應(yīng)該初步具備的。
另外,讀博士所謂的壓力近些年來有點(diǎn)被神化了。我的理解是,既然選擇讀博士了,就要對(duì)有持續(xù)的付出和承受隨之而來的辛苦和壓力。生活沒有完美的無壓空間??梢岳斫鉃?,這只不過是個(gè)人綜合能力的訓(xùn)練過程。舉一個(gè)例子,喜歡看武俠劇的同學(xué),一個(gè)常見的情節(jié)就是一個(gè)小和尚上山學(xué)武術(shù),吃盡了苦中苦,終于修煉成了“絕世武功”。雖然這個(gè)例子有點(diǎn)夸張,但是想想里面的劇情,有哪個(gè)武功高手上山兩三年修煉就練就了一身本事。還有運(yùn)動(dòng)員,有的是花近十年的時(shí)間練習(xí),最后才取得的奧運(yùn)金牌。如果想不通讀博士為啥吃苦,就可以想一下,這個(gè)過程其實(shí)自己一直在成長(zhǎng);而論文可以理解為片刻的正反饋,讓參與過程中的人們不至于那么無聊罷了。整個(gè)過程,應(yīng)該關(guān)注的是,自己到底是否變強(qiáng)了,是否真的變強(qiáng)了,是否可以在一個(gè)研究點(diǎn)或者一個(gè)研究方向上,“指點(diǎn)江山”、“激揚(yáng)文字”。
7. 我代碼基礎(chǔ)不好, 所以沒法做科研?
讀博士是一個(gè)綜合能力的比拼。很多ACM金牌的同學(xué)未必喜歡做科研,也未必真的適合做科研。但是代碼基礎(chǔ)不好,真的會(huì)造成比較大的影響。好不容易做了幾天實(shí)驗(yàn),最后發(fā)現(xiàn)代碼寫錯(cuò)了;數(shù)據(jù)跑了幾天也不出結(jié)果,因?yàn)槭撬惴ㄌ托Я恕L貏e是現(xiàn)在的開源時(shí)代,如果自己寫的代碼開源出去,又被別人發(fā)現(xiàn)bug,或者被別人吐槽代碼風(fēng)格以及正確性,那么就很不好了。所以代碼基礎(chǔ)不行,那就學(xué)吧。
從另外一個(gè)角度來說,很多研究題目并不是代碼驅(qū)動(dòng)的,核心的想法、設(shè)計(jì)才是關(guān)鍵。畢竟不是所有的項(xiàng)目都要求能夠通過互聯(lián)網(wǎng)大公司的代碼檢驗(yàn)。很多科研題目也并不是從頭開發(fā),有著前輩們?yōu)槲覀儗懞玫拇a。那樣的話,改代碼或者照葫蘆畫瓢的寫應(yīng)該是不難了。而且也可以側(cè)重理論或者想法的提出,這樣也可以多進(jìn)行合作,與一些代碼能力較強(qiáng)的同學(xué)合作,從合作中學(xué)習(xí)與提升。
8. 如何選擇研究方向,興趣是第一要素嗎?
興趣的尋找和發(fā)現(xiàn)是一個(gè)極為緩慢的過程?;叵肫饋恚蠹倚〉臅r(shí)候是否也學(xué)過彈琴、寫字或者跳舞的經(jīng)歷,又有幾個(gè)說自己真的是因?yàn)榕d趣學(xué)的。即使小時(shí)候可能非常喜歡,現(xiàn)在是否又真的喜歡?所以做任何事情,如果僅僅通過短期判斷,是很難發(fā)現(xiàn)自己是否有興趣。對(duì)于科研來說,也是一樣。目前的學(xué)術(shù)工作滿天飛,每隔幾天就來一個(gè)所謂的“爆炸性科研進(jìn)展”,很容易讓局外人產(chǎn)生錯(cuò)誤判斷。其實(shí)很多時(shí)候,你之所以喜歡,可能是環(huán)境對(duì)你的反復(fù)渲染。
有些同學(xué)憑借在實(shí)驗(yàn)室短短幾個(gè)月的時(shí)間就下定判斷,自己對(duì)某某方向徹底沒興趣、對(duì)某某方向很有興趣。我覺得這種判斷對(duì)于“意志不堅(jiān)定”的同學(xué)來說,可能不太準(zhǔn)確。舉個(gè)最簡(jiǎn)單的例子,很多小朋友初次看到鋼琴的時(shí)候,如果父母和他說,你有興趣學(xué)鋼琴嗎,我想應(yīng)該有很多小朋友回答是。但是如果經(jīng)歷了半年的艱苦學(xué)琴的歷程,再問小朋友說,你還有興趣學(xué)鋼琴嗎,我想開始有些小朋友回答說不喜歡了。再過一段時(shí)間后,可能放棄的小朋友將會(huì)越來越多。舉這個(gè)例子就是要說明,興趣是真的長(zhǎng)期接觸后才能知道。另外,不知道大家有沒有經(jīng)歷過,開始很多事情實(shí)際上很厭倦的,但是由于不斷的去做,最后竟然也喜歡上了這個(gè)事情。我猜想很多運(yùn)動(dòng)員可能有類似的感覺吧。
我想表達(dá)的是,不要想太多關(guān)于方向是否感興趣的問題。只要選擇的方向還處于蓬勃發(fā)展期,我覺得對(duì)于初學(xué)者來說,問題都不大。當(dāng)然,即使是冷門方向,隨著時(shí)間的投入,也可能有技術(shù)上的突破。
總之,研究方向可以判斷的更為簡(jiǎn)單一些,別想太多。選好導(dǎo)師比研究方向重要多了。
9. 如何開始早期的科研訓(xùn)練?
我建議科研訓(xùn)練從開始就要專業(yè),不要說先隨便找點(diǎn)東西學(xué),因?yàn)閷W(xué)術(shù)就是一個(gè)嚴(yán)謹(jǐn)?shù)氖虑?。有條件的同學(xué),可以及時(shí)進(jìn)入實(shí)驗(yàn)室,多和老師討論。沒有條件的同學(xué),我給出一個(gè)簡(jiǎn)單的科研訓(xùn)練列表,僅供參考:
(1)從視頻網(wǎng)站中(如“后浪”之站)選擇 機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語言處理、計(jì)算機(jī)視覺等國(guó)外知名大學(xué)的知名在線視頻,一集一集地看。同時(shí)利用搜索引擎找到對(duì)應(yīng)課程的課程主頁,然后找到作業(yè)部分,盡量認(rèn)真完成。不要貪多,要循序而漸進(jìn),要力爭(zhēng)整門課程大部分內(nèi)容最后跟下來了。遇到公式部分,建議一定自己推導(dǎo);遇到模型,建議自己實(shí)現(xiàn)一遍或者看看網(wǎng)上的開源代碼。
(2)在上課程同時(shí),一般課程都會(huì)推薦讀書或者讀論文。我建議要一起做一下。初次看論文的時(shí)候一定會(huì)有一種感覺,滿篇的論文至少有幾十個(gè)單詞不認(rèn)識(shí)。我建議是盡量認(rèn)真讀一遍論文后,尋找網(wǎng)絡(luò)的中文解讀(如知乎、論壇等)。注意,不是因?yàn)橥庹Z才推薦大家這樣做的,而是中文的解釋有可能給初學(xué)者最為直觀的理解,可以快速入門。這些都結(jié)束后,可以再回去精讀該論文。如果還有讀不懂的地方,不建議長(zhǎng)時(shí)間糾結(jié),因?yàn)楹芏嗟胤娇赡茉颊撐囊矝]寫清楚或者不是暫時(shí)的知識(shí)所能夠理解。
(3)動(dòng)手寫代碼。一旦讀過幾篇論文之后,建議選擇一篇具有源代碼的工作進(jìn)行復(fù)現(xiàn)。注意,一定要選擇好工作的好代碼,確保一開始入門就是按照最正規(guī)的途徑進(jìn)行。試著從代碼的角度再次分析論文中的部分。當(dāng)源代碼讀懂后,可以試圖下載數(shù)據(jù),并且試圖跑通論文中的實(shí)驗(yàn)。如果能夠得到和論文中相似的結(jié)果后,說明已經(jīng)基本可以達(dá)到初步的論文理解。下一步就是復(fù)現(xiàn)代碼,確保能夠復(fù)現(xiàn)源代碼。
(4)如果系統(tǒng)性的上完一門課、又實(shí)現(xiàn)過若干論文的源碼后,可以多找找最新的一些Survey文章來讀。各個(gè)方向的都可以看看。最后可以挑一個(gè)眼緣好的方向深入閱讀,并且看Survey中對(duì)于這一個(gè)研究方向中的核心研究問題是什么、哪些研究學(xué)者的論文被大量引用。一旦問題和對(duì)應(yīng)的學(xué)者鎖定后,就可以考慮follow一個(gè)問題了。
(5)初次上手一個(gè)問題,我建議首先找到該問題最為經(jīng)典的一篇文章,了解清楚基本的問題定義、評(píng)測(cè)方法以及已有方法。通過下載真實(shí)數(shù)據(jù)集合,構(gòu)建評(píng)測(cè)實(shí)驗(yàn),實(shí)現(xiàn)代碼,分析bad case等途徑查看已有方法具有什么問題。然后試圖模仿已有論文論述的研究動(dòng)機(jī),看看能否將數(shù)據(jù)中發(fā)現(xiàn)的問題轉(zhuǎn)化為學(xué)術(shù)問題。總體來說,這一過程很難,不要著急,不要急于求成。也不是這篇文章的重點(diǎn)。
結(jié)語
本來還想寫第十個(gè)問題“本科生如何能夠發(fā)表頂級(jí)論文”,但是想想當(dāng)初我自己并不是那種科研小天才類型的學(xué)生,而且科研的導(dǎo)向應(yīng)該是全面系統(tǒng)化的,而不是論文為王,要有真本事,如白紙推公式、vim寫代碼。我記得自己當(dāng)時(shí)本科階段非常希望能夠發(fā)出來一篇論文,但是一直到研一下學(xué)期才發(fā)出了人生的第一篇論文。時(shí)至今日,我還清楚記得論文發(fā)表的前一天晚上,斷續(xù)地睡覺,一直到早上收到了接受郵件,我反復(fù)讀了幾次,確定這是真的后,才又繼續(xù)睡覺了??梢钥隙ǖ氖?,在接到郵件的一瞬間,感覺人生到達(dá)了“巔峰”。第二天,這封接收郵件,我想應(yīng)該是反復(fù)讀了十幾次。這種感覺只有經(jīng)歷過科研的人才能懂。鑒于此,不談第十個(gè)問題了。
科研雖難,但是不經(jīng)歷會(huì)有缺失;正在經(jīng)歷的人,有的得意、有的痛苦、有的正在考慮放棄。無論怎樣,總有人為它的魅力著迷。學(xué)術(shù)如苦旅,我亦是行人。
轉(zhuǎn)自:AI科技評(píng)論