Category Archives: Tech Zone

SCRP: 兩個月建成的「超級電腦」

這兩天學系高年級的同學應該都收到我發出有關學系全新網上系統的電郵。新系統由多台伺服器一體運作,配以多種統計軟件讓同學網上使用。這樣的系統一般被稱為高效能運算集群(High Performance Computing Cluster),不過大家較熟悉的名字可能是其俗稱「超級電腦」(Supercomputer)。建立這個系統的原由是因疫情關係學系的電腦室全關,如何讓幾百名學生在家用到統計軟件就成了必須解決的問題。

六月中在學系的支持下,東找西找籌集了二十萬的預算,以兩個月時間建起了SCRP這個新系統。 20萬對一個學系來說是不少的,但在高效能運算很多時候一台機都未必買得到。為了節省預算,SCRP用了相當多的二手零件。尤幸高性能運算零件的二手市場供過於求,不難以五分一甚至十分一的價錢找到合用的零件。再加上借調學系較為早期的伺服器,最終在8月中完成整套系統。

有了這個新集群,中大經濟系很大機會會是第一個經濟系要求所有同學都學用高性能運算系統(很邪惡的老師)。 雖然各間大學都有自己的高性能運算集群, 但通常都只供研究人員使用,在計算機科學系以外甚少會讓本科生都可以使用。其實高效能運算集群的基本使用並不是十分複雜,像R和Python甚至直接用瀏覽器就可以了。 雖然老是被老師逼學新事物有點可憐,但還是那句,今時今日學多點數據分析總有好處。

SCRP網頁及使用指南:http://scrp.econ.cuhk.edu.hk

是否必須購買有抗水認證的口罩?

港人防疫意識高漲,很多人對口罩標準亦很研究。網上時常見到的一個論點是防疫必須購買抗水認證的口罩—主要是ASTM 1862—否則無法保證口罩可以抵擋飛沫。這看法在平時無可厚非,但在全球口罩缺貨下,我們不得不考慮無認證的口罩是否真的在這方面不足以用作保護。

本著科學精神同自身安全,周博士在家中自行測試口罩抗水性能。結論係點?基本上大部份口罩都有足夠抗水性,包括工業用N95及厚身的翻版口罩。要注意我用的測試方法是以針筒近距離射出顏色水,水壓比飛沫強好多,現實中除非你是醫護人員否則應該不會遇到這麼危險的情況。

總括:只要口罩未用過基本上沒問題,反而重用嚴重染污的口罩就真的萬萬不可。

Do you need a mask with water resistance rating for disease protection? The answer is no, most masks, as long as they are not soaked, have enough water resistance even if they have no rating.

PDF of test results.

八月底為出席博士班同學的婚禮去了美國三藩市灣區一趟,順道和當地的一些好友敘舊。其中一人為人工智能研究先驅,現時在一家國際知名科技公司任管理層,領導一個四十多人的人工智能研究團隊。先來點求學忠告:我因著讀博士的機緣巧合才有幸認識到這位朋友,認識他的時候也大家不過是board game友,從沒想過從他身上學到那麼多。所以我常常跟打算出國留學或交流的同學說,出外比讀書更重要的是體驗,千萬別把自己困在熟悉的圈子裡!

參觀完他公司簇新像太空船般的總部大樓,在閒談間亦討論到中美在人工智能方面的競爭。我當時問他,歐美人工智能專材工資超高是街知巷聞的事,中國以相對低廉的工資,透過人力優勢超越美國有何困難?這位朋友因為曾經在中國一家首屈一指的科網公司待過,對此亦有一番見地。他說中國的科技公司當然有這樣做—他估計現時的工資差距約在十倍左右,聘用的人手也自然有相應差距。問題是中國公司的管治模式由上而下,員工經常揣摩上意,以至大量時間消耗在無實際意義的開發上。

這就到我這次想談的問題—中國的發展其實還未能脫離人力密集模式。中國去年總共有154萬個專利申請,為美國的兩倍半有多,數目全世界第一(註1)。但若我們看人均數目,則美國每一百萬人有1800個申請,而中國只有1100個。一個更貼身的例子:常有人以深圳國民生產總值遠遠超越香港來指出前者的優越性,但其實深圳的人均GDP去年仍未及香港六成。

有人會說人多也是種優勢啊?在某一特定時空來說是的,但人會老,今天的優勢可能就是明天的負擔。中國的人均GDP要追上美國還需相當時間,但其人均年齡預測明年就要超越後者了。根據國家統計局的數據,中國15-64歲的人口在2013已經見頂,並以每年數百萬人的速度減少中(註2)。人口老化問題很多國家都要面對,但正如《經濟學人》指出,中國的問題是未富先老(註3)。工作適齡人口減少隨之而來的是撫養比上升,而科研是應對這個問題的關鍵。

科研有著經濟中所謂「公共品」(public good)的特性,成果全民共享的成本甚低。所以即使一個國家的科研效率低,只要人夠多,只靠當中的頂尖人材甚至機緣巧合就總有研發成果,國家的發展亦可以很迅速。反過來說,當國家的工作人口下降,結構性的缺點就會漸漸顯露出來。在工作人口下降的大趨勢下,國家本應拆牆鬆綁以激發活力,現實卻是國家對人民及企業的控制變本加厲。一個沒有自由的國度,又何來創意,何來長遠發展?

註1:https://www.wipo.int/pressroom/en/articles/2019/article_0012.html
註2:http://data.stats.gov.cn/easyquery.htm?cn=C01&zb=A0301&sj=2018
註3:https://www.economist.com/finance-and-economics/2019/10/31/chinas-median-age-will-soon-overtake-americas

開學了

明天中大就要開學了。因應現時社會局勢不明朗,各區交通不時會出現無法預期的延誤,在此簡述一下我所任教各個課程之安排:

ECON 1101A/B
內容涵蓋初階線性代數及微分,兩班共有200個位,目前有171位同學。由前年開始課程已經每堂都有Youtube英語錄影,上半部分更有中文錄影,目標係今年有齊所有中文錄影。評核模式為定期網上繳交簡短功課以及一個終期考試。

DSPS 1003
今個學年嘅全新課程,教授數據科學入門,名額50,目前有29位同學。課程全程用python,每堂之後會上載完整嘅jupyter notebook。 評核模式為定期網上繳交功課及學期末的hackathon。

請各位同學善用上述嘅網上學習資源。

Not one, not two, but actually three! RTX 2070 is already faster than Titan Xp—though mostly likely only in some very specific applications

不久前收到曾是我助教多年的一名經濟系博士畢業生來信,說她剛獲受聘為一家大型金融科技公司的高級數據分析師。文中提及她是由擔任我一年級數學課助教開始才接觸Python,並強烈建議有志成為分析員的同學必須學好該編程語言。
 
因為私人市場對受過嚴謹經濟學訓練的畢業生有穩定需求,長久以來經濟學算是較好的讀博選擇。當中一大原因是經濟學博士的數據分析能力較其他學科高,但機器學習和人工智能正在改變這狀況:電腦科學和數據科學的畢業生在數據分析的就業而場不只能和經濟學畢業生爭一日之長短,甚至有取而代之之勢。
 
這一發展背後的關鍵是,計量經濟學—即概率和統計的經濟學應用—的研究方向和私人市場的需求有著相當大的差距。這個差距在沒有更好的選擇時還可以忽略,但近年機器學習的發展迅速,在實際應用上開始拋離計量經濟學。這還未計及經濟學本科和碩士畢業生很多時根本沒有足夠的數據分析能力。當電腦科學畢業生比經濟學畢業生更善於分析經濟和商業數據,後者求職比以前困難是可以預期的事。
 
在這形勢下,主修經濟學的同學要生存就必須不斷學習,不能滿足於完成學科的畢業要求。讀大學的好處是同學有相當大的自由度去選修其他學系的科目,又或課餘自我進修。同學應好好把握這四年,因為出來工作後不易再有這樣的機會了。
 
 

轉眼一個學期又完結,不知不覺間這已經我在中大的第七年。

今天收到一名應屆畢業生的電郵,提到她修讀一年級數學時,因為被我強迫學習Python編程而苦惱不堪。但到今天畢業,她卻感謝我讓她理解到編程的重要。

老師用心學生當下不一定明白,本來應該是常識。但現時大學講求問責,主力教學的老師的年度評核幾乎全看學生每個學期給予的評分。在這情況下,教學嚴謹的老師在升遷以至續約上就有一定程度的輸蝕。即使學生將來明白老師的苦心,他們亦沒有機會回過頭來給予老師較高的評價。

香港高教界的怪異情況多年來已不少前輩論述。想到這七年來學系的年輕同僚來來去去,走的比留下來的多,實在不勝
唏噓。

說罷,又到批改學生論文的時候了。