引領人機共生時代,資料科學家成最夯職業

還在迷惘畢業後的出路嗎?不知道如何應用學校所學?新的一期 My Plus 鄭重推出全新單元,每期專訪步入職場的學長姐,揭密職場上所需的技能與人格特質,讓在學的你能即時培養實用的專長,不走冤枉路。本期 My Plus 為你深度專訪台灣資料科學協會的課程組長Sean 與專案組長 Jim,一起來了解資料科學產業,或許下一個 AI 人才就是你!
By 加分誌 2018/03/01 07:30:00

 

科幻成現實 第三波人工智慧熱潮來臨 

近年來人工智慧領域日新月異,2016 年,人工智能圍棋軟體 AlphaGo 打敗頂尖棋士李世石,掀起相關話題討論;期待人工智慧的未來發展之餘,人力被機器取代的疑慮也隱隱發酵。 


科技推陳出新,激發現代人持續想望未來。提起人工智慧,或許大家首先想到的是《銀翼殺手》、《魔鬼終結者》、《AI 人工智慧》等電影裡外表與人無異的人造人,其實人工智慧的範疇不僅於此,舉凡手機語音功能、自動車、醫療影像處理等,人工智慧的應用早已充斥在現代人的生活中,科幻世界不再是想像,繼 1950 年代與 1980 年代後,我們所處的時代正式進入人工智慧的第三波熱潮。 

Sean 說明,機器學習是一種達成人工智慧的方法,資料科學家在做的事就是提供電腦數據和標籤,讓電腦從這些資料裡面自動找到互相對應的關係。「假設今天要從很多影像裡找出哪張臉屬於 40 歲的男性,只要運用機器學習就可以知道年紀和性別。」而深度學習則是機器學習裡更專門的領域,利用類似人類神經(neural network)的方式達成目的。機器學習演進迄今,Jim 認為:「深度學習變得有點像是人工智慧的代名詞。」
 


▲去年底成立的台灣人工智慧學校,是資料科學協會底下的專案計畫
 

人工智慧幕後推手 資料科學家養成之路 

Sean 和 Jim 完成台大研究所的學業後,進入了中研院陳昇瑋博士的研究室,投身資料科學領域。被問到如何從心理學跨界到資料科學時,Sean 笑著回答:「我一直不覺得我是在跨領域。我從大學到研究所都是在研究人腦和視神經科學,只是現在變成研究電腦。」

Sean 一直對人工智慧抱持興趣,大學時代便開始寫程式,畢業後踏入資料分析的領域,成為中研院的資料科學家(Data Scientist)。近期資料分析和大數據慢慢導向人工智慧,「有點像是船又跑回我原本想要走的航道。」 

Jim 畢業於台大土木所,大學與研究所一路學的都是交通工程,學習上會碰到很多數據,傳統的課程安排上不會學到太多寫程式的部分。「後來我覺得單純用軟體整理資料並不能算是資料分析,才會來中研院和陳老師學人工智慧的技術。」憑著旺盛的求知慾,原本不會寫程式的Jim 就這麼一頭栽入了資料科學領域。 
 


▲台灣人工智慧學校擁有 750 坪空 間,240台GPU(圖形處理器)
 

勇於接受失敗 化危機成轉機 

陳昇瑋博士的研究室雖然隸屬中研院,卻有許多接觸企業案的機會,這也是當初吸引 Sean 和 Jim 加入的原因。去年底甫成立的台灣人工智慧學校,則是資料科學協會底下的專案計畫,由陳昇瑋博士擔任執行長,Sean 和 Jim 在創校之初即參與規畫,目前除了研究室與企業合作的專案外,也負責課程安排與學員指導。 

研究室合作的公司來自各產業,各有各不同的需求。最初加入團隊時,Sean 便接觸到悠遊卡、愛情公寓、博客來等企業。同樣是電商,也會有不同的目的,有些客戶著重成交率,有些客戶的重點放在消費者在網頁上停留的時間。「我們的責任就是協助企業解決問題,提供解釋性、預測性的分析。例如書的銷售和哪些因素相關、找出增加電商購買率的因素。」 
 


▲由陳昇瑋博士擔任台灣人工智慧學校執行長


目前 Sean 和 Jim 接手的案子則多為製造業的品質檢測:「製造業很重視產品良率。傳統主流的做法是由人力目測出如汽車引擎蓋刮痕的瑕疵,但是現在有了人工智慧,企業會希望我們運用更準確的方式找到問題,這樣才能調配人力去做更有效率的事情。」 

除了自我技術上的精進,Sean 和 Jim 皆同意能夠坦然面對失敗是很重要的人格特質。

「一定會失敗,那麼在面對來自主管和客戶的壓力時,你有沒有辦法能趕快找到另一個出路?」Sean 回想承接博客來案子的經驗,坦言充滿挫敗感:「那時候光是把幾千萬筆的數據拉進電腦裡就花了很多時間,很考驗耐力和創意。在整理資料的時候,需要考慮有沒有什麼因素可以一起看?有沒有其他隱藏的因素和銷量相關?」 
 


▲除了研究室與企業合作的專案 外,Sean 和 Jim 也負責課程安排與學員指導
 

遇到瓶頸,多看多學別人的做法也是轉換思緒的方式。不過 Jim 認為,願意動手實踐更是必備的工作態度。「看別人做覺得很好,實際下去寫程式跑才會真的知道行不行。像 MLP(Multilayer Perceptron,多層感知器)很常見的狀況是,國外的語音辨識無法直接套用到中文,所以一定要試過才會知道。」 

面對各種類型的企業客戶時,難免會遇到溝通上的落差或誤解。Sean 認為,一開始最重要的便是雙方在溝通上的共識:「通常接觸一個新的產業都要花二到三個禮拜做為磨合期,遇到不懂的就要問,才能往下繼續進行。」 

深度學習加速了人工智慧的發展,不停出現許多新的資訊和方法。Jim 認為,勇於學習新事物才能持續待在人工智慧領域而不被淘汰:「一週內一定有很多新的東西出現,新東西建立在原有技術上,所以在這行工作,一定要肯學習、不怕面對新事物。」 
 


▲台灣人工智慧學校開學典禮
 

累積實習經驗 培養工作實戰力 

想進入人工智慧領域卻苦於入門嗎?非資科相關學系出身的你也不必氣餒! Sean 與 Jim 不約而同地表示,進入此領域的門檻並沒有很高。「重點是要有心。」Jim 認為寫程式是不能大意的基本功:「實際學習上其實沒有那麼困難,但一定要肯花時間下功夫。寫程式其實就是熟練語法怎麼使用,多參考別人怎麼寫,並了解背後的原理。」 

Sean 接著補充,程式語言是一種和抽象世界的溝通,寫程式就是建立起實體和抽象世界的橋樑。「每個領域其實都有人工智慧可以應用的地方,每個領域會碰到的問題也各有不同。最重要的是保持探索世界的好奇心。」 

針對大學生的建議,兩人均提及在學實習的重要性。Sean 表示,大學生除了認真修課外,也要挑一個有興趣的產業,花一兩個月在那裡實習,就可以知道自己是不是真心喜歡。「出社會後才想轉行比較不容易,但是在大學的時候你可以不斷地犯錯,因此有機會的時候就要試試看。」

 




Sean 游為翔(左)

台大心理所畢,現為台灣人工智慧學校課程組長,主要負責消費數據及知名 APP 的資料前處理、探索性資料分析及統計分析。大學及研究所期間在行為科學與大腦的灰色世界裡遊走,擅長實驗設計與統計分析以及功能性磁振造影分析與建模。

Jim 楊証琨(右)
台大土木所畢,現為台灣人工智慧學校專案組長,主要負責社群媒體與製造工業的資料處理及運用機器學習技術進行資料分析。見識到資料的力量後開始學習程式語言,期盼自己能掌握深度的技術來找出蘊藏在資料中的秘密。

人工智慧
人工智慧(Artificial Intelligence)一詞最早在1956 年由 John McCarthy 提出,泛指一切電腦能做出具有人類智慧的行為或技術。二十世紀 80 年代與 90 年代超級電腦的演進則加速了 人工智慧的發展,此為第二波熱潮。2000年後,機器學習 (Machine Learning)與深度學習(Deep Learning)大幅成長,為人工智慧的第三波熱潮。
資料整理自野村總合研究所《AI人工智慧的現在‧未來進行式》