中文系畢業的AI博士:從一介文人成為AI人的學習歷程
「It's our choices, Harry, that show what we truly are, far more than our abilities.」這是《哈利波特》中,在哈利波特疑惑著自己為什麼進到葛萊芬多學院時,鄧不利多對哈利所說的話,意思是「決定我們成為什麼樣人的,不是我們的能力,而是我們的選擇。」大學四年級,我在中文系的「中國思想史」課堂上,當時的老師也曾經對著台下作為學生的我們提到,之所以會坐在那門課堂上,其實是一種選擇。
文:王冠云(輔仁大學資訊管理學系助理教授)
「It's our choices, Harry, that show what we truly are, far more than our abilities.」這是《哈利波特》中,在哈利波特疑惑著自己為什麼進到葛萊芬多學院時,鄧不利多對哈利所說的話,意思是「決定我們成為什麼樣人的,不是我們的能力,而是我們的選擇。」大學四年級,我在中文系的「中國思想史」課堂上,當時的老師也曾經對著台下作為學生的我們提到,之所以會坐在那門課堂上,其實是一種選擇。就高三考大學的成績來看,「也許台大電機系進不去,但其他學校的電機系總可以吧」只是那時的我們,選擇了台大中文系,而當時的那一刻,正在聽著中國思想史,而不是電子學。
我相信,用以描述我是誰的,不是我的能力本身,而是我下了決定所做的行動。
從文學的語言到程式的語言
因為對於語言、文字的深深著迷,考大學的那時候其實心裡一直有個第一志願就是台大中文系,只是一直沒能勇氣就這樣選擇進入中文系就讀。不過,追尋所愛的那份躁動並不能輕輕放下,儘管升大學時填了台大其他系所,但最後還是成功完成了中文系雙主修的學位。
回顧整個學習的過程,我也在思考究竟是什麼核心讓我著迷,畢竟我其實也很喜歡寫程式。國中的時候,被編進了數理資優班,資優班做獨立研究要進行分組,當時我被分進了生物組,卻沒能分到程式設計組的時候,心裡有點失落。不過既然想要學習,我覺得我不能就此放過自己,我請被分到程式組的同學到家裡教我寫程式,我也硬是在每個午休時間額外花時間去電腦教室跟那些準備要去打程式設計比賽的同學一起練習。
從文學語言出入到程式語言,經過了多年的學習之後,我終於發現到,我對於這些語言符號背後聰明的想法所吸引。寫程式與寫文章,都需要把抽象的概念具象化成某種形體,而具象化出來的結果,讓我感受到那個寫下程式碼或者寫下那些文字地人的聰明,這一點讓我感受到了某種人類智慧之神秘。
令人著迷的人類認知活動以及科技帶來的正向改變
隨著在中文系所學習到的一切,儘管我深深熱愛著中文系,很喜歡在中文系所修的課程、學到的東西。但同時我也了解到我對於文學、經學或者哲學等中文系所涵蓋的各類研究並不怎麼感興趣。另一方面,在大學的尾聲,我開始接觸了心理學有關的研究,包含認知科學、人機互動等等專業學問之後,我覺得這一方面的研究課題對我來說很有意思。也許像是在閱讀文學作品時,透過文字這樣的表徵符號,使讀者得以探究作者的認知活動。像這樣深入研究與人類認知活動有關的態度、行為等等課題,自然也使得我產生了興趣。
碩士班進入了心理所就讀,一方面在心理所的課程中學習做研究的方法,另一方面也在修課的過程中,學習了各種不同與語言學、認知神經科學、知覺心理學等等相關理論與知識,同時,也有機會接觸例如說服科技、社會機器人學、人機互動、計算語言學等等與電腦科學有關的理論與知識。而我自己的碩士論文題目,也是人與機器人互動相關的題目,我試圖以心理學的實驗設計的概念,將具有不同程度同理心的機器人與學生一同進行合作學習,並且進行語言學奧林匹亞競賽解題。
我沒有忘記我所著迷的文學及語言學,甚至開始玩起了語言學奧林匹亞競賽,我也沒有忘記我所著迷的程式設計,有機會寫點程式,做研究,也讓我覺得很開心。碩士論文研究彷彿是我那兩三年來所讀的書、所接觸的理論之小小驗收成果,在做論文的過程當中,雖然有辛苦的部分,我卻甘之如飴。
從人機互動開始出發,我終於理解了我的恩師岳修平老師曾經講的讓科技「帶來正向的改變」是什麼意思,原來我所著迷的語言文字這樣的認知活動,以及寫程式和電腦科學的力量,是可以統合在一起的。於是我也終於開始能定調,我所關心的研究議題,即是如何設計不同的科技與工具,在它們介入到人類的生活當中之後,能對人類的認知活動、行為,帶來什麼樣的改善。
新興科技的學習是永無止盡
而為了更增進自己的工程技術,加上源自於我對漢字和語言的著迷而學習了多年的日語,我選擇了日本的東北大學資訊科學研究所(Graduate School of Information Sciences, Tohoku University)就讀博士班。在進行博士研究期間,也同樣選擇了教育科技相關的議題,博士論文的主幹是使用電腦視覺當中的臉部表情分析,應用了心理學家提出的臉部表情編碼,分析學生們在進行線上的語言學奧林匹亞競賽解題的時候的臉部表情。
由於更加重視工程技術面,所以主要在測試不同的機器學習模型用於該教育情境之下的應用,是否得以辨識出學生們對於學習的專注度與參與度,甚至能辨識出學生們在學習感到困惑時的表情。最終目標上,若能使用電腦視覺技術即時辨識學生困惑的表情,那麼再搭配學習系統內的回饋以及提示設計,就有機會能夠整合成一個具有 AI 智慧功能,可以提供教學輔助的學習系統。
除此之外,在東北大學就讀期間,我也同時是東北大學獲得日本文部科學省補助之「AI電子學卓越大學院(WISE program for AI Electronics)」的博士學程學生,那是一個五年一貫的博士學程(可從第三年插入,前兩年相當於一個碩士學位的份量),學程重視與實務以及產業的連結,也注重跨領域學習。當時一起修課的同學包含物理系、機械系、數學系等其他專業的學生,而課程內容也包含一些邀請產業界的業師來共同授課的課程,當時接觸了佳能醫藥(Canon Medical Systems) 、日本電氣(NEC)等業師來開授的PBL(Project-Based Learning;專題導向學習)課程,進行了不同的程式設計開發專案。而實務面上,也有機會在日本的愛信軟體(AISIN Software)進行 AI 相關課題的研究實習,有機會跟職場前輩交流,也同樣獲益良多。
接觸了不同的實務技術之後,也打開了新的世面,學習各種與AI開發、軟體開發有關的相關應用之後,對於做研究本身具有相輔相成的效果。除了研究本身更能夠進行各種新興技術的測試開發之外,也能夠因此再更習慣性地想到研究的課題與現場實務之間的連結。
從吾所好,從產業界回到教職
記得有位日本人跟我說過,有先到這個世間上做點事情之後再到大學當老師還是比較好的。日本博士班畢業之後,我先到業界做了一年的工程師,接觸了不同的軟體專案或是 AI 工具會導入到工廠產線的實務面。
不過,心之所向還是希望,比起能夠成為一個打造武器的人之外,更希望能成為一個教人打造武器的人。我回到了學界,進到了輔仁大學資訊管理學系任教,對於輔大校風打造的理論與實務並重,以及重視「做中學」的精神,也是我一直以來所認同的概念。
古有六藝,禮、樂、射、御、書、數,有的時候我想到古代文人,或者想到春秋戰國時代的那些哲人,我想文人絕不會是一種文弱書生的形象。回首大學到研究所畢業的學習,有文有理的學習路徑,我想也是一種文人的形象,文科與理科並不衝突,或者甚至可以說,就像如蘇東坡一樣除了正經的寫詩之外,也還是可以跟上潮流寫詞。作為一現代文人,還是可以跟著科技潮流,同時也是一個 AI 人。而關於選擇、關於職涯規劃、關於如何為自己打造學習地圖──我想引用我在修「文學概論」課程時,對於我啟發甚深的陳昭瑛老師所言──「從吾所好,隨遇而安」。
論文參考:
Wang, G.-Y.*, Hatori, Y., Sato, Y., Tseng, C., & Shioiri, S. (2025). Predicting learners' engagement and help-seeking behaviors in an e-learning environment by using facial and head pose features. Computers and Education: Artificial Intelligence, 8, 100387. https://doi.org/10.1016/j.caeai.2025.100387
Wang, G.-Y.*, Nagata, H., Hatori, Y., Sato, Y., Tseng, C.-H., Shioiri, S. Detecting Learners’ Hint Inquiry Behaviors in e-Learning Environment by using Facial Expressions. In Proceedings of the Tenth ACM Conference on Learning @ Scale (L@S '23). July 20-22, 2023, Copenhagen, Denmark. ACM, New York, NY, USA,4 pages. https://doi.org/10.1145/3573051.3596182
文章分類
標籤
作者介紹
特約作者
由我們邀請擔任特約作者的語言學者。
相關文章
自然語言處理在低資源語言中的挑戰與機會 (二)
大型語言模型 (LLMs) 在自然語言處理 (NLP) 領域取得了顯著的技術突破。然而,在其廣泛應用的背後,存在著一個核心問題:LLMs 是否能在所有語言中保持一致的表現?特別是對於「低資源語言」而言,LLMs 的表現及困境仍然是亟待探討的重要課題。
自然語言處理在低資源語言中的挑戰與機會 (一)
大型語言模型 (LLMs) 在自然語言處理 (NLP) 領域取得了顯著的技術突破。然而,在其廣泛應用的背後,存在著一個核心問題:LLMs 是否能在所有語言中保持一致的表現?特別是對於「低資源語言」而言,LLMs 的表現及困境仍然是亟待探討的重要課題。