外文系數位時代的戰略與戰術
句法語意 科技應用
本文為一系列作者對於語言學與自然語言處理活動及實習的心得紀錄,包含參與Python自然語言處理工作坊,以及林融與王文傑的演講紀錄
現在的生成式人工智慧能做到的事情越來越多,也越做越好。像是ChatGPT這樣的大型語言模型應用,從一般的問答、文章翻譯、摘要到檢查,甚至程式碼的撰寫,都能幫上忙。而身為語言學研究所的學生,我對於機器和資訊系統學習人類語言這件事情感到驚奇之餘,也很好奇 LLM 和人類在「語言知識的儲存表徵與運用機制」的差異究竟在哪裡?
語言學究竟是什麼?是否學習語言學就代表要懂多國語言?作為一門科學以及語文相關科系的必修課程,語言學的核心目的和研究對象究竟是什麼?語言學家們又是如何踏上這條道路的?他們在學術之路上經歷了哪些心酸與挑戰?本集邀請了國立陽明交通大學外國語文系教授盧郁安來分享他的語言學旅程,並探討語言學如何影響我們理解語言的方式。節目中也介紹了Penny Eckert的書籍《Meaning and linguistic variation: The Third Wave in sociolinguistics》中致謝的一位高中老師,了解知名學者怎麼因緣際會變成語言學者。
促聲調並不是一成不變的。最近的研究顯示,這些特殊的聲調正悄悄地發生變化。目前的研究觀察指出促聲調的變化可能由多種因素引起,包括語音系統內部的變化、社會語言學因素以及語言使用頻率等。接下來,我們將探討促聲調的具體變化情況。
前半段時間我專注於南島語資料的預處理,包括資料的讀取和寫出,以及學習使用「正規表達式」來抓取語料。後半段時間則著重在將處理好的語料套入字典內,並針對搜尋功能做調整,包括最基本的詞彙配對,以及 C 為所有子音、V 為所有母音、N 為所有鼻音的配對方式等等,便能以音結結構查詢詞彙。
社會語言學視角側重於展現個體的神經多樣性和探討造成失能的社會障礙,但有時它未能捕捉到社會現實。有些失能者因為在生活中遇到的一連串的現實需求,而希望放棄他們的多樣性並融入主流社會結構中。即便醫學模型已經解決了其與語言正常化的負面聯繫,並正面的協助失能者擁有更多的自主權來實現他們的個人需求,社會上的條件和現實對失能者來說仍然具有挑戰性。
我參與了卓騰語言科技的實習計畫,在這段兩個月的實習過程中,我不僅加深了對語言學理論的理解,還學習到如何利用自然語言處理(NLP)和自然語言理解(NLU)技術來解決現實中的問題。這次實習不僅讓我拓展了技術技能,更讓我體會到語言科技如何跨越學術和產業之間的界限。
聲調融合對海陸客語的影響不僅改變了語音音韻系統,也對語言的實際使用及文化保存出道難題。這一現象簡化了語音音韻系統,可能會降低了言談時的準確性。另一方面,客語的傳承也是不可忽視的課題,當前需要推動客語的使用率,同時加強家庭內語言傳承的環境,唯有如此,我們才能有效保護和延續這一珍貴的語言資源。
雙模雙語方法的重要性需要受到關注,尤其是在植入電子耳之前讓聽損兒童接觸手語,能夠顯著提升他們的口語能力和語音記憶。此外,研究結果表明,即使是短暫接觸非母語手語,也能對聽損兒童的語言發展產生積極影響。這些發現支持了在聽損兒童的語言教育中,早期介入手語的必要性。
台語逐漸從漳州、泉州的閩南語經過融合發展的歷程,而形成如今不漳也不泉的特色。台語本身仍然具有相當豐富而有特色的方言差異,但在過去台語長期未受到官方語言之地位且並未受到標準化的情形之下,不同方言與語言的轉變更為頻繁,發音往往會透過移民之間口耳相傳而改變。由於語言是個連續體,我們很難在不參考其他脈絡的情況下,去認定一個語言到底是「語言」還是「方言」。