最新文章

從生成語言學到自然語言處理(二):LLM 的推理 v.s. 人類的推理

從生成語言學到自然語言處理(二):LLM 的推理 v.s. 人類的推理

句法語意 科技應用

掌握母語知識後,幼兒便能開始創造其「一生中從沒看過或聽過」的句子。反觀 LLM,以 Meta 開發的 Llama 3.1 405B為例,根據官方給出的數據,其訓練資料包含超過 15 兆個字元,這幾乎可以說是網際網路出現以來所有的文本資料了,並且其訓練用的硬體設備不論在記憶體大小還是執行速度上,都遠超幼兒大腦。集大量軟硬體資源於一身的 LLM 在「語言知識」上仍與普通人類有基本的差異,甚至在某些特定情境下,不及那個每天早上只靠一杯咖啡保持頭腦清醒、侃侃而談的你。

學英語總是發不好音?── 專訪音韻學家盧郁安

學英語總是發不好音?── 專訪音韻學家盧郁安

語音音韻

「語言不是簡單的二分法,而是一個像光譜般的灰階系統。所以呀,下次如果遇到英文初學者把『see』發成『she』,或是把『she』發成『see』,請不要責怪他,你可以拍拍他,跟他說:『這不是你的錯啦,音韻理論說這很正常!』」盧郁安教授說。

從生成語言學到自然語言處理(一):LLM和人類一樣嗎?

從生成語言學到自然語言處理(一):LLM和人類一樣嗎?

句法語意 科技應用

現在的生成式人工智慧能做到的事情越來越多,也越做越好。像是ChatGPT這樣的大型語言模型應用,從一般的問答、文章翻譯、摘要到檢查,甚至程式碼的撰寫,都能幫上忙。而身為語言學研究所的學生,我對於機器和資訊系統學習人類語言這件事情感到驚奇之餘,也很好奇 LLM 和人類在「語言知識的儲存表徵與運用機制」的差異究竟在哪裡?

播客 EP1. Feat. 盧郁安:什麼?當初我們是這樣走上語言學的!

播客 EP1. Feat. 盧郁安:什麼?當初我們是這樣走上語言學的!

影音 語音音韻

語言學究竟是什麼?是否學習語言學就代表要懂多國語言?作為一門科學以及語文相關科系的必修課程,語言學的核心目的和研究對象究竟是什麼?語言學家們又是如何踏上這條道路的?他們在學術之路上經歷了哪些心酸與挑戰?本集邀請了國立陽明交通大學外國語文系教授盧郁安來分享他的語言學旅程,並探討語言學如何影響我們理解語言的方式。節目中也介紹了Penny Eckert的書籍《Meaning and linguistic variation: The Third Wave in sociolinguistics》中致謝的一位高中老師,了解知名學者怎麼因緣際會變成語言學者。

臺灣閩南語的促聲調現況

臺灣閩南語的促聲調現況

語音音韻

促聲調並不是一成不變的。最近的研究顯示,這些特殊的聲調正悄悄地發生變化。目前的研究觀察指出促聲調的變化可能由多種因素引起,包括語音系統內部的變化、社會語言學因素以及語言使用頻率等。接下來,我們將探討促聲調的具體變化情況。

語言科技如何助力瀕危語言復振?以西拉雅語 NLP 專案為例

語言科技如何助力瀕危語言復振?以西拉雅語 NLP 專案為例

社會應用 科技應用

前半段時間我專注於南島語資料的預處理,包括資料的讀取和寫出,以及學習使用「正規表達式」來抓取語料。後半段時間則著重在將處理好的語料套入字典內,並針對搜尋功能做調整,包括最基本的詞彙配對,以及 C 為所有子音、V 為所有母音、N 為所有鼻音的配對方式等等,便能以音結結構查詢詞彙。 

平衡醫療觀點和社會語言學視角:可能嗎?

平衡醫療觀點和社會語言學視角:可能嗎?

社會應用 醫療關懷

社會語言學視角側重於展現個體的神經多樣性和探討造成失能的社會障礙,但有時它未能捕捉到社會現實。有些失能者因為在生活中遇到的一連串的現實需求,而希望放棄他們的多樣性並融入主流社會結構中。即便醫學模型已經解決了其與語言正常化的負面聯繫,並正面的協助失能者擁有更多的自主權來實現他們的個人需求,社會上的條件和現實對失能者來說仍然具有挑戰性。

語言科技的跨域實踐:從語言學理論到卓騰科技實習經驗

語言科技的跨域實踐:從語言學理論到卓騰科技實習經驗

科技應用

我參與了卓騰語言科技的實習計畫,在這段兩個月的實習過程中,我不僅加深了對語言學理論的理解,還學習到如何利用自然語言處理(NLP)和自然語言理解(NLU)技術來解決現實中的問題。這次實習不僅讓我拓展了技術技能,更讓我體會到語言科技如何跨越學術和產業之間的界限。

兩代混音派對:探索海陸客語聲調的新面貌

兩代混音派對:探索海陸客語聲調的新面貌

語音音韻 社會應用

聲調融合對海陸客語的影響不僅改變了語音音韻系統,也對語言的實際使用及文化保存出道難題。這一現象簡化了語音音韻系統,可能會降低了言談時的準確性。另一方面,客語的傳承也是不可忽視的課題,當前需要推動客語的使用率,同時加強家庭內語言傳承的環境,唯有如此,我們才能有效保護和延續這一珍貴的語言資源。