曾竑勳
理工學院
資訊工程學系
這次參與Kaggle的BirdCLEF+2026競賽,讓我實際接觸到聲音辨識在生態監測上的應用,這個題目不是單純把資料丟進模型就結束,而是要先理解錄音資料的格式、物種標籤的結構、sample submission的欄位,以及競賽對Notebook執行環境的限制,像是一開始我嘗試使用GPU版本訓練模型,雖然程式可以執行,但因為比賽規定GPU可用時間是0分鐘,所以最後無法提交,後來才改成CPU-only版本,這讓我學到資料科學競賽不是只有模型準確率重要,規則、環境、執行時間、記憶體限制和提交格式都會影響結果,在技術實作上,我使用音訊切片、log-mel spectrogram、CNN模型、多標籤分類、class prior和temporal smoothing等方法,先建立能成功輸出submission.csv的baseline,第一次提交拿到0.511,後來又嘗試加強版本,想把分數往0.65靠近,但第二次結果反而降到0.477,這讓我更明白模型調整不是每次都會進步,有時候加入更多訓練資料、後處理或複雜設定,反而可能造成模型判斷不穩,這次經驗讓我從實作中看見音訊資料處理的難度,也更理解真實競賽中要重視版本管理與結果比較。
在增能突破的部分,這次最大的成長是問題拆解能力和面對挫折時的調整能力,以前遇到錯誤訊息,我可能會先以為是程式寫錯,但這次看到runtime exceeds GPU max of 0 minutes之後,我慢慢理解問題不是模型本身,而是提交環境不符合競賽規定,所以必須重新思考解法,從GPU訓練改成CPU可執行的輕量化流程,這讓我學到解決問題時不能只看表面錯誤,而要判斷它是資料問題、程式問題、環境問題還是規則問題,另外在分數從0.511掉到0.477的過程中,我也學到競賽優化不能只靠直覺,不能覺得模型變複雜就一定比較好,也不能覺得樣本增加就一定能提高分數,必須保留每一次提交的設定,觀察哪個版本真的有效,再決定要不要繼續往那個方向走,這個過程讓我練習到如何面對不如預期的結果,先接受分數下降,再回頭分析原因,而不是只想著重跑或亂改參數,對我來說這比單純拿到高分更有幫助,因為它讓我更接近實際專案開發時會遇到的狀況。
培力價值方面,獎助金對我來說不只是金錢上的補助,更像是讓我有機會把這次競賽當成一次正式的學習與能力累積,因為有這份支持,我更願意投入時間去研究Kaggle平台、理解競賽規則、測試不同Notebook版本,也比較有動力把過程整理成可以說明的成果,而不是只停留在試跑看看而已,這次參與讓我接觸到人工智慧、聲音訊號處理、生態資料分析和雲端競賽平台的整合應用,也讓我知道自己在實務上還有很多可以加強的地方,像是模型架構選擇、資料前處理、驗證策略、執行效率控制和結果分析等,雖然第二次提交從0.511降到0.477,表面上看起來是退步,但我覺得這反而讓這次學習更完整,因為我不只看到成功提交的成果,也看到優化過程中的風險和限制,未來如果再參加類似競賽,我會更重視baseline保存、實驗紀錄、參數比較和提交策略,這次最大的收穫不是單純拿到一個分數,而是我真的走過從理解題目、建立baseline、處理錯誤、成功提交、嘗試優化到反思失敗版本的完整流程。