[發案] Transformer Bug hunter

看板CodeJob (BBS架站)作者 (我是一隻小蜜蜂)時間1周前 (2025/01/04 01:38), 編輯推噓1(101)
留言2則, 2人參與, 5天前最新討論串1/1
凡是「 」開始的行,都請使用 刪除。 如果對於發案文章格式有不清楚的地方,請參考置底文章: 發案 發案範例  發案人:林宥叡 聯絡方式1:nicklin910221@gmail.com 聯絡方式2: 所在地區 : 有效時間:解出來為止 專案說明:附件是我的功課 而我到目前還是找不到問題出在哪 (功課繳交期限已過 不是代做功課 純粹個人研究精神 希望知道問題出在哪 感謝願意抽空協助討論的接案者 主要是做拼字檢查的模型 而目前遇到的狀況是在train時 輸出在預期中 並且可正確達成拼字更正 但在valid/test時 會發生異常 目前是透過ARM去inference https://i.imgur.com/Twkc1Cf.jpeg
https://i.imgur.com/4qnDJSD.jpeg
而以下附件連結 Decoder mask有試過一般的上三角去遮擋 也有試過用隨機的長度去做 https://cloud.dearestbee.com/s/x6biDqXdN9ssp6o 誠心感謝願意付出時間協助解惑的人   預算:1000 接案者要求:   附註: -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.254.18.192 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/CodeJob/M.1735925922.A.668.html

01/05 17:35, 1周前 , 1F
over fitting吧,你看看你的testing loss
01/05 17:35, 1F

01/10 00:26, 5天前 , 2F
可以嘗試看看早停機制
01/10 00:26, 2F
文章代碼(AID): #1dU22YPe (CodeJob)
文章代碼(AID): #1dU22YPe (CodeJob)