[問題] L1與L2正規化的差別
在網路上看了不少文章,但還是無法理解為何L1會具有稀疏的特性?這兩者的具體差別到
底是什麼呢,能用gradient descent 在微分時的差別來解釋嗎?
另外想請問大家是怎麼選正規化的權重alpha的?雖說知道是用trial and error,但數字
範圍這麼廣,有沒有限縮範圍的方法呢?
感謝大家
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.50.162.168
※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1522914287.A.5DE.html
推
04/05 16:03,
6年前
, 1F
04/05 16:03, 1F
→
04/05 17:50,
6年前
, 2F
04/05 17:50, 2F
推
04/05 20:02,
6年前
, 3F
04/05 20:02, 3F
推
04/05 23:24,
6年前
, 4F
04/05 23:24, 4F
推
04/06 03:42,
6年前
, 5F
04/06 03:42, 5F
推
04/06 15:57,
6年前
, 6F
04/06 15:57, 6F
→
04/06 15:59,
6年前
, 7F
04/06 15:59, 7F
推
04/06 16:00,
6年前
, 8F
04/06 16:00, 8F
→
04/06 16:00,
6年前
, 9F
04/06 16:00, 9F
→
04/06 16:01,
6年前
, 10F
04/06 16:01, 10F
→
04/06 16:03,
6年前
, 11F
04/06 16:03, 11F
→
04/06 16:04,
6年前
, 12F
04/06 16:04, 12F
→
04/06 16:04,
6年前
, 13F
04/06 16:04, 13F
→
04/06 16:05,
6年前
, 14F
04/06 16:05, 14F
→
04/06 16:06,
6年前
, 15F
04/06 16:06, 15F
→
04/06 16:09,
6年前
, 16F
04/06 16:09, 16F
→
04/06 16:10,
6年前
, 17F
04/06 16:10, 17F
→
04/06 16:11,
6年前
, 18F
04/06 16:11, 18F
→
04/06 16:12,
6年前
, 19F
04/06 16:12, 19F
→
04/06 16:13,
6年前
, 20F
04/06 16:13, 20F
→
04/06 16:14,
6年前
, 21F
04/06 16:14, 21F
→
04/06 16:15,
6年前
, 22F
04/06 16:15, 22F
→
04/06 16:17,
6年前
, 23F
04/06 16:17, 23F
→
04/06 16:18,
6年前
, 24F
04/06 16:18, 24F
推
04/06 16:22,
6年前
, 25F
04/06 16:22, 25F
→
04/06 16:23,
6年前
, 26F
04/06 16:23, 26F
→
04/06 16:24,
6年前
, 27F
04/06 16:24, 27F
推
04/06 20:57,
6年前
, 28F
04/06 20:57, 28F
→
04/06 20:58,
6年前
, 29F
04/06 20:58, 29F
討論串 (同標題文章)
DataScience 近期熱門文章
PTT數位生活區 即時熱門文章