討論串[問題] L1與L2正規化的差別
共 3 篇文章
首頁
上一頁
1
下一頁
尾頁
內容預覽:
一點數學史. 大概在十幾年前. Tao跟Donoho在研究compressive sensing時. 忘記是誰發現L0 optimization可以relax成L1 optimization. 稀疏是從L0來的. 但L0-norm不是convex problem. L1是convex. 所以可以用c
(還有183個字)
內容預覽:
推文裡提到一些觀點都不太嚴謹 (可能是我想像力太差). 1. 每次梯度下降的大小是L1>L2:. 格局太小不說(離了GD推論就無效), 迭代的過程只是想當然耳,. 每一步用的梯度大小應該只影響收斂速度而非收斂到的值,. 難道是原來就有稀疏解, 只是用L1比較快?. 那麼不用L1但增加learning
(還有1501個字)
首頁
上一頁
1
下一頁
尾頁