Re: [問題] 不同大小的圖片能形成manifold嗎?

看板DataScience作者 (QQ)時間6年前 (2018/11/14 20:49), 編輯推噓2(200)
留言2則, 2人參與, 6年前最新討論串2/2 (看更多)
※ 引述《CVPR (ICCV)》之銘言: : 如果我有一張圖片的數張不同大小版本 : 這些圖片在高維空間也是形成manifold嗎? : 還是說不行? 不知道你要知道多細 單就你推文的"失真" 就只是upscale/downscale所用的演算法 進行的內插再取四捨五入的結果而已 而你不管用(1)nearest(直接找最近然後複製) (2)bilinear(雙線性內插 & 四捨五入) (3)bicubic(雙三叉值內插 & 四捨五入) 這些方式都有經過不連續函數的作用如下: (1) step function (2) bilinear form + 四捨五入(非線性) (3) bicubic form(XD? 數學上沒學過這種名稱) + 四捨五入(非線性) 接著最重要的原因是影像所在的空間是discrete(離散型)的 上面這些函數(或是做影像的神經網路的output最後要形成影像也是要四捨五入) 就只是把處在離散空間的影像打到另一個離散空間 因此單就"離散"來看 討論流形是毫無意義的 離散空間本身是0維流形,就只是點 因此我推文才說,這些點你說他座落在某個曲線(1維流形)、曲面(2維流形)... 都隨你講,數學上都是對的,也有無限多組解 所以要把這個問題有意義化,需要把空間連續化 像是原本RGB三通道且寬=w, 高=h的影像空間純粹同構於 D:={0,1,...,255}^(w*h*3) 將空間連續化自然就變成 C:= [0,1,...,255]^(w*h*3) 因此上面那三種演算法中的(2)(3)自然不用去四捨五入,保留前面連續函數的部分 而這兩個連續函數的變數都只有兩個且都是無窮可微函數,令為f 因此f(C)是一個可微二維流形 總結來說,在問"拉伸同一張圖片是否形成manifold"前,要先問 (1)你的manifold定義是什麼 (2)你的拉伸演算法是什麼 如果都無法明確定義,或是只是一種"感覺"罷了,那就不用太care這個問題了XDD 像是我把一張圖片每次旋轉1度形成360張圖 然後用UMAP流形降維再用tensorboard畫3D圖 確實這些點如預期的形成一個環 = 一維流形 符合變數只有一個 = 角度 把這些點看成佛珠的話,人類很直覺會把他代入成一個環(圓環線串起來) 但是數學上有無窮多種可能的線去穿過全部的佛珠 ----------------------------------------------------------------- 一開始接觸ML/DL時看到manifold learning很興奮 看如何跟黎曼流形連結 直到我看到了這句:這裡所稱的流形與數學上不太一樣 純粹是個概念( ′-`)y-~ -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.99.149.254 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1542199776.A.3FC.html

11/15 00:34, 6年前 , 1F
感謝回覆
11/15 00:34, 1F

11/17 12:14, 6年前 , 2F
ML/DL很多數學不是真的那個定義,而是借用概念
11/17 12:14, 2F
文章代碼(AID): #1Rx1dWFy (DataScience)
文章代碼(AID): #1Rx1dWFy (DataScience)