Re: [問題] 以bit為單位的無失真compressor...

看板CSSE (電腦科學及軟體工程)作者 (go lifer)時間18年前 (2006/05/11 15:20), 編輯推噓4(4040)
留言44則, 4人參與, 最新討論串6/20 (看更多)
恕刪 原資料 0 跟 1 的比例為 75% : 25% 的情況下 可以算一下他的 entropy 是 -(0.75 * log2(0.75) + 0.25 * log2(0.25)) = 0.811 左右 這表示使用 general-purpose 的 entropy coder (如 arithmetic 或 Huffman coder) 的壓縮極限就在 0.811 = 81.1% 左右 一般資料壓縮的壓縮率要能提升, 通常是因為資料本身有某些規則性, 例如 image (相鄰的 pixel 顏色相近) 或統計性的資料, 但原 PO 有強調他的資料是亂數分佈, 因此要再提升壓縮率是相當困難的 也許用 RLE 之類的非 entropy coding 方法有可能再進一步 但那是有點運氣問題的 至於無失真影像壓縮的部分 我推薦原 PO 看一下 JPEG-LS -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.124.166.94

05/11 18:53, , 1F
感謝回應^^",請問entropy的公式是根據哪個理論得來的...^^
05/11 18:53, 1F

05/11 23:23, , 2F
資訊理論 這公式在電腦科學的地位約等於物理學的E=MC^2呢
05/11 23:23, 2F

05/11 23:31, , 3F
是連結資訊與自然世界之間的核心樞紐之一 意義相當重大
05/11 23:31, 3F

05/11 23:32, , 4F
不過現在還真難得在科學史之外 看到有人用上那麼一回
05/11 23:32, 4F

05/12 02:08, , 5F
不會很難得看到吧,Pattern Recognition相關的研究常用到.
05/12 02:08, 5F

05/12 02:12, , 6F
是很重要的理論,但是有那麼誇張的地位嗎?
05/12 02:12, 6F

05/12 02:29, , 7F
主要是因為在其他學科上也有訊息傳遞的現象值得研究
05/12 02:29, 7F

05/12 02:39, , 8F
若能通過資訊理論檢驗就能整合電腦作研究 算是很關鍵一步
05/12 02:39, 8F

05/12 02:40, , 9F
所以是電腦科學中最能帶給其他學科衝擊的理論之一了
05/12 02:40, 9F

05/12 02:46, , 10F
這和拿電腦做研究工具是不一樣的事情 而是實在的理論連結
05/12 02:46, 10F

05/12 10:49, , 11F
但這只是關鍵一步,關鍵的步可多了.
05/12 10:49, 11F

05/12 10:50, , 12F
計算理論或正規語言中探討的可計算性,不也是重要的一步.
05/12 10:50, 12F

05/12 10:50, , 13F
這主要因素是因為計算機非傳統科學,所以待整合的東西可多了
05/12 10:50, 13F

05/12 10:54, , 14F
邏輯學,集合論中很多理論跟資訊科學整合也是很重要的"一步"
05/12 10:54, 14F

05/12 10:54, , 15F
感覺起來,NP-complete觀念的引入還比較接近E=MC^2.
05/12 10:54, 15F

05/12 17:56, , 16F
可計算性一直被認為是數學 而且跟自然科學缺乏連結
05/12 17:56, 16F

05/12 17:57, , 17F
但資訊熵的概念卻是真實世界運作的一個部分
05/12 17:57, 17F

05/12 18:02, , 18F
逐步在物理、化學、生物、生態、經濟、哲學、政治等學科
05/12 18:02, 18F

05/12 18:05, , 19F
建立起影響力 其他相關的如控制論也不被認為是電腦科學
05/12 18:05, 19F

05/12 18:06, , 20F
到混沌學則已經是太過後期的新科學發展 但資訊理論是1948年
05/12 18:06, 20F

05/12 18:07, , 21F
一般所謂戰後新科學的組成中 電腦科學就是以資訊理論而進入
05/12 18:07, 21F

05/12 18:08, , 22F
這樣的體系當中 當然這比較是偏向科學史的觀點而不是實用性
05/12 18:08, 22F

05/12 18:10, , 23F
但E=MC^2也主要是作為科學認識的拓展大於實際作用
05/12 18:10, 23F

05/12 18:18, , 24F
或者說計算理論是讓電腦科學脫離數學的關鍵
05/12 18:18, 24F

05/12 18:18, , 25F
資訊理論是讓電腦科學成為科學的關鍵
05/12 18:18, 25F

05/12 18:23, , 26F
現在習稱系統論控制論和信息論(資訊理論)為系統科學老三論
05/12 18:23, 26F

05/12 18:26, , 27F
可計算性則通常是放在數學發展史上來講的
05/12 18:26, 27F

05/12 19:17, , 28F
不是很能理解熵在電腦史中的重要性.因為我一直感覺是統計學
05/12 19:17, 28F

05/12 19:19, , 29F
跟其他自然科學結合的關鍵,而計算機科學則是引用了統計學中
05/12 19:19, 29F

05/12 19:19, , 30F
的這個概念.
05/12 19:19, 30F

05/12 19:20, , 31F
有沒有相關介紹這方面演進的文獻資料可供參考?
05/12 19:20, 31F

05/12 21:48, , 32F
統計學被引入自然科學是在熱力學時就建立起來的吧...
05/12 21:48, 32F

05/12 21:51, , 33F
透過資訊理論才建立了非能量的訊息的自然存在與傳播原理
05/12 21:51, 33F

05/12 21:56, , 34F
數學原理是一回事 概念的拓展才是重點
05/12 21:56, 34F

05/12 21:59, , 35F
就像廣義相對論和黎曼幾何不能說是同樣的東西
05/12 21:59, 35F

05/12 22:00, , 36F
概念上也是廣義相對論才具有重要的影響力 否則數學只是數學
05/12 22:00, 36F

05/12 22:03, , 37F
其實上網找「信息論」就有一堆資料了
05/12 22:03, 37F

05/12 22:09, , 38F
05/12 22:09, 38F

05/12 22:21, , 39F
我不是指Information Theory的研究,相關論文我也有看過一些
05/12 22:21, 39F

05/12 22:22, , 40F
我是想請問關於reader大大前面所說的歷史演進,和其重要性的
05/12 22:22, 40F

05/12 22:24, , 41F
相關資料.
05/12 22:24, 41F

05/12 23:03, , 42F
剛才針對老三論查了一下,這似乎是由人文科學的觀點來看,
05/12 23:03, 42F

05/14 15:01, , 43F
如果從資訊理論被人文科學廣泛引用的情況來說,的確跟
05/14 15:01, 43F

05/14 15:03, , 44F
相對論被拿去扯是差不多的狀況。
05/14 15:03, 44F
文章代碼(AID): #14OkMi4M (CSSE)
討論串 (同標題文章)
文章代碼(AID): #14OkMi4M (CSSE)