Re: [請益] Windows下讀許功蓋檔名的檔案

看板PHP作者 (飄)時間13年前 (2012/09/21 23:51), 編輯推噓1(1010)
留言11則, 6人參與, 最新討論串2/2 (看更多)
自問自答 整理一下目前的看法 有錯還請麻煩指正 首先 Google 找到大部分關於許功蓋的問題 通常是為了解決將Big5編碼的許功蓋字串 存入 DB 時會遇到的問題 因為這些字串包含\字元 而\通常在程式中通常有跳脫字元的義涵 所以通常用addslashes函式處理過後 再存入DB中 要使用時再從DB取出 使用stripslashes函式 來顯示到網頁上 不過實際上只要上傳網頁、存入的中文字串以及使用的DB都使用utf-8編碼 就可以避掉這個問題 所以在此例上傳檔案的情況 只要上傳的 php 網頁使用utf-8編碼 基本上$_FILES['userfile']['name'] 就會是utf-8編碼 如果想將檔名存入 DB 直接使用這個變數就可以了 問題在於如果要存上傳檔案到Server上 而Server又是Windows (Big5)的話 因為只能存big5檔名 而不能存utf-8檔名 所以一般直覺會使用下面做法: $upload_dir = "upload/"; $big5_fn = mb_convert_encoding($_FILES['userfile']['name'], "utf-8", "big5"); //將 utf8 檔名轉成 Big5 檔名 move_uploaded_file($_FILES['userfile']['tmp_name'] , ($upload_dir . $big5_fn) ); //移到上傳資料夾 然後就是惡夢的開始 因為先前提過的許功蓋字串問題 這些字串內包含\字元 所以使用像是is_file、readfile這些函式時會發生問題 猜測可能是因為這些函式接受路徑檔名 而這些函式內部又沒對許功蓋的情況做處理 所以對這些函式 "upload\許功蓋.txt" 看起來會是"upload\?\?\.txt" 所以就出問題了 目前找到的作法 就是不要存中文檔名 另外使用其他英文數字來當檔名 可想而知 就得存對應檔名的資訊 ex. 許功蓋.txt <=> abc123.txt 如果不想存? 用urlencode()編碼處理 避掉許功蓋問題後再存? 這裡又會衍生一個問題 Windows 檔名有260個字元限制 用urlencode() 是會爆的做法 目前看到有的人使用英數檔名 然後多使用md5()來編碼 壓縮檔名到32個字元 避免長度超過 可以參考看看 不過得記得 md5() 是不可逆的 (如果不討論破解之類的) ※ 引述《hyderai (飄)》之銘言: : 因為環境是Windows server 所以不得不處理Big5 許功蓋的問題 : 目前要讀取使用者上傳到網站上的檔案 因為Server是Windows : 所以檔名都是big5編碼 假設檔案就是上傳到upload資料夾下 : 在讀取upload資料夾下的檔案時 如果遇到檔名是許功蓋的情形 : (ex. 許功蓋.txt) 使用is_file, readfile之類的函式 都沒辦法正常判斷及讀取 : 不知道有沒有什麼解決方法? : <?php : header('Content-type: text/html; charset=utf-8'); : $a = array(); : $a = scandir("upload/"); : foreach($a as $value){ : echo "檔案名稱:". $value . "<br />"; : if(is_file("upload/" . $value)){ : echo "檔案內容:<br />"; : echo "略<br />\n"; : } : else{ : echo "非檔案:<br />"; //$value 是許功蓋.txt時會判斷成非檔案 : } : } : ?> -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.34.162.25

09/22 03:11, , 1F
md5是單向雜湊函數又不是對稱加密,當然不可逆。
09/22 03:11, 1F

09/22 03:43, , 2F
=.=疑?原PO有說md5()可逆嗎?1F感覺回答的很嚴肅
09/22 03:43, 2F

09/22 09:51, , 3F
最後一句是疑問,一樓沒甚麼回答有問題的狀況
09/22 09:51, 3F

09/22 11:53, , 4F
我個人是用英數取個隨機的檔案名稱 再用資料庫對照
09/22 11:53, 4F

09/22 11:56, , 5F
讀取用資料庫搭配header
09/22 11:56, 5F

09/22 12:01, , 6F
不建議在server上用中文檔名
09/22 12:01, 6F

09/22 12:03, , 7F
不管是在windows或是linux上
09/22 12:03, 7F

09/22 12:05, , 8F
而且盡量用windows和linux都能夠使用的方法
09/22 12:05, 8F

09/22 12:07, , 9F
不然程式要換os執行的話 會需要另外修改
09/22 12:07, 9F

09/24 01:08, , 10F
檔名用md5放, 實際檔名另存這樣作比較簡單.
09/24 01:08, 10F

09/24 08:38, , 11F
推樓上的方法,我也這麼做,只是總覺得可能會有看不見的bug 囧
09/24 08:38, 11F
文章代碼(AID): #1GN8q70y (PHP)
討論串 (同標題文章)
文章代碼(AID): #1GN8q70y (PHP)