Re: [問題] 似乎是big5編碼
※ 引述《elfkiller (沒有暱稱)》之銘言:
: 在寫網頁路徑變換程式
: 而在網頁原始檔中有一段 %u5929%u4F7F ... 這樣的文字
這個算是 Unicode 表示法,
都是以 %u 開頭,
然後後面接著 4 個 16 進位數字。
例如「天使」這兩個字的 Unicode 碼位分別為 22825 和 20351,
由 10 進位轉成 16 進位後就變成 5929 和 4F7F,
再套入上述的表示法即為 %u5929 和 %u4F7F,
也就是你在網頁原始檔所看到的文字。
不過根據維基百科上的說法 [1],
此種表示法是非標準的,
沒有任何 RFC [2] 有說到這種用法,
連 W3C [3] 也已經否決掉這種用法了。
[1] http://tinyurl.com/nf3777
[2] http://zh.wikipedia.org/w/index.php?title=RFC&variant=zh-tw
[3] http://tinyurl.com/mj5afn
: 而換至實際位置時卻會變成 %E5%A4%A9%E4%BD ...
其實應該是 %E5%A4%A9%E4%BD%BF,
你少打了最後的 %BF。
這個是比較常見的網址編碼方式 - 百分比符號編碼法 [4],
顧名思義,你會看到有一堆百分比符號。
它是先將文字以 UTF-8 的方式編碼,
然後再把編碼後的 16 進位數字以兩個、兩個為單位,
分別在每一單位前面加上一個 % 符號。
同樣以「天使」為例,
用 UTF-8 編碼後變成 E5 A4 A9 和 E4 BD BF,
所以再在每個單位前加上 % 就變成了 %E5 %A4 %A9 和 %E4 %BD %BF。
[4] http://en.wikipedia.org/wiki/Percent-encoding
: 不知道這之間的關聯性是?
--
┌────┐國家研究院◆ Academy◆ EarthEnviron◆ Ecophilia環境板 ξF
│ ─┤
│ ├──┬──┬──┬┐┌┬──┬┐ ┌──┬──┐綠色生活,從我開始。
│ ─┤ ┌┤ ││ ─│└┘├┐┌┤│ └┐┌┤ ─ │﹊﹊﹊﹊﹊﹊﹊●﹊﹊
│ │ └┤ ││┌─┤┌┐├┘└┤└─┬┘└┤┌┐│ ●◣◢
└────┴──┴──┴┘█└┘└┴──┴──┴──┴┘└┘▆▅▅▄▃▂▁ ◢
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 218.175.158.14
推
07/05 12:00, , 1F
07/05 12:00, 1F
推
07/05 18:31, , 2F
07/05 18:31, 2F
推
07/05 23:04, , 3F
07/05 23:04, 3F
推
07/05 23:42, , 4F
07/05 23:42, 4F
討論串 (同標題文章)
C_and_CPP 近期熱門文章
PTT數位生活區 即時熱門文章