Re: [請益] MIME編碼轉換問題…

看板PHP作者 (CC)時間9年前 (2016/04/10 10:25), 編輯推噓3(302)
留言5則, 3人參與, 最新討論串2/2 (看更多)
※ 引述《banana2014 (香蕉共和國)》之銘言: : http://test.red-whale.com.tw/imap_utf8.phps : 照理來講上面應該要印出: : 「高雄市政府線上即時服務系統通知(本信件係系統自動發送,請勿直接回覆)」 : 但是卻印出一個不完整的字串: : 「高雄市政府線上即時服**t統通知(本信件係系統*菾妗o送,請勿直接回覆)」 : (*代表印不出來的字) : ------------------- : 請問如何解決以上問題? : 謝謝 這個小小有趣, 你的原始程式是: $k = "=?big5?Q?=B0=AA=B6=AF=A5=AB=ACF=A9=B2=BDu=A4W=A7Y=AE=C9=AAA=B0?=" . " =?big5?Q?=C8=A8t=B2=CE=B3q=AA=BE=28=A5=BB=ABH=A5=F3=ABY=A8t=B2=CE=A6?=" . " =?big5?Q?=DB=B0=CA=B5o=B0e=A1A=BD=D0=A4=C5=AA=BD=B1=B5=A6=5E=C2=D0=29?="; echo imap_utf8($k); 字串被拆成三個 QP encoding, 第一個的長度是 21 Bytes 而 big5 一個字是雙Bytes, 也就是你有一個字被拆到兩個 QP encoding 去了 這其實不是什麼問題, 反正 decode 之後又會被黏回去了, 根本沒影響 出問題的地方在於你把他轉成 utf8 了... "我猜" imap_utf8 應該是把個別 QP encoding 還原後, 先轉成 utf8 再黏起來 所以你那被切開的半個字就回不去了 如果稍微調整一下, 把被切開的字歸放到正確的位置 這樣子就能夠正確的印出你想要的東西了 注意你有單 Byte 的字元在裡面, 所以沒辦法單純根據奇數或偶數來判斷 $ok = "=?big5?Q?=B0=AA=B6=AF=A5=AB=ACF=A9=B2=BDu=A4W=A7Y=AE=C9=AAA?=" . " =?big5?Q?=B0=C8=A8t=B2=CE=B3q=AA=BE=28=A5=BB=ABH=A5=F3=ABY=A8t=B2=CE?=" . " =?big5?Q?=A6=DB=B0=CA=B5o=B0e=A1A=BD=D0=A4=C5=AA=BD=B1=B5=A6=5E=C2=D0=29?="; echo imap_utf8($ok); 那...總不可能每次都手動調整吧? 講了這麼多理論, 就是要讓你知道, 先還原成完整的 big5 字串再轉 utf8 即可 $srcText = ""; $charset = "auto"; foreach(imap_mime_header_decode($k) as $v) { $srcText .= $v->text; $charset = $v->charset !== "default" ? $v->charset : $charset; } echo mb_convert_encoding($srcText, "UTF-8", $charset); -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.68.230.200 ※ 文章網址: https://www.ptt.cc/bbs/PHP/M.1460255145.A.54A.html

04/10 11:40, , 1F
推專業解說
04/10 11:40, 1F

04/10 13:25, , 2F
非常感謝您,請問其它語言的編碼也是用這種方法去分
04/10 13:25, 2F

04/10 13:25, , 3F
解並轉成utf-8嗎?真的很感謝您的回答!
04/10 13:25, 3F

04/11 00:00, , 4F
這應該是通用的方法喔,頂多再注意一下charset有沒有變
04/11 00:00, 4F

04/11 08:12, , 5F
真心感謝
04/11 08:12, 5F
文章代碼(AID): #1N2RcfLA (PHP)
討論串 (同標題文章)
文章代碼(AID): #1N2RcfLA (PHP)