[問題] 丟陣列中文字串給c++ dll 長度異常

看板C_Sharp (C#)作者 (tw30912)時間3年前 (2020/05/09 15:00), 3年前編輯推噓2(209)
留言11則, 1人參與, 3年前最新討論串1/1
我的程式很簡單 用 c# 引用 c++ 的 dll c++ dll 的內容如下: extern "C" _declspec(dllexport) void func1(char* inputStr) { return; } extern "C" _declspec(dllexport) void func2(char* inputStrArr[]) { char* inputStr0 = inputStrArr[0]; char* inputStr1 = inputStrArr[1]; return; } c# 端的內容如下: class Program { [DllImport("CPP.dll")] public static extern void func1(string inputStr); [DllImport("CPP.dll")] public static extern void func2(string [] inputStrArr); static void Main(string[] args) { string s0 = "中文chinese"; string s1 = "嗨123"; func1(s0); func1(s1); string[] strArr = new string[2]; strArr[0] = s0; strArr[1] = s1; func2(strArr); } } 說明: 我有2個函數 func1 可以傳入單一字串, func2 則可傳多個字串, 以字串陣列的方式傳給 c++ 現在, 我有2個字串, s0 和 s1. 都含中文字符 首先, call func1 兩次, 分別傳入 s0 和 s1 自 c++ 端 c++ 端看到的字串內容正確, 字尾沒有少算. 接著, call func2 , 把 s0 和 s1 包成 strArr 傳入 c++ 端 在傳入前, 有在 c# 端檢查 strArr, 字串內容正確 但是傳入 c++端後, 字串內容異常 inputStr0 = "中文chine" inputStr1 = "嗨12" 我一直搞不懂的地方是, 為什麼用 func1 的時候, c++ 端看到的中文字串長度不會被少算??? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.163.216.67 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Sharp/M.1589007635.A.358.html

05/09 16:02, 3年前 , 1F
因為 compiler 大概有幫你 Marshal 做好
05/09 16:02, 1F

05/09 16:03, 3年前 , 2F
c# string 用的是 UTF-16, 對應 c++ 要用 wchar_t
05/09 16:03, 2F

05/09 16:04, 3年前 , 3F
或是 LPWSTR
05/09 16:04, 3F

05/09 16:06, 3年前 , 4F
另外 char* 要判斷長度得在字尾加上 '\0'
05/09 16:06, 4F

05/09 16:07, 3年前 , 5F
是 string[] 的話大概 runtime 也沒幫你加上吧
05/09 16:07, 5F

05/09 16:07, 3年前 , 6F
或是直接當作是 ansi 來做長度判斷了
05/09 16:07, 6F

05/09 16:10, 3年前 , 7F
要轉型過去請自己 Marshal 好, 或是一律轉長寬字元
05/09 16:10, 7F
感謝你的回答, 關於 func1的問題, 我查了一下字串的預設封送處理 如果沒有寫 MarshalAs. 則默認值為 UnmanagedType.LPStr 其描述為“ANSI 字元之 Null 終端陣列的指標” 我的理解是, 他會把 c# 字串以 ANSI 解讀, 並找到字尾符號, 我的 c++ 端用 char* 接收, 恰好沒問題 不過, func2 也沒寫 MarshalAs 在 c++ 端得到的字串, 我用 memory 去看長這樣 inputStr0 = 中文chine.e inputStr1 = 嗨12. 其中 . 代表句尾符號 我在想他是不是像 func1 一樣, array 中每個 string 都 被默認當成 ANSI 解讀, 且無遺漏複製給 c++ 只是他會多做一件事, 在 c# string 原始長度的下一個位置改成字尾符號 例如, 原本 "中文chinese" 在 c# 長度為 9 可是他用 ANSI 解讀需要長度 11 才能描述 所以 c++ 的 char* 用長度 11 去裝他 但是在 c# string 原始長度 9 的下一個位置 10 會被改成字尾符號 所以 c++ 的 memory 才會看到 "中文chine.e" 不知道是不是這樣解釋? 另外, 確實寫好 MarshalAs 且 c++ 用 wchar 去接, 就沒問題. ※ 編輯: tw30912 (1.163.216.67 臺灣), 05/09/2020 18:20:09

05/09 19:02, 3年前 , 8F
大致上沒有錯 基本上我會使用清楚的寫法
05/09 19:02, 8F

05/09 19:02, 3年前 , 9F
依靠 compiler 預設行為的語法我會盡量避免
05/09 19:02, 9F

05/09 19:04, 3年前 , 10F
Unmanaged / managed code 的轉換很多得靠自己
05/09 19:04, 10F

05/09 19:05, 3年前 , 11F
不然程式怎麼 crash 都不知道, 會很慘烈..
05/09 19:05, 11F
文章代碼(AID): #1UjbKJDO (C_Sharp)
文章代碼(AID): #1UjbKJDO (C_Sharp)