[心得] x86的segment

看板ASM (組合語言)作者 (打卡上班的日子)時間16年前 (2008/05/10 05:46), 編輯推噓5(5012)
留言17則, 5人參與, 最新討論串1/1
學過system programming或OS的人都知道 一個program可以分成code(text)、data、stack以及heap(bss)這四個segment 對x86來說就是用cs、ds、ss、es、fs和gs來assign各個segment的start address 理論上這四個segments是可以透過segment register來分離memory space的 也就是說在VM的支援下這些segments都可以享有各自獨立且互不影響的4GB memory space 但是許多C/C++ compiler在實作上會利用stack來暫存function的local variables 這將會導致一個問題出現------ss和ds必須共用一個4GB的memory space 否則在傳遞call by reference的pointer過程中將會出現非常嚴重地邏輯錯誤 舉個例子來說 main() { func_1(); } void func_1() { int x = 1; func_2(&x); } void func_2(int *ptr) { *ptr = 10; } 正常來說這段程式在執行後func_1的x應該會等於10才對 假設今天ds、ss、bp和sp的值分別為 ds = 0x0000 ss = 0x1000 bp = 0x1000 sp = 0x1000 將這段程式用gcc compile之後會產生這樣的assembly code func_1: pushl %ebp movl %esp, %ebp subl $20, %esp // 清出20 bytes給local variables使用 // esp = 0x0fe0 movl $0, %eax movl $1, -4(%ebp) // 將x的值存放在stack(0x1000:0x0ffc)中 leal -4(%ebp), %eax // 將&x放入eax中 movl %eax, (%esp) // 將eax置入stack(0x1000:0x0fe0)中 call func_2 leave ret func_2: pushl %ebp movl %esp, %ebp leal 8(%ebp), %eax // 將ptr所指向的address放入eax中 // eax = 0x0ffc movl $10, (%eax) // 將10放入(%eax)裡 popl %ebp ret 問題就出現在紅色這一行instruction (%eax)在x86裡隱含的實際意義應該是%ds:(%eax)而非%ss:(%eax) 也就是說實際上程式是把10放到了0x0000:0x0ffc 但是x正確address的應該是在0x1000:0x0ffc 以上是最近一個月在寫一些low level的system program時遇到的問題 之前把ds和ss分開設在不同的地方 結果只要一遇到pointer的傳遞,程式執行的結果就會出錯 到最後才發現是因為GCC是利用stack來存放local variables造成的 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.59.105.115

05/10 07:44, , 1F
請問這是reasl mode,還是protected mode,看起來怪怪的
05/10 07:44, 1F
應該是protect mode和real mode都適用 只是我為了方便說明 所以ds和ss存的值不是用LDT或GDT來表示 而是直接用他們的segment start address 況且GCC好像也沒辦法編出real mode下16-bits的code ※ 編輯: SILee 來自: 61.59.105.115 (05/10 14:44)

05/10 22:37, , 2F
我感覺你的文章也有很嚴重的觀念錯誤
05/10 22:37, 2F

05/10 22:37, , 3F
segment 跟 section 是兩回事
05/10 22:37, 3F

05/10 22:39, , 4F
而且PM下 segment register 改成 selector 了
05/10 22:39, 4F

05/10 22:39, , 5F
不是"assign各個segment的start address"
05/10 22:39, 5F

05/10 22:41, , 6F
再來 你幹嘛亂設 ss 跟 ds?
05/10 22:41, 6F

05/10 22:41, , 7F
local var 放 stack 是標準做法 不然哪來的 enter/leave?
05/10 22:41, 7F

05/11 16:47, , 8F
如x=1宣告在main就是global變數,組語會帶入ds:offset嗎?
05/11 16:47, 8F

05/12 08:11, , 9F
感覺這code是從power on reset之後在組合語言階段進入
05/12 08:11, 9F

05/12 08:12, , 10F
protect mode,再由組合語言呼叫這些C function
05/12 08:12, 10F

05/12 08:13, , 11F
導致DS SS沒設好,也導致原PO對real mode,protect mode
05/12 08:13, 11F

05/12 08:14, , 12F
中,segment,section有些搞不清楚
05/12 08:14, 12F

05/12 13:09, , 13F
memory space應該用address space這專有名詞比較正確
05/12 13:09, 13F

05/12 13:09, , 14F
而且跟vm沒關係才對~那是X86的段機制
05/12 13:09, 14F

05/12 14:18, , 15F
就C言,func1的local變數值不該被外部變動,函數如公式不變
05/12 14:18, 15F

05/12 14:22, , 16F
global變數是各函數可共用的區域,才會使用pointer傳值.
05/12 14:22, 16F

05/31 11:08, , 17F
PM下segment好像在linear address上面 cs之類則selector
05/31 11:08, 17F
文章代碼(AID): #189COcAE (ASM)
文章代碼(AID): #189COcAE (ASM)