Re: [心得] A11 vs S845優劣分析
看板MobileComm (行動通訊)作者kkcity59 (kkcity)時間7年前 (2018/09/16 06:13)推噓19(20推 1噓 13→)留言34則, 24人參與討論串4/7 (看更多)
※ 引述《ja9740807 (finallydream)》之銘言:
: 基本上 這兩個處理器 並不存在絕對的好與壞
: 至於效能過剩這說法 我是覺得挺可笑的
: 先說走向 以走向來說
: https://imgur.com/2rnuC03

: 對於S845來說 遵循著公版A75架構
: https://imgur.com/7utChXw

: 是一個三發射端的架構
: 而相較於A11 是個六發射端
: 光前面發射端的數據量就有著好幾倍的提升
: 核心面積也大了不少
: 等同於 A11在CPU輾壓S845這點是肯定的
其實依照您這張圖
https://imgur.com/7utChXw

有網友說的"發射端"是issue Queues
其實這很怪....因為S845很明確存在七個
https://imgur.com/8NhL72Y

圖上面也是
這是小弟為何一直對發射端搞得很迷糊的原因
經過您的解釋
就是特別指出decode之後
進去int跟load/store單元的部分才算
https://imgur.com/WeouOC3

這就完全沒去看看FPU跟Branch捷徑的部分
https://imgur.com/DnNdT9W

其實圖看起來decode不很像是會變成瓶頸
arm的risc指令會分解成兩個micro op
對應兩個整數/兩個load/store單元來說其實挺合理的
直接加寬它似乎沒有明顯好處
A11我真的查不太到他的資料
但是如果它有比較多的int跟load/store單元
會把這邊加寬是合理的,效能也確實可以提升
但我就是沒資料,也不確定您的"六個"指的是什麼?
唯一找到有點相關的是A7的資料
https://imgur.com/b620GS7


: 單核心效能隨便都是4000起跳
: https://imgur.com/Pvsl0mz

: 至於S845 單核效能在2000上下
我對Geekbench仍然是持保留態度
我覺得她受快取大小影響太大
它的成績我就是覺得怪
: 接近兩倍也證明了流水線長度和發射端造成的效能差異
^^^^^^^^^^^^^^^^^^^^^^^^^^^
: 疊大核心 優點就是效能可以撐得上去
: (說實話 會有人說Geekbench捏造跑分還挺好笑的)
: 但難道沒有缺點嗎? 疊大核心這條路是正確的嗎?
: https://imgur.com/I9aCDh9

: 由於發射端和流水線大幅上升
^^^^^^^^^^^^^^^
流水線越深效能會被拉得比較低
但時脈可以拉得比較高,權衡下沒有越深就一定比較好
流水線設計深度在Pentium4到達頂峰後,應該就是一路下降
現在又開始因為製程提升開始拉回去
我不知道A11跟S845誰的流水線比較深
但是依照最高時脈來看很我猜可能是S845比較深
: 功耗也相對會大幅提升
: 對電池造成的壓力並不小
: 這也是蘋果為何會需要降頻iphone的原因
: 如果不降頻 對電池壓力太大 很容易會出現自動關機的情況
: 再來就是發熱也會相對應的提升
: 所以最好的解決方法 就是疊小核心了嗎?
: 我認為這答案可以對也可以不對
這答案太難了....需要很多強大的工程師反覆設計測試
其實我用用戶心態直接看結果會於快很多
: 以崩壞3為例子
: https://imgur.com/qPApQAl



: 照理來說 S845在GPU上佔優勢
: 就算撇開常講的安卓優化
: 照理來說 擁有12核GPU的A10X
: 也應該贏A11的 怎麼回事呢?
: 因為崩壞3是屬於吃CPU的遊戲
: 遊戲理想的情況下 是將所有高度化並列的浮點
^^^^^^^^^^^^^^^^
: 全交由GPU來做運算
^^^^^^^^^^^^^^^^^
好怪....既然高度並列化就交給Neon去做了吧
一般看法是這樣啦。當然這也有一些討論。
就是既然我們有GPGPU為何還需要SIMD?這裡可以看看
https://stackoverflow.com/questions/25630209/why-use-simd-if-we-have-gpgpu
可是你會設計成SIMD本來就是要餵給Neon,自然就不會丟給GPU來做
如果你要去餵給GPGPU,那一開始就根本不用在意高度並列化這件事情了
: 但是事實總不可能這麼美好
: 這也是CPU為何需要保留整數和浮點的原因
GPU做到FP16/FP32(Adreno我記得一律是FP32)
但是Neon可以做到FP64/FP128甚至現在可能制訂的更高了
: 也就代表 遊戲會因為遊戲引擎的關係
: 還有整體特效的使用量 來影響到核心的壓力大小
: 於是 理當單核效能最強的A11自然輾壓其他核心
: 就算GPU不強 還是可以靠單核撐上來
: 對於傳說對決這種遊戲
: 基本上你讓他吃個A11的單核
其實A11我讀過的資料真的非常少,Apple保密到家
他到底是怎麼回事我其實不曉得都是猜測或結果論
: 就算不用S660多線呈優化 照樣能輾壓S845
: 原因就在這 反過來說 高通家的核心 就需要多核平均負載
: CPU弱就真的沒用嗎?
: 首先 以使用者體驗來說 我認為不疊CPU才是最優秀的
: 使用者最害怕的就是大功耗所帶來的耗電和摸起來燙
: https://imgur.com/7U1AeGv

: 以S835來說 第一個感覺就是涼快 舒適
: 因為他的大核心 就算是燒mix 2
: 最多也才1.7W
: https://imgur.com/ORur00e

: 反過來說 當時的A10處理器
: 耗電居然高達3.2W
: 單核差了兩倍 自然摸起來的溫度和耗電
: 總是不是那麼舒適些
: 疊大核又覺得熱 小核效能又不行
: 到底怎搞才行?
: 這當然是要請出Vulkan
: 他就是拯救這兩難情況的救星
: https://imgur.com/C1pB8Pj

: 這是OpenGL上的情況
: 可以看到 單核負載98%
: 其他核心都在休眠甚至只有少部分線程
: https://imgur.com/3MvsV8W

: Vulkan就是這麼神奇 全核心平均負載的處理工作
: https://imgur.com/3algA4O

: 而A73效能是A53的2.5倍 但耗電量卻是6倍
: 這更凸顯了小核心的能耗性價比
: 可以這麼說 A73甚至A11這種大核心
: (我認為真正理想的狀況 應該是丟滿8顆A55在配上Vulkan 就像S625一樣舒適)
: 都是因為多核優化不好 所以才會出現的東西
: 當然 多核優化並不是這麼簡單的任務
: 所以 如果玩的遊戲還是比較吃核心效能的
: 建議還是選擇A11吧
: 難道S845完全不佔優勢嗎?
: https://imgur.com/ZPM7qsL

: 以3Dmark來說 高通S845的GPU是輾壓著A11的
: https://imgur.com/6u3u62q

: 功耗和面積也是 這點不得不佩服高通
: 對於有Vulkan和吃重GPU的遊戲
: S845就有個明顯的優勢
: 例如王者榮耀 以及用虛幻4寫出來的刺激戰場
: 都是S845有利的優勢
: 所以遊戲A11優化輾壓 並不存在
: 我並不認為遊戲差 是安卓優化差
: 而是本身硬件的能力並沒有跟上
: 如果以S845來說 看起來很像i3+1080
: A11配置相對是i7+1060
: 平均的多 那為何高通不一舉疊上單核呢?
: 功耗爆炸的情況 在A11上的Iphone X
: 已經不太行了 更何況是還要應付安卓的後台機制
: 直接暴力的上去肯定是不行的
: 於是高通跟著ARM 慢慢加流水線和發射端
: 讓體驗不至於瞬間回到S810火龍
: 也能穩定的跟上效能 A76就是個明顯的例子
: 所以簡單分析來說
: A系列處理器 走的是效能的極致
: S系列處理器 走的是耗電和效能的平衡
: 從S820過後 高通開始更注重溫度的體驗
: 這也跟目前的NVIDIA走向是相同的
: 在減少功耗的情況下增加效能
: 再來就是常常有人說IOS萬年3G穩定夠用
: 這句話 以日常使用的角度來說是沒問題的
: https://imgur.com/WvkKyHe

: 以刺激戰場來說 這種物件多的遊戲
: 對於RAM的壓力就很大了
: 無論是速度亦或是大小
: 在電腦端也是如此
: https://imgur.com/B6OBoPn

: 內存不夠塞物件的解決法
: 講好聽點叫做優化
: 難聽點叫做降低材質
: 我個人認為 蘋果和安卓 並不存在著什麼遊戲優化輾壓
: 而是要看他們各自的長處 來決定誰在什麼情況下表現更好
: 優化佔的只是少數 更多還是本身的能力造成的影響
: 至於Exynos和麒麟我就不提了
: 全方位輸給這兩款處理器 也沒什麼可比性
: 至於調度方面 我還是比較看好高通DynamIQ的
: https://imgur.com/389nHKK

: 蘋果採用的big.LITTLE在調度層面 我覺得還是有點差距
: 處理器的調度問題 影響挺嚴重的
: 這問題下次再談
感謝您費心找了這麼多實測
既然是實測應該是最能反映實際應用狀況
對使用者來說也才是最直接的體驗
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.204.180
※ 文章網址: https://www.ptt.cc/bbs/MobileComm/M.1537049629.A.62D.html
推
09/16 06:56,
7年前
, 1F
09/16 06:56, 1F
噓
09/16 07:15,
7年前
, 2F
09/16 07:15, 2F
→
09/16 07:50,
7年前
, 3F
09/16 07:50, 3F
推
09/16 07:56,
7年前
, 4F
09/16 07:56, 4F
→
09/16 07:59,
7年前
, 5F
09/16 07:59, 5F
推
09/16 08:02,
7年前
, 6F
09/16 08:02, 6F
推
09/16 08:04,
7年前
, 7F
09/16 08:04, 7F
推
09/16 08:20,
7年前
, 8F
09/16 08:20, 8F
→
09/16 08:29,
7年前
, 9F
09/16 08:29, 9F
推
09/16 08:31,
7年前
, 10F
09/16 08:31, 10F
推
09/16 09:14,
7年前
, 11F
09/16 09:14, 11F
→
09/16 09:14,
7年前
, 12F
09/16 09:14, 12F
推
09/16 10:24,
7年前
, 13F
09/16 10:24, 13F
→
09/16 11:06,
7年前
, 14F
09/16 11:06, 14F
推
09/16 11:11,
7年前
, 15F
09/16 11:11, 15F
推
09/16 11:33,
7年前
, 16F
09/16 11:33, 16F
推
09/16 11:46,
7年前
, 17F
09/16 11:46, 17F
推
09/16 11:47,
7年前
, 18F
09/16 11:47, 18F
推
09/16 12:14,
7年前
, 19F
09/16 12:14, 19F
其實我也是對原PO一些說詞感到不解所以回文的....
我並沒有找到什麼關於A11的結構或者強大的解說架構或答案
所以又回到我常講的那句....
Apple A10/A11的"超級強大"幾乎全建立在Geekbench上
不是說A11不強。但是那個強度是不是有像是Geekbench那麼誇張??
我貼這張圖來表示Geekbench是不是真的存在些問題??
https://imgur.com/Q87f7fu

然後回到樓主說"發射端去對應的處理單元是三個或六個"
因為A11有六個所以效能自然比S845強大
可是Intel這種cisc架構拆回risc-op後處理的單元都是幾十個
而Instruction Queue也是20/40個(因為單一cycle可做兩次)
遠大於三個或六個七個十幾個,把risc或cisc混在一起是嫌粗糙
可是micro op或risc op其實是很相似的東西
所以這也點出了一個荒謬性的問題
如果Geekbench展現出A10/A11的超級強大是因為decode或Quene
那照理來說Intel那些xxxx lake就應該更是要超級強大
他比起這些risc cpu完全有數量級的差別
※ 編輯: kkcity59 (61.230.138.169), 09/16/2018 13:27:25
推
09/16 12:58,
7年前
, 20F
09/16 12:58, 20F
推
09/16 13:02,
7年前
, 21F
09/16 13:02, 21F
推
09/16 13:57,
7年前
, 22F
09/16 13:57, 22F
→
09/16 14:32,
7年前
, 23F
09/16 14:32, 23F
GB不提供Source code
他們的論壇有人去要過說買專業版是否可給
但是是不行的
→
09/16 14:32,
7年前
, 24F
09/16 14:32, 24F
→
09/16 14:32,
7年前
, 25F
09/16 14:32, 25F
hardcode?您是指microcode?
即使cisc的x86實際運作都是micro op或risp op了(十幾年前就這樣了)
本來就是 RISC-like microcode的架構
也就是cisc/risc的分野已經不這麼明顯了
這也是上面我說為什麼X86的decode或Queue會大那麼多的原因之一
因為它產生的micro op也是比較龐大
→
09/16 14:32,
7年前
, 26F
09/16 14:32, 26F
→
09/16 14:32,
7年前
, 27F
09/16 14:32, 27F
→
09/16 14:32,
7年前
, 28F
09/16 14:32, 28F
→
09/16 14:32,
7年前
, 29F
09/16 14:32, 29F
這範疇太大了,我們看不到的地方也太多了
您是原PO另外的帳號嗎?(從ip address跟標點風格猜測)
※ 編輯: kkcity59 (61.230.138.169), 09/16/2018 15:30:52
推
09/16 15:38,
7年前
, 30F
09/16 15:38, 30F
推
09/16 15:57,
7年前
, 31F
09/16 15:57, 31F
推
09/16 16:02,
7年前
, 32F
09/16 16:02, 32F
→
09/16 17:40,
7年前
, 33F
09/16 17:40, 33F
※ 編輯: kkcity59 (61.230.203.27), 09/17/2018 11:50:19
推
09/19 08:49,
7年前
, 34F
09/19 08:49, 34F
討論串 (同標題文章)
MobileComm 近期熱門文章
PTT數位生活區 即時熱門文章