Fw: [心得] 蘋果揭露人工智能並不思考

看板MobileComm (行動通訊)作者Kai877 (金炆炡的狗)時間10月前 (2025/06/16 12:48)推噓16(28推 12噓 39→)

留言79則, 59人參與討論串1/1

※ [本文轉錄自 Stock 看板 #1eJk0_y9 ] 作者: huabandd (我是阿肥巴你頭) 看板: Stock 標題: [心得] 蘋果揭露人工智能並不思考時間: Sun Jun 15 23:01:12 2025 https://is.gd/U7lWC8 看到一個影片，非新聞報導，僅創作者想法討論蘋果揭露關於人工智能當中的最大謊言之前也看過一個影片指出 AI無法產出指針在10:10以外的手錶（網路手錶圖片通常指針停留在10:10）自己嘗試過幾次確實是這樣因為AI的訓練是基於現有大量資料去產生一個與大量資料相似的產物給你無法產生未曾有過資料的產物（以上為個人猜測，若錯誤請指正）雖然現在已有研究嘗試將AI接入人類神經元未來思考的方式有可能因此改變不再只是記憶，而是真正的推理（但是這好像也是一件滿恐怖的事情？）如果說給AI一個圍棋組，但不教他玩法也不讓他參考棋類玩法，讓他自行摸索就像嬰兒拿到玩具後自己亂玩那樣 AI能夠自行生成玩法是不是就算是成功？中文翻譯蘋果剛剛揭露了人工智慧中最大的謊言，即「思考」的假象，證明了像 Claude、Deepseek- R1 和 OpenAI 的 o3-mini 等推理模型實際上並不會思考。蘋果沒有重複使用舊有的數學問題，而是創造了這些模型從未見過全新謎題。結果令人震驚。對於簡單問題，標準 AI 模型表現優於昂貴的推理模型，同時消耗更少的資源。對於中等複雜度問題，推理模型顯示出一些優勢，但對於模擬現實世界情境的高複雜度問題，兩種類型的模型都崩潰到 0% 的準確度。這是確鑿的證據：蘋果給予 AI 模型逐步的演算法，就像給某人食譜一樣，但它們仍在相同的門檻下失敗了。這證明它們無法遵循邏輯指令。該研究沒有發現任何形式推理的證據，得出結論認為其行為最好用複雜的模式匹配來解釋。簡單地更改名稱和問題會顯著降低性能。蘋果測試了河內塔（Tower of Hanoi）謎題，模型在超過 100 步的移動中成功了，但在新穎的渡河謎題中僅僅 4 步後就失敗了。它們是記憶模式，而不是進行邏輯推理。隨著問題變得越來越難，「思考」模型使用的 token 越來越少，放棄得更快，而不是更深入地思考。即使無限的計算資源也無濟於事。這揭示了數十億美元的 AI 投資是建立在錯誤前提上的。公司將複雜的模式匹配宣傳為真正的推理，誤導消費者對 AI 能力的認知。我們離通用人工智慧（AGI）的距離並沒有大家想像的那麼近；我們正在處理的是非常複雜的自動完成系統。當先進的 AI 推理模型連遵循簡單指令都失敗時，我們是否正生活在一個建立在幻想之上的 AI 炒作泡沫中？英文原文 Apple just exposed the biggest lie in AI with the illusion of "thinking," provin g that reasoning models like Claude, Deepseek-R1, and OpenAI's o3-mini don't act ually think. Instead of recycling math problems, Apple created brand new puzzles these models had never seen. The results were shocking. For simple problems, standard AI models outperformed expensive reasoning models while using fewer resources. For medium complexity, reasoning models showed some advantage, but for high complexity problems that mirror real-world scenarios, b oth types collapsed to 0% accuracy. Here's the damning evidence: Apple gave AI models step-by-step algorithms, like giving someone a recipe, and they still failed at the same thresholds. This prov es they can't follow logical instructions. The study found no evidence of formal reasoning, concluding behavior is better explained by sophisticated pattern mat ching. Simply changing names and problems degraded performance dramatically. Apple test ed Tower of Hanoi puzzles, where models succeeded with 100-plus moves but failed at novel river crossing puzzles after just 4 moves. They memorized patterns rat her than reasoned logically. As problems got harder, "thinking" models used fewer tokens and gave up faster i nstead of thinking deeper. Even unlimited computational resources couldn't help. This exposes that billions in AI investment are based on false premises. Companies market sophisticated pattern matching as genuine reasoning, misleading consumers about AI capabilities. We are not as close to AGI as everyone thinks; we're dealing with very sophisticated autocomplete systems. When advanced AI re asoning models fail at following simple instructions, are we living in an AI hyp e bubble built on illusions? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: Kai877 (27.240.233.101 臺灣), 06/16/2025 12:48:36 ※ 編輯: Kai877 (27.240.233.101 臺灣), 06/16/2025 12:49:23

推

barkids

06/16 12:55, 10月前 , 1^F

06/16 12:55, 1^F

→

barkids

06/16 12:57, 10月前 , 2^F

06/16 12:57, 2^F

推

answer012103

06/16 13:17, 10月前 , 3^F

06/16 13:17, 3^F

推

s213092921

06/16 13:30, 10月前 , 4^F

06/16 13:30, 4^F

→

a27588679

06/16 13:35, 10月前 , 5^F

06/16 13:35, 5^F

推

keineAhnung

06/16 13:39, 10月前 , 6^F

06/16 13:39, 6^F

推

ncuephysics

06/16 13:40, 10月前 , 7^F

06/16 13:40, 7^F

推

foolwind

06/16 13:41, 10月前 , 8^F

06/16 13:41, 8^F

→

JuiFu617

06/16 13:43, 10月前 , 9^F

06/16 13:43, 9^F

→

JuiFu617

06/16 13:46, 10月前 , 10^F

06/16 13:46, 10^F

→

JuiFu617

06/16 13:48, 10月前 , 11^F

06/16 13:48, 11^F

→

nekoares

06/16 13:54, 10月前 , 12^F

06/16 13:54, 12^F

噓

astrofluket6

06/16 14:05, 10月前 , 13^F

06/16 14:05, 13^F

→

square4

06/16 14:10, 10月前 , 14^F

06/16 14:10, 14^F

→

square4

06/16 14:10, 10月前 , 15^F

06/16 14:10, 15^F

推

tetani

06/16 14:12, 10月前 , 16^F

06/16 14:12, 16^F

推

Wardyal

06/16 14:25, 10月前 , 17^F

06/16 14:25, 17^F

推

tktk1212

06/16 14:29, 10月前 , 18^F

06/16 14:29, 18^F

→

widec

06/16 14:30, 10月前 , 19^F

06/16 14:30, 19^F

→

widec

06/16 14:31, 10月前 , 20^F

06/16 14:31, 20^F

噓

MisterSmile

06/16 14:31, 10月前 , 21^F

06/16 14:31, 21^F

→

widec

06/16 14:32, 10月前 , 22^F

06/16 14:32, 22^F

→

widec

06/16 14:33, 10月前 , 23^F

06/16 14:33, 23^F

噓

cstease64

06/16 14:36, 10月前 , 24^F

06/16 14:36, 24^F

→

JuiFu617

06/16 15:04, 10月前 , 25^F

06/16 15:04, 25^F

→

Crios

06/16 15:11, 10月前 , 26^F

06/16 15:11, 26^F

推

graphict

06/16 15:20, 10月前 , 27^F

06/16 15:20, 27^F

推

maninpink

06/16 15:29, 10月前 , 28^F

06/16 15:29, 28^F

推

doom3

06/16 15:42, 10月前 , 29^F

06/16 15:42, 29^F

→

manbow77

06/16 15:45, 10月前 , 30^F

06/16 15:45, 30^F

→

eric78659

06/16 16:10, 10月前 , 31^F

06/16 16:10, 31^F

推

wujet09100

06/16 16:12, 10月前 , 32^F

06/16 16:12, 32^F

→

wujet09100

06/16 16:12, 10月前 , 33^F

06/16 16:12, 33^F

推

j0958322080

06/16 17:12, 10月前 , 34^F

06/16 17:12, 34^F

噓

piyopiyolee

06/16 17:23, 10月前 , 35^F

06/16 17:23, 35^F

噓

basacola

06/16 17:55, 10月前 , 36^F

06/16 17:55, 36^F

推

06/16 17:58, 10月前 , 37^F

06/16 17:58, 37^F

→

06/16 17:58, 10月前 , 38^F

06/16 17:58, 38^F

推

aasssdddd

06/16 18:11, 10月前 , 39^F

06/16 18:11, 39^F

→

alan3100

06/16 18:19, 10月前 , 40^F

06/16 18:19, 40^F

推

teasy

06/16 18:30, 10月前 , 41^F

06/16 18:30, 41^F

推

issemn

06/16 19:15, 10月前 , 42^F

06/16 19:15, 42^F

推

aotom

06/16 19:30, 10月前 , 43^F

06/16 19:30, 43^F

→

xixixxiixxii

06/16 19:31, 10月前 , 44^F

06/16 19:31, 44^F

推

f396761440

06/16 19:35, 10月前 , 45^F

06/16 19:35, 45^F

→

f396761440

06/16 19:35, 10月前 , 46^F

06/16 19:35, 46^F

噓

markmao

06/16 19:44, 10月前 , 47^F

06/16 19:44, 47^F

→

markmao

06/16 19:44, 10月前 , 48^F

06/16 19:44, 48^F

→

Numenor

06/16 21:47, 10月前 , 49^F

06/16 21:47, 49^F

→

Numenor

06/16 21:47, 10月前 , 50^F

06/16 21:47, 50^F

→

moon999tw

06/16 21:48, 10月前 , 51^F

06/16 21:48, 51^F

推

aikolove

06/16 21:53, 10月前 , 52^F

06/16 21:53, 52^F

→

A5Watamate

06/16 22:09, 10月前 , 53^F

06/16 22:09, 53^F

噓

DALLEN

06/16 22:22, 10月前 , 54^F

06/16 22:22, 54^F

→

d86123

06/16 22:39, 10月前 , 55^F

06/16 22:39, 55^F

→

d86123

06/16 22:39, 10月前 , 56^F

06/16 22:39, 56^F

→

xluds24805

06/16 22:52, 10月前 , 57^F

06/16 22:52, 57^F

→

xluds24805

06/16 22:52, 10月前 , 58^F

06/16 22:52, 58^F

→

xluds24805

06/16 22:52, 10月前 , 59^F

06/16 22:52, 59^F

推

GTR34

06/16 23:03, 10月前 , 60^F

06/16 23:03, 60^F

噓

ssshleo

06/16 23:05, 10月前 , 61^F

06/16 23:05, 61^F

推

tommy449

06/16 23:11, 10月前 , 62^F

06/16 23:11, 62^F

→

widec

06/17 08:26, 10月前 , 63^F

06/17 08:26, 63^F

噓

ian41360

06/17 08:51, 10月前 , 64^F

06/17 08:51, 64^F

噓

rz759

06/17 10:26, 10月前 , 65^F

06/17 10:26, 65^F

噓

dakkk

06/17 10:52, 10月前 , 66^F

06/17 10:52, 66^F

噓

n7555235

06/17 16:04, 10月前 , 67^F

06/17 16:04, 67^F

推

kimmj

06/17 16:48, 10月前 , 68^F

06/17 16:48, 68^F

→

kimmj

06/17 16:48, 10月前 , 69^F

06/17 16:48, 69^F

→

eemail

06/17 20:21, 10月前 , 70^F

06/17 20:21, 70^F

→

eemail

06/17 20:21, 10月前 , 71^F

06/17 20:21, 71^F

推

ffaatt

06/17 22:12, 10月前 , 72^F

06/17 22:12, 72^F

推

seemoon2000

06/18 10:21, 10月前 , 73^F

06/18 10:21, 73^F

→

seemoon2000

06/18 10:21, 10月前 , 74^F

06/18 10:21, 74^F

→

nrsair

06/18 10:49, 10月前 , 75^F

06/18 10:49, 75^F

→

Gundam77

06/18 12:39, 10月前 , 76^F

06/18 12:39, 76^F

推

cplusplus426

06/18 20:43, 10月前 , 77^F

06/18 20:43, 77^F

→

fjucharlie

06/19 14:40, 10月前 , 78^F

06/19 14:40, 78^F

推

sadsumo

06/21 03:39, 10月前 , 79^F

06/21 03:39, 79^F

‣ 返回看板[ MobileComm ] 資訊

‣ 更多 Kai877 的文章

文章代碼(AID): #1eJw8bnd (MobileComm)

MobileComm 近期熱門文章

[討論] 小米14更新可跟iPhone 互傳了

3小時前, 05/10

6小時前, 05/10

[問題] Razr 60 ultra 小尾巴突然不能使用

[ MobileComm ]

riz0523

7小時前, 05/09

[討論] Fotorgear 又推出一隻400mm Pro增距鏡

9小時前, 05/09

14小時前, 05/09

Re: [心得] 謝謝華碩，這十年多的感想

16小時前, 05/09

17小時前, 05/09

17小時前, 05/09

PTT數位生活區即時熱門文章

5小時前, 05/10

8小時前, 05/09

[開箱] 華碩x小島秀夫聯名周邊黑白金優雅配色

[ PC_Shopping ]

Ohmy

8小時前, 05/09

-5

[求救] 黃色小屋MacBook air 購買請益

9小時前, 05/09

13小時前, 05/09

[閒聊] 啊我的 X-T5...我的荼蘼 - 關箱心得

13小時前, 05/09

14小時前, 05/09

[問題]ipad pro螢幕破了,維修 or 買二手?

[ iOS ]

funkyafro13

14小時前, 05/09

更多即時熱門文章 >>

‣ 返回看板[ MobileComm ] 資訊

‣ 更多 Kai877 的文章

文章代碼(AID): #1eJw8bnd (MobileComm)