4 名大學生出題讓主流 AI 模型繳出 0 分答卷,事件背後凸顯的是大型語言模型在多步推理、陷阱題與常識校驗上的根本限制,以及使用者該如何調整對 AI 的期待。
當AI給出完全正確的答案,其推論過程卻充滿邏輯謬誤與幻覺,這種黑箱現象正考驗著人類的信任底線。