#大型語言模型

無需外掛工具就能在國際數學奧林匹亞奪冠：Claude Opus 5 揭示的純粹推理極限

Anthropic 發布 Claude Opus 5，以單次推理模式在 IMO 2026 拿下滿分，揭示了大型語言模型在複雜邏輯推理上的非代理架構新路徑。
4 名大學生出題讓 AI 考了 0 分：一場揭穿「會說話不等於會思考」的壓力測試

4 名大學生出題讓主流 AI 模型繳出 0 分答卷，事件背後凸顯的是大型語言模型在多步推理、陷阱題與常識校驗上的根本限制，以及使用者該如何調整對 AI 的期待。
過程全錯但結果全對：當AI的「完美答案」建立在邏輯墳場之上

當AI給出完全正確的答案，其推論過程卻充滿邏輯謬誤與幻覺，這種黑箱現象正考驗著人類的信任底線。