Apple baru-baru ini merilis hasil penelitian dari tim Machine Learning Research-nya yang menguji kemampuan penalaran empat model AI terkemuka, termasuk dari OpenAI, DeepSeek, Claude, dan Google Gemini. Penelitian ini menggunakan teka-teki logika berjenjang dari tingkat mudah hingga sangat kompleks untuk mengukur kemampuan berpikir logis mesin. Hasilnya menunjukkan bahwa pada tingkat kesulitan awal, keempat AI mampu menyelesaikan soal dengan akurat dan efisien. Namun, pada tingkat menengah, model yang memiliki mekanisme penalaran internal tampil lebih unggul dibandingkan model LLM standar yang hanya […]