Büyük dil modellerinin matematiksel araştırma yapabilme yeteneklerini test etmeyi amaçlayan “First Proof” meydan okumasının sonuçları açıklandı. 11 seçkin matematikçi tarafından başlatılan testin sonuçları, Sevgililer Günü sabahında duyuruldu. Meydana 10 matematik problematikinin çözümüne odaklanan testte, hiçbir büyük dil modelinin tüm soruları çözemediği belirtildi. First Proof ekibi, yapay zekâların matematikte daha büyük sonuçlara ulaşmasını sağlayacak 10 “lemma” sunarak yarışmanın önemini vurguladı. Yapay zekânın sınırlarını ortaya koyan meydan okuma, matematik camiasında büyüyen yapay zekâ meraklılarının ilgisini çekti. Sonuçlar incelendiğinde, yapay zekânın ürettiği bazı ispatların doğru olmadığı ve insan katkısının önemi ortaya çıktı. First Proof ekibi, ikinci tur için daha sıkı kurallarla geri döneceklerini ve yapay zekânın matematik alanındaki gelişimini yakından takip edeceklerini belirtti.
Related Posts
Macron’dan Trump’a Putin Uyarısı
- İrem Sezgin
- 21 Şubat 2025
- 2 min read
Macron, canlı yayında Trump'a Putin'e karşı zayıf olunmaması gerektiğini vurguladı.
Football Manager 26 beğenilmedi!
- İrem Sezgin
- 6 Kasım 2025
- 2 min read
Football Manager 26, yoğun eleştiriye maruz kaldı. Bu durum, oyunun yapımcısına adeta şok yaşattı.
AYM, sokak hayvanları düzenlemesi kararının gerekçesini açıkladı
- İrem Sezgin
- 2 Aralık 2025
- 4 min read
Anayasa Mahkemesi (AYM), sokak hayvanları yasası ile ilgili iptal talebinin ret gerekçesi açıklandı.