Yapay zekâ en zor matematik sınavından nasıl sonuç aldı? “First Proof” sonuçları tartışma yarattı

11 üst düzey matematikçi, yapay zekâya bir haftada çözmesi için 10 özgün lemma verdi. OpenAI dahil birçok ekip denedi. İşte “First Proof” meydan okumasının dikkat çeken ayrıntıları.

Matematikçiler, yapay zekânın matematikte ne kadar ilerleme kaydedebileceğini anlamak için “First Proof” adlı bir meydan okuma başlattı. 11 seçkin matematikçi tarafından başlatılan bu test, Sevgililer Günü sabahında sonuçlandı. Yapılan testlerde, hiçbir büyük dil modelinin tüm soruları çözme başarısı gösteremedi. First Proof ekibi, yapay zekâlar için büyük potansiyel taşıyan 10 “lemma” (ara teorem) sundu. Ancak bazı sorunların yalnızca standart tekniklerle çözülemeyeceği ortaya çıktı. Yarışmada ortaya çıkan sonuçlar, yapay zekânın matematikte sınırlarını ve insan katkısının önemini gösterdi.

Yapay zekâların ürettiği ispatlar incelendiğinde, bazılarının doğru olmadığı ortaya çıktı. Bunlar arasında daha önce mevcut olan ispatların kopyalanması ve bazı çözüm boşlukları bulunmaktaydı. Ayrıca, üretilen ispatların üslubu, 19. yüzyıl matematiğine daha yakın görünüyordu. Görünüşe göre, yapay zekâlar hatalı ispatlar üretirken, insan katkısı olmadan gerçekçi bir çözüm bulmak zor olabiliyor.

Matematikçiler, gelecekte daha sıkı kurallara sahip ikinci bir tur düzenlemeyi planlıyor. First Proof ekibi, yapay zekânın matematikteki ilerlemesini test etmeye devam edecek ve sonuçları paylaşmaya devam edecek. Öte yandan, yapay zekânın matematik alanında önemli ilerlemeler kaydettiği kabul ediliyor, ancak bazıları bu başarıları sorguluyor ve geleneksel matematikçilikten uzaklaşmanın tehlikeli olabileceğini düşünüyor.