OpenAI ve DeepMind tarafından geliştirilen yapay zekâ modelleri, uluslararası alanda düzenlenen en prestijli kodlama yarışmalarından biri olan Uluslararası Üniversitelerarası Programlama Yarışması’nda (ICPC) ulaştıkları sonuçlarla gündeme geldi. Şirketlerin gerçekleştirdiği dahili testlerde, OpenAI’ın GPT-5 modeli birinciliği alabilecek seviyede performans sergilerken, DeepMind’ın Gemini 2.5 Deep Think sistemi ikinci sırada yer alabilecek sonuçlara ulaştı.
Yapay Zekâ Sistemleri Zorlu Görevleri Çözdü
ICPC, dünyanın en yetenekli yazılım geliştiricilerinin katıldığı ve kariyerlerine yön verdiği bir yarışma olarak öne çıkıyor. Üç kişilik öğrenci ekipleri beş saat içinde soyut düşünme, hızlı problem çözme ve hatasız kod yazma becerilerini göstermek zorunda kalıyor. Bu yıl en başarılı insan takımları on soruya çözüm getirebildi. OpenAI, GPT-5’in on iki sorunun tamamını çözdüğünü ve bunlardan on birini ilk denemede doğru yanıtladığını açıkladı. DeepMind’ın Gemini 2.5 modeli de öğrencilerin çözemediği bir görevi tamamlayarak yarışmada önemli bir başarı elde etti.
OpenAI, GPT-5’in yarışmadaki tüm görevleri üstlendiğini, yalnızca en karmaşık olan son sorunun ek bir deneysel akıl yürütme modeli ile çözüldüğünü belirtti. DeepMind ise farklı bir yaklaşım benimseyerek modeli pekiştirmeli öğrenme ile geliştirdi. Şirket, doğru sonuç üreten sistemi ödüllendiren bir yöntem kullanırken, matematik ve mantıksal düşünme üzerine yoğun çalışmalarla Gemini 2.5’i ileri seviyeye taşıdı. Bu sayede model, insan ekiplerinin tercih etmediği yeni çözüm yolları üreterek yarışmaya farklı bir katkı sundu.
Bilgisayar bilimleri uzmanları, yapay zekâ sistemlerinin ulaştığı bu seviyeyi önemli bir adım olarak gördü. Kaliforniya Üniversitesi Berkeley’den Jelani Nelson, insan desteği olmadan bu kadar yüksek performans elde edilmesinin şaşırtıcı olduğunu ifade etti. Nelson, birkaç yıl önce böyle bir seviyenin hayal bile edilemeyeceğini söyledi. Ancak uzmanlar, yarışma ortamındaki hız ve baskı faktörlerinin gerçek dünyadaki yazılım projeleriyle aynı olmadığını hatırlattı. Oxford Üniversitesi’nden Bartek Klin, uzun vadeli mühendislik çalışmalarında ekip stratejilerinin belirleyici rol oynadığını ve bunun yapay zekâ için ayrı bir sınav olacağını vurguladı.
OpenAI ve DeepMind, yarışmada elde edilen başarıların yalnızca başlangıç olduğunu belirtiyor. Şirketlere göre, gelişmiş matematiksel akıl yürütme ve programlama kabiliyetleri ilaç geliştirme, yarı iletken tasarımı ve mühendislik gibi alanlarda önemli katkılar sunacak. DeepMind’ın araştırma direktörü Heng-Tze Cheng, programlama yarışmalarını “en üst düzey düşünme oyunu” olarak nitelendirdi ve bu yeteneklerin bilimsel ilerlemelere ivme kazandırabileceğini söyledi.