Google DeepMind SIMA 2 İle Yapay Zekâda Yeni Bir Dönem Başlatıyor

Google’ın yapay zekâ araştırma şirketi DeepMind, yeni nesil SIMA 2 ajanının araştırma önizlemesini paylaştı. Gemini dil modelinin dil ve akıl yürütme gücünü entegre eden SIMA 2, sadece talimatları takip etmekten öteye geçerek çevresini anlama ve etkileşim kurma yeteneği kazandı. Bu gelişim, oyun dünyalarının ötesine uzanan genel amaçlı robotik sistemlere doğru önemli bir adım olarak değerlendiriliyor.

SIMA 2 Karmaşık Görevleri Başarıyla Tamamlıyor

Google’ın yapay zekâ ajanı SIMA, Mart 2024’teki ilk tanıtımında temel oyun içi komutları yerine getirebiliyordu, ancak karmaşık görevlerdeki %31’lik başarı oranı, insan kullanıcıların %71’lik performansının gerisinde kalıyordu. Yeni nesil SIMA 2 ise Gemini 2.5 Flash-Lite modeliyle güçlendirilmiş durumda. Güncellenen ajan, daha önce deneyimlemediği sanal ortamlarda bile karmaşık talimatları anlama ve uygulama yeteneği sergiliyor.

SIMA 2’nin en dikkat çeken özelliği, kendi deneyimlerinden öğrenerek performansını sürekli iyileştirebilmesi. Bu yetenek, onun sadece önceden eğitilmiş görevleri değil, dinamik ortamlarda yeni talimatları da yorumlayabilmesine olanak tanıyor.

DeepMind araştırmacıları, fiziksel ya da sanal bir ortamla beden aracılığıyla etkileşim kuran “embodied agent” yaklaşımının genel zekâ gelişimi için hayati olduğunu belirtiyor. SIMA 2, çevresini gözlemleyip eylemlerini planlayarak yüksek seviyeli akıl yürütmeyi simüle ediyor ve robotik sistemlerdeki olası kullanım alanlarına ışık tutuyor.

Araştırmacı Jane Wang, SIMA 2’nin yalnızca oyun oynamakla kalmayıp kullanıcı talimatlarını anlamak ve sağduyulu şekilde yanıt vermek için tasarlandığını ifade ediyor. Örneğin bir oyunda “olgun domates rengindeki eve git” talimatı verildiğinde SIMA 2 içsel mantık yürütme ile kırmızı evi tespit ediyor ve yöneliyor.

Google’ın SIMA 2 adlı yapay zekâ ajanı, “No Man’s Sky” oyunu üzerinde gerçekleştirilen testlerde dikkat çeken bir performans sergiledi. Ajan, sanal ortamı analiz ederek acil durum sinyallerini tanımladı ve bu verileri kullanarak sonraki eylemlerini planladı. Gemini modelinin doğal dil işleme yetenekleri sayesinde, kendi kendine yeni görevler oluşturabilen SIMA 2, yaptığı hatalardan öğrenerek performansını sürekli iyileştiriyor.

Sistemin eğitim süreci, insan oyuncu verileriyle başlatılsa da, ajan nihai yetkinliğine yeni ortamlarda edindiği kendi deneyimleriyle ulaşıyor. Bu özerk öğrenme yeteneği, SIMA 2’yi sadece önceden tanımlanmış görevleri değil, dinamik olarak ortaya çıkan durumları da yönetebilen bir ajan haline getiriyor.

DeepMind mühendisleri SIMA 2’nin yüksek seviyeli akıl yürütme yeteneklerinin gelecekte genel amaçlı robot sistemleri için temel oluşturduğunu belirtiyor. Sistem, nesneleri tanıma, planlama ve çok adımlı görevleri tamamlama konusunda temel davranışları simüle ediyor. Fiziksel robot sistemlerine entegrasyon için henüz net bir zaman çizelgesi paylaşılmadı.