Yapay zekâ uzun süre dijital dünyada metin, görsel ve ses verileriyle beslenerek gelişti. Şimdi ise fiziksel dünyanın dinamiklerinden öğrenmeye başladı. Dünyanın farklı noktalarında toplanan görüntüler, robotların gerçek yaşam hareketlerini anlaması için yeni bir veri kaynağına dönüşüyor. Hindistan’dan ABD’ye kadar birçok merkezde çalışan binlerce kişi, yapay zekâ sistemlerinin fiziksel görevleri kavrayabilmesi için eğitim materyali oluşturuyor.
Şirketler Gerçek Dünya Verisiyle Robotları Geliştiriyor
Güney Hindistan’daki Karur kentinde yaşayan Naveen Kumar, gününü bilgisayar başında değil bir kamerayla başlıyor. Kumar, alnına taktığı GoPro ile havlu katlama gibi basit görünen el hareketlerini kaydediyor. Bu videolar sosyal medyada paylaşılmıyor. Görüntüler, veri etiketleme şirketi Objectways tarafından robotik sistemleri eğitmek için kullanılıyor. Şirketin 2 bini aşkın çalışanı, otonom araçlardan üretim robotlarına kadar birçok alanda sensör verilerini etiketliyor.
Her kayıt titizlikle inceleniyor. Yanlış yapılan her hareket veya eksik adım, videonun elenmesine yol açıyor. Ekipler her karedeki nesneleri tanımlıyor, hareketleri sınıflandırıyor. Bu detaylı etiketleme süreci, yapay zekâ algoritmalarına insan elinin basıncı ya da bir kolun hareket açısı gibi ince bilgileri öğretiyor.
San Francisco merkezli Encord’un kurucu ortağı Ulrik Stig Hansen’e göre fiziksel görevler için geliştirilen temel modeller, robotik alanda yeni bir dönemi başlattı. Encord, Objectways gibi şirketlerle birlikte insan hareketlerinden oluşan büyük veri setleri toplayarak Tesla, Nvidia, Boston Dynamics, Google ve OpenAI gibi teknoloji devlerine hizmet sağlıyor. Nvidia, insansı robot pazarının önümüzdeki on yıl içinde 38 milyar dolara ulaşabileceğini öngörüyor.
Bu süreçte yalnızca görüntü değil uzaktan yönlendirme teknolojileri de kullanılıyor. Micro1 kurucusu Ali Ansari, artık bir kıtadaki operatörlerin başka bir kıtadaki robotları kontrol edebildiğini belirtiyor. Doğu Avrupa’daki “kol çiftlikleri” olarak adlandırılan merkezlerde, yüzlerce kişi joystick’lerle robotlara görev yaptırıyor. Deepen AI kurucusu Mohammad Musa, gerçek görüntülerin sentetik verilerle birleştirildiği karma yöntemlerin giderek yaygınlaştığını aktarıyor.
Her ne kadar bazı uzmanlar uzaktan yönlendirilen robotların bağımsız çalışmada aynı başarıyı gösteremediğini düşünse de bu alandaki talep hızla artıyor. Micro1, Brezilya, Hindistan ve ABD gibi ülkelerde insanlara akıllı gözlük takarak gündelik hareketlerini kaydetmeleri için ödeme yapıyor. Figure AI ise bir milyar dolarlık yatırımla yüz bin evde insan davranışlarını kaydeden bir proje yürütüyor.
Meta destekli Scale AI, robotik eğitimi için yüz bin saati aşan görüntü topladı. Objectways ise son dönemde robot kollarının kutu taşıma ve tişört katlama görevlerini belgeleyen binlerce video üzerinde çalıştı. Şirket, robotların hatalı hareketlerini de analiz ederek her bir görevin daha doğru biçimde öğretilmesini sağladı.
Objectways ekibinde uzun süredir çalışan Kavin, robotların gelecekte insanın yaptığı birçok fiziksel işi devralacağını söylüyor. Bugün toplanan her görüntü, yarının otonom robotlarına temel oluşturuyor. Yapay zekâ artık yalnızca internetten değil, doğrudan insanın hareketlerinden öğreniyor.