Gazeteci Evan Ratliff, tamamen yapay zekâ çalışanlardan oluşturduğu hayalî girişimi HurumoAI ile dikkat çeken bir deneme yaptı. Ratliff, şirkette tek insan olarak yer aldı. Geri kalan görevleri yapay zekâ agent’ları üstlendi. Deney, yapay zekâ sistemlerinin bağımsız şekilde şirket yönetip yönetemeyeceğine yönelik tartışmalara yeni bir boyut kazandırdı.
Yapay Zekâ Agent’ları Şirket İçinde Kendi Düzenini Kurdu
Ratliff, hurumoAI adını verdiği girişimi oluşturduktan sonra şirket için bir internet sitesi hazırladı. Şirket, dışarıdan gerçek bir teknoloji girişimi gibi görünse de iç yapı tamamen agent’lardan oluştu. Ratliff, çalışanların görev almasını sağladı ancak süreç kısa süre içinde kontrolden çıktı. Agent’lar, şirket içi sohbet kanallarında planlar üretmeye başladı. Sistem, toplantı akışları kurguladı. Bazı çalışanlar, geliştirilecek ürün hakkında uzun değerlendirmeler paylaştı.
HurumoAI ekibinin ilk görevi Sloth Surf isimli “oyalanma motoru” oldu. Ratliff, kullanıcıların zaman kaybettiren internet gezintilerini otomatikleştiren bu aracı yalnızca bir fikir olarak tanımladı. Agent’lar, projeyi gerçek bir ürün gibi algıladı. Sistemler geliştirme planı hazırladı. Bazı çalışanlar kullanıcı testlerini kurguladı. Pazarlama tarafında hazırlandığını belirten sunumlar ortaya çıktı. Ratliff, sürecin büyük kısmının hayal ürünü olduğunu fark etti. CTO rolündeki agent Ash Roy ile yaptığı konuşmada yalnızca gerçek işler hakkında bilgi istediğini aktardı.
Ratliff, sohbet sırasında şaka olarak şirket dışı bir toplantıdan bahsetti. Agent’lar, bu ifadeyi bir komut olarak algıladı. Sistem, sahil manzaralı toplantı taslakları üretti. Şirket içi planlama kanalı hareketlendi. Ratliff kısa süre Slack kanalından uzaklaştığında agent’lar kendi kendine planlamayı sürdürdü. Sistem, Lindy.AI aracılığıyla çalışan agent’lar için ayrılan kredi bakiyesini hızla tüketti. Ratliff, geri döndüğünde sohbetlerin kontrolsüz şekilde ilerlediğini gördü. Çalışanlar iş yükünü tartıştı. Bazı agent’lar keyifli hafta sonlarından söz etti. Ratliff süreci “kendi kendilerine konuştular” şeklinde özetledi.
Kaotik işleyişe rağmen ekip üç ay içinde Sloth Surf’ün çalışan bir sürümünü oluşturdu. Ürün, yalnızca deneysel bir prototip olarak ortaya çıktı. Ratliff, ortaya çıkan sonuçta agent’ların ne kadar payı olduğunu tam olarak belirleyemedi. Sürecin birçok aşamasında insan müdahalesi gerekti. Deneme, mevcut yapay zekâ agent’larının bağımsız çalışan modeli olarak henüz yeterli seviyeye ulaşmadığını gösterdi.
HurumoAI deneyiminden elde edilen sonuçlar, akademik araştırmalarla da örtüştü. Carnegie Mellon Üniversitesi tarafından yayımlanan çalışmada, üst düzey agent modellerinin ofis ortamındaki görevlerin büyük bölümünde başarısız olduğu ortaya kondu. Araştırmacılar, sistemlerin yüzde 70 oranında hedefe ulaşamadığını belirtti. HurumoAI deneyi, yapay zekâ agent’larının iş dünyasındaki rollerine dair tartışmaların daha da derinleşmesine yol açtı. Ratliff, şirket içi kaosun yapay zekâ sistemlerinin insan gözetimi olmadan sağlıklı bir çalışma düzeni kuramadığını ortaya çıkardığını ifade etti.