Yapay Zeka Sosyal Medya Tartışmalarında İnsanları Taklit Etmekte Zorlanıyor

Yeni yayımlanan bir araştırma, yapay zekâ sistemlerinin sosyal medyada insan tartışmalarını taklit etmede oldukça başarısız olduğunu ortaya koydu. İsviçre, Hollanda ve ABD’den araştırmacıların yürüttüğü çalışma, yapay zekâ tarafından oluşturulan gönderilerin insan kullanıcılar tarafından yazılanlardan kolayca ayırt edilebildiğini gösterdi.

Araştırma Yapay Zekânın Tartışmalarda Zayıf Kaldığını Gösterdi

Araştırmacılar X (eski adıyla Twitter), Reddit ve Bluesky platformlarında yapılan paylaşımları analiz ederek “hesaplamalı Turing testi” adı verilen bir yöntem uyguladı. DeepSeek ve Qwen gibi açık kaynaklı büyük dil modellerinin ürettiği paylaşımlar üzerinde yapılan testte, gönderilerin yüzde 70 ila 80 oranında yapay zekâ tarafından yazıldığı anlaşılabildi.

Uzmanlar, bu oranın tesadüfün çok üzerinde olduğunu belirtti. Araştırmacılar, yapay zekâ sistemlerinin duygusal tonlamayı ve insanın tartışma anındaki öfke ya da alay gibi duygularını taklit edemediğini vurguladı.

Araştırma ekibinin bulgularına göre büyük dil modelleri, dilbilgisel açıdan tutarlı metinler üretebilse de insana özgü duygusal tonu ve duyarlılığı otantik şekilde yansıtmakta yetersiz kalıyor. Yayımlanan raporda, “Yoğun kalibrasyon çalışmalarına rağmen üretilen içerikler, duygusal ifade doğallığı açısından insan üretimi metinlerden belirgin şekilde ayrışıyor” tespitine yer verildi.

İlginç bir şekilde, model ölçeğinin artırılması bu sorunu çözemedi. Araştırmada, 70 milyar parametre büyüklüğündeki Llama-3.1 modelinin duygusal ifade kalitesi açısından daha küçük modellerle benzer, hatta bazı test senaryolarında onlardan daha zayıf performans sergilediği gözlemlendi.

Çalışma, yapay zekâ destekli içeriklerin sosyal medyada hızla arttığı bir dönemde yayımlandı. X, Facebook, Instagram ve Reddit gibi platformlarda, otomatik gönderiler paylaşan yapay hesapların sayısı her geçen gün yükseliyor. Bazı girişimler, reklam kampanyaları için yapay zekâ destekli hesaplar kiralamaya başladı. Doublespeed gibi şirketler, markalara yapay zekâ botlarından oluşan reklam ordusu hizmeti sunuyor.

Uzmanlar, araştırmanın sonuçlarını olumlu bir gelişme olarak değerlendiriyor. Buna göre, insanlar hâlâ yapay zekâ ile insan metinleri arasındaki farkı sezgisel olarak ayırt edebiliyor. Ancak araştırmacılar, bu farkın giderek daralabileceğini ve dijital platformlarda doğrulama yöntemlerinin önem kazandığını ifade etti.