İhtilalin eşiğindeyiz: Meta’nın yapay zekası insanları kandırarak oyunu kazanıyor

XeaeX · 24 Kas 2022

Meta AI, stratejik masa oyunu Diplomacy’de insan düzeyinde performans elde eden birinci yapay zeka olduğunu tez ettiği Cicero‘nun geliştirildiğini duyurdu. Temelinde bu kayda bedel ve üstünde durulması gereken bir muvaffakiyet çünkü Diplomacy, başka oyunlar üzere yüzeysel değil derin, kişilerarası irtibat hünerleri gerektiriyor.

Deep Blue, 1997’de satrançta Garry Kasparov’u yenmedilk evvel bile, masa oyunları yapay zekaların muvaffakiyetlerinin temel bir ölçüsüydü. 2015’te AlphaGo, Go ustası Lee Sedol’u yendiğinde öteki bir mahzur daha aşılmıştı. Bu oyunların her ikisi de nispeten net bir analitik kurallar dizisine sahip ve mümkünlük temelli yaklaşımlar, bu oyunların temelinde yatıyor.

Cicero, Diplomacy’de insan düzeyinde performans sergiliyor

Lakin Diplomacy oyununda ise oyunun temel zorlayıcı kısmı gelişmiş toplumsal marifet yetenekleri talep etmesi. Oyuncular kazanmak için empati göstermeli, doğal bir lisan kullanmalı ve ilişkiler kurarak ilerlemeli. Bunu akılda tutarak Meta, “İnsanların yaptığına misal stratejik maksatlara ulaşmak için beşerlerle irtibat kurarak ikna etmek ve onlarla bir arada çalışmak için lisanı kullanabilen daha tesirli ve esnek ortacılar oluşturabilir miyiz?” diye sordu. Meta’ya bakılırsa yanıt evet.

Geliştirilen Cicero yapay zekası, webDiplomacy.net‘te Diplomacy’nin çevrimiçi bir sürümünü oynayarak eğitildi. Cicerbu biçimde içerisinde oyunda ustalaşarak insan oyuncuların “ortalama puanının iki katından fazlasını” elde etmeyi başardı.

Meta, Cicero’yu oluşturmak için stratejik akıl yürütme (AlphaGo’ya benzer) ve doğal lisan işleme (GPT-3’e benzer) için yapay zeka modellerini bir ortaya getirdi ve bunları tek bir aracıda topladı. Her oyun sırasında Cicero, oyun tahtasının durumunu, sohbet geçmişlerini ve öbür oyuncuların nasıl davranacağını tahlil ederek ilerliyor. Cicero insan gibisi diyaloglar oluşturabildiği için öbür oyuncularla koordineli bir biçimde çalışabilir ve planını uyguluyor.

Meta, Cicero’nun doğal lisan hünerlerini, “kontrol edilebilir bir diyalog modeli” olarak tanımlıyor. GPT-3 üzere, Cicero da web’den elde edilen kütüphaneleri kullanıyor. Meta, Cicero’nun eğitimine 2,7 milyar parametreli BART gibisi bir lisan modeliyle başladıklarını da belirtiyor.

Cicero, strateji ortasında strateji geliştiriyor

Meta araştırmacılarının belirttiği üzere Cicero’nun yetenekleri ve stratejileri çok ayrıntılı. Aktarılanlara nazaran Cicero, oyunun ilerleyen kısımlarında makul bir oyuncunun takviyesine gereksinim duyacağını anlayabiliyor ve o kişinin gözüne girmek için başka bir strateji oluşturuyor. Hatta o oyuncunun karşılaşabileceği riskleri ve fırsatları da fark edip konum alabiliyor.

Cicero’nun geleceği âlâ de olabilir makus de

Daha geniş uygulamalara gelince, Meta, Cicero araştırmasının beşerler içindeki “iletişim manilerini hafifçeletebileceğini” öne sürüyor. Yahut eğitim alanlarında hatta oyunlardaki daha gerçekçi NPC’ler için kullanılabileceği belirtiliyor. Bu sayede oyuncunun motivasyonuna ahenk sağlanabilir.

hem de bu teknoloji, insanları manipüle etmek için kullanılabilir. Bu doğrultuda Meta, başka araştırmacıların kendi kodunu “sorumlu bir biçimde” oluşturabileceklerini umuyor ve “bu yeni alandaki zehirli mesajları” tespit etmek ve kaldırmak için adımlar attığını söylüyor. Meta’nın buradaki “adımlar”dan kastı muhtemelen internet metinlerinden öğrenilen diyaloglar. Büyük lisan modellerini internet bilgi tabanıyla oluşturmak bu üzere olumsuz riskleri içeriyor. Son olarak Meta’nın Cicero’nun nasıl çalıştığını açıklamak için bir web sitesi yayına aldı ve ayrıyeten Cicero’nun kodunu GitHub‘da açık kaynaklı hale getirdi.

İhtilalin eşiğindeyiz: Meta’nın yapay zekası insanları kandırarak oyunu kazanıyor

XeaeX

New member