OpenAI binlerce saatlik bilgiyi kullanarak Minecraft botunu muvaffakiyetle eğitti

XeaeX

New member
Minecraft, gelişmiş yapay zeka araştırmalarını destekleyebilecek düzeyde bir araç üzere görünmeyebilir. Lakin OpenAI’in son araştırmaları yapay zeka ile uygun eğitilmiş bir Minecraft botunun insanlardan daha başarılı olabileceğini gösteriyor.

OpenAI yapay zekaya (AI) ve insanlığa yarar sağlayan makine tahsili ilerlemelerine odaklanan bir şirket pozisyonunda. Son vakit içinderda firma, 70.000 saatten çok oyun görüntüsü kullanarak bir botu Minecraft oynamak için muvaffakiyetle eğittiğini duyurdu. Muvaffakiyet, oyun oynayan bir bottan fazlaca daha fazlasını, müşahede ve taklit temelli makine tahsilinde ileriye yanlışsız atılmış büyük bir adıma işaret ediyor.

Yapay zeka eğitimi için değerli gelişme

OpenAI’ın geliştirmiş olduğu botu, taklit edilmiş öğrenme ya da kontrollü öğrenmenin harikaya yakın bir örneği pozisyonunda. Maksada ulaşıldığında ödüllendirme vadeden pekiştirmeleri öğrenmenin tersine taklit edilmiş öğrenme, insanların makul nazaranvleri yerine getirmesini izleyerek gerçekleştiriliyor. Bu iki öğrenme taktiği biz beşerler için de geçerli. Bu durumda OpenAI, botlarına, tipik bir oyuncunun başarması için yaklaşık 24.000 ferdi aksiyon gerektirecek karmaşık oyun içi atılımları öğretmek için mevcut oyun görüntülerinden ve eğitimlerinden yararlandı.

Taklit edilmiş öğrenmenin en büyük eksiği kâfi bilgi kümesinin bulunup bulunmaması ve bu data kümelerinin kâfi kalitede olup olmamasıdır. Öte yandan eğitim sırasındaki girdilerin bağlamı ve kararınun ne olduğu etiketlenmelidir. ötürüsıyla bu yaklaşım biraz daha fazla emek istiyor fakat spesifik bir işte uzmanlaşmasını istediğimiz sistemler için bu alan çok kıymetli.

OpenAI ise üstte bahsetmiş olduğumiz manuel bilgi etiketleme süreçleriyle uğraşmak yerine mevcut etiketli görüntülerin sayısını artırmak için Görüntü Ön Eğitimi (VPT) olarak bilinen özel bir yaklaşım kullandı. Başlangıçta 2000 saatlik açıklamalı Minecraft oynanışıyla sistem eğitildi. Akabinde bu süreçte elde edilen bilgiler 70.000 saatlik daha evvel etiketlenmemiş Minecraft içeriğini etiketlemek için kullanıldı. ötürüsıyla bu süreç kararında Minecraft botuna incelemesi ve taklit etmesi için epeyce daha büyük bir data kümesi sağladı.
 
Üst