AI hatalarımızdan öğrenir ve onları işleyebilir

KodKralicesi

Global Mod
Global Mod
Bu, sistemlerin cevaplarının insan değerlendirmesinden öğrendikleri bir süreç olan insan geri bildirimlerinden (RLHF) takviye öğrenimi olarak bilinen şey budur. Ve Chatgpt veya Gemini gibi modellerin giderek daha kesin olmasına izin verse de, onları bu geri bildirimin kalitesine ve önyargılarına derinden bağımlı hale getirir.

Google'da çok platform direktörü Angela Sun, “Kullanıcının geri bildirimi Gemini'nin gelişiminde ana rol oynuyor.” Dedi.

Yönetici, her etkileşimin basit bir istemden bir yorum hatasına kadar önemli olduğunu vurguladı, her şeyin AI'nın davranışını iyileştirmeye ve daha hassas, erişilebilir ve kişisel hale getirmeye hizmet ettiğini vurguladı.

Google'ın multimodal modeli Gemini, metin, ses, resim ve videodan yanıtlar üretebilen evrensel bir asistan olacak ve bu da onu onunla etkileşime giren kullanıcıların bir uzantısı haline getirebilecek.

Ancak bu etkileşim de daha kişiseldir, bu da samimiyet yanılsamasına yol açar. Bazı durumlarda, kullanıcılar hassas bilgileri paylaşırlar, sistemin üzerinde bellek ve hatta proje duyguları olduğunu varsayarlar.

Mozilla Vakfı tarafından AI platformlarında gizlilik üzerine yapılan bir araştırma, kullanıcıların% 30'undan fazlasının depolanıp saklanmadıklarını doğrulamadan kişisel verileri paylaştığını buldu.

Buna ek olarak, insan hatasının nasıl “yeniden yapılandırılmasının” ile ilgili etik endişeler vardır. Bir kişi bir önyargı ifade ederse ve sistem, olumlu geri bildirimlerle güçlendirildiği için geçerli bir model olarak yorumlarsa, model onu yükseltebilir. Bu “algoritmik sürüklenme” olarak bilinir.

Bir AI Squared raporuna göre, insan geri bildirimlerini model eğitimi ile entegre etmek, cevaplarının hassasiyetini ve alaka düzeyini önemli ölçüde artırır. Buna karşılık, Zendesk, müşteri deneyimi liderlerinin% 72'sinin AI'nın markalarının değerlerini ve sesini yansıtmasını beklediğine dikkat çekiyor, bu ancak teknoloji gerçek kullanıcılardan öğrenirse mümkün.

Sun'a göre gelecek, kaçınılmaz olarak multimodal olacaktır, çünkü metin veya görüntü arasında seçim yapmak değil, bağlam ve ihtiyaca göre etkileşim yapmak olacaktır. Bu senaryoda, insan hatası kaybolmayacak, ancak işlevi değiştirecektir. Artık sistemi kesintiye uğratan bir başarısızlık değil, onu güçlendiren bir işaret olacak.
 
Üst