Ders Notu – 2 Ajanlar (Etmenler, Vekiller) - Agents

YAPAY ZEKA ve UZMAN SİSTEMLER Ders Notu – 2Ajanlar (Etmenler, Vekiller) - Agents

Konular • Ajanlar ve Ortamları • Akıllı olma (Rationality) • PEAS (Başarı Ölçüsü, Ortam, Tepkivericiler, Algılayıcılar) • Ortam türleri • Ajan türleri

Ajanlar • Ajan- Algılayıcıları ile ortam bilgilerini alan, bu bilgileri algılayan, duyan, anlayan ve tepkivericileri ile bu ortama tepki veren nesne • Ajanın herhangi bir zamandaki algısal girdilerine duyum (percept) adını vermekteyiz. • İnsan ajan: • Algılayıcılar - gözler, kulaklar,… • Tepkivericiler - ayaklar, eller, ağız… • Robot ajan: • Algılayıcılar - kamera, kızılötesi bulucular,.. • Tepkivericiler - çeşitli motorlar

Ajanın yapısı Ortam Ne Yapmalı Algılayıcı algılar Ajan ? hareketler Tepkiverici

Ajanların Tasarımı • Ajan programı • Algıları hareketlere dönüştüren işlev • Mimari • Programların yürütüldüğü bilgisayarlı sistem • Ajan = mimari + program • Ajan programını tasarlamak için bizim aşağıdakiler hakkında bilgimiz olmalıdır: • Mümkün algılamalar ve hareketler • Amaçlar ve başarı ölçümü • Ajanın işlem yapacağı ortamın türü

Ajanlar ve Ortamları Ajan fonksiyonu,ajanın algıladığı bilgileri (p) hareketlere (A) dönüştürür: F(P) A • Ajan programı, ajanın fiziki mimarisi üzerinde F(P)‘i üretmek içindir

Örnek: Süpürge ajanın dünyası • Algılamalar:mekan ve içeriği, örn., [A,Kirli] • Hareketler:Sol, Sağ,Süpürmek, İşlemYok

Bir Ajanın Dış Nitelikleri • Bir ajanın belirli bir zamana kadar algıladığı her şey, ajanın duyum serisini (percept sequence) oluşturur. • Matematik bakış açısıyla bir ajanın davranışı, herhangi bir duyum serisini bir eyleme eşleyen ajan fonksiyonu (agent function) ile tanımlanır. • Herhangi bir ajanı betimleyen ajan fonksiyonunu bir tablo ile gösterebiliriz. Çoğu ajan için, eğer duyum serisinin uzunluğuna bir sınır getirmez isek, bu tablo çok büyük, hatta sonsuz büyüklükte, olacaktır.

Elektrik süpürgesi dünyası için basit bir ajan fonksiyonunun kısmi tablolaştırılması DUYUM SERİSİEYLEM [A, Temiz] Sağ [A, Kirli] Temizle [B, Temiz] Sol [B, Kirli] Temizle [A, Temiz], [A, Temiz] Sağ [A, Temiz], [A, Kirli] Temizle … [A, Temiz], [A, Temiz], [A, Temiz] Sağ [A, Temiz], [A, Temiz], [A, Kirli] Temizle

Algı Serisinden Eyleme İdeal Eşleme • Ajanın davranışı yalnız algı serisine bağlı ise olası tüm algı serilerine karşı gelen eylemler tablo haline getirilerek bir ajan tanımlanabilir. Çoğu zaman bu tablo çok uzun olacaktır. Oluşturulan tabloya algı serisinden eyleme eşleme denir. Eğer eşleme ajanı tanımlıyorsa ideal eşleme de ideal ajanı tanımlar. Eşleme için tablonun her bir elemanının ayrı ayrı belirtilmesi gerekmez. Örneğin hesap makinesindeki karekök fonksiyonunu basit bir ajan olarak göz önüne alalım. Bu ajanın algı serisi basılan tuşlardır. İdeal eşleme; girilen pozitif sayı x ise z2x olacak şekilde 4 basamak doğrulukta z'yi göstermektir. Bu amaçla tablo kullanmak yerine Newton yöntemi kullanılarak yazılan program ile ajan tanımlanabilir. Tablo çok uzun olmasına karşın ajan çok kısa bir programdır. Aşağıda tablo ve program görülmektedir:

Neden arama tablosu başarısızdır • Ajan programı yazmanın en basit yolu tablo kullanmaktır (look-up table). Bu durumda olası tüm algı serisinin bellekte tutulması ve indeks kullanarak erişilmesi gerekir. Tablo kullanımında aşağıdaki olumsuzluklar ortaya çıkar: • Oldukça çok kayıt gerekmektedir • Satranç oynayan ajan için 35100kayıt • Tabloyu oluşturmak çok zaman alıyor • Özerklik Yoktur • Ajanın tüm hareketleri önceden belirlenmiştir (kaydedilmiştir) • Ajana bir derece özerklik tanınarak öğrenme mekanizması oluşturulsa bile tüm girişler için tablonun doğru değerlerini bulması sonsuza kadar sürer

Ajan Programı function Ajan(algı)returns hareket bellek← Bellek_Güncelle(bellek, algı) hareket ← En_İyi_Hareket(bellek) bellek ← Bellek_Güncelle(bellek, hareket) returnhareket

Ajan Programları -Arama tablosu function Tablo_Tabanlı_Ajan(algı)returns hareket algılar, /*başlangıçta boş */ tablo /*algılar üzere indekslenmiş tablo, başlangıçta tam belirlenmiştir*/ algı’yı,algılar tablosunun sonunailave et hareket ← Tabloya_Bak(algı, tablo) returnhareket

Mantıklı Ajanlar –logical agent • Algılayabildiklerine ve yapabildiklerine dayanarak “doğru şeyler yapmak” için çaba gösteren ajanlar. Akılllı (rasyonel) bir ajan doğru şeyi yapandır – kavramsal olarak bakıldığında böyle bir ajanın fonksiyon tablosunda her giriş doğru olarak doldurulmuştur. • Doğru hareket ajanın başarılılık etkenlerindendir • Başarı ölçüsü:ajanın davranışının başarılılığını gösteren kıstas. E.süpürgesi ajanın başarısı sorulan tozun miktarı ile, harcanan zamanla, tüketilen enerji ile, kopardığı gürültü ile … belirlenebilir • Mantıklı ajan, her bir algılama üzere mümkün hareketler içinden başarıyı en fazla yapanı seçmelidir. • Genel bir kural olarak, başarım ölçütleri ajanın nasıl davranması gerektiğini düşündüğümüz duruma göre değil, çevrede gerçekte ne olmasını istiyorsak ona göre tasarlanmalıdır.

Mantıklılık ve her şeyi başarmak • Mantıklı olmak her şeyi başarmak değildir • “Her şeyi başarmak”, ajanın, tüm hareketlerinin ne ile sonuçlanacağını bildiği anlamına geliyor • Örnek:caddeyi geçerken, kafana uçağın kapısının düşeceğini önceden bilmek • Mükemmelliğe gerek yoktur. • Her zaman doğru şeyler yapmak mümkün değildir • Beklenen başarı, nelerin algılandığına bağlıdır • Mantıksal davranış aşağıdaki etkenlere bağlıdır • Başarı ölçüsü • Algılama tümcesi:ajanın belirli bir anda algıladığı her şey • Ortam hakkında ajanın bildikleri • Ajanın yapabileceği mümkün hareketler • Ajanın davranışı yalnız onun kendi deneyimi, öğrenme ve uyum sağlayabilme yeteneği ile belirlenirse, ajan özerktir

Mantıklılık • Herhangi bir zamandaki rasyonalite dört şeye bağlıdır: • Başarı kriterini tanımlayan başarım ölçütü. • Ajanın ortam hakkındaki ön bilgisi. • Ajanın gerçekleştirebileceği eylemler. • Ajanın o ana kadar olan duyum serisi. • Her bir duyum serisi için, mantıklı bir ajan, duyum serisi tarafından sağlanan kanıtları ve sahip olduğu içsel bilgiyi kullanarak, başarım oranını en yüksek duruma getirecek eylemi seçmelidir.

İdeal mantıklı ajan • Her mümkün algılama tümcesi için, önceden var olan bilgilerine ve algılamalar ardışıklığına dayanarak başarı ölçüsünü en iyi yapan hareketleri gerçekleştiren ajan • Yararlı bilgiler edinmek için hareketler • Böyle hareketler beklenen başarıyı maksimum yapar

İdeal AjanlarAlgılamadan harekete doğru • İdeal ajanı oluşturma • Her mümkün algılama tümcesinin harekete dönüştürülmesi (haritalanması) • İdeal dönüştürme:Her algılama tümcesi için belli olan en yüksek başarı ölçüsüne uygun cevabın bulunması • Belirgin tabloya her zaman gerek duyulmaz • Gereken tek şey dönüştürmenin tanımlanmasıdır • Örnek:kare kökün 15 onluk rakama dek kesinlikle hesaplanması için büyük tablo yerine küçücük bir program yeterlidir

Her şeyi bilme, öğrenme ve özerklik • Her şeyi bilen (omniscient) bir ajan, eylemlerinin sonucunu da bilir ve ona göre davranır. Fakat gerçekte her şeyi bilmek imkansızdır. • Bu örnek, rasyonalitenin mükemmellik olmadığını göstermektedir. Rasyonalite beklenen başarımı olabildiğince yükseltirken, mükemmellik gerçekbaşarımı yükseltmektedir.

İdeal AjanlarÖzerklik • Eğer ajanın tüm hareketleri yalnız önceden kaydedilmiş bilgilere dayanırsa, bu ajan özerklikten yoksundur. • Ajanın özerklik davranışı onun deneyimi ile belirlenmelidir • Bazı başlangıç bilgiler ve öğrenme yeteneği gerekmektedir • Özerk olmayan ajanlar esneklikten yoksundur

Özerk kelimesi insanın doğrudan kontrolü altında olmayan anlamında da kullanılır. Örneğin özerk kara aracı (insansız). Özerk olan ajanlar çevre koşulları değiştiğinde yeni koşullara adapte olarak görevini başarı ile sürdürebilir. Eğer sadece önceden verilen bilgileri kullanırsa başarısız olma olasılığı yüksektir.

Ön Bilgiye Karşı Öğrenme - I • Başarılı ajanlar, ajan fonksiyonunun hesaplanması işini üç farklı aşamaya ayırır: • ajan tasarlanırken, hesaplamanın bir kısmı tasarımcıları tarafından yapılır; • ajan bir sonraki eylemini düşünürken daha fazla hesaplama yapar; • ve tecrübeden öğrenmesi sebebiyle davranışını değiştirmek için daha da fazla hesaplama yapar. • Duyumlarından çok tasarımcısının ön bilgisine dayanan bir ajanın özerklikten yoksun olduğunu söyleriz. Akıllı bir ajan özerk olmalıdır – kısmi veya yanlış ön bilgiyi telafi edecek şekilde öğrenebilmelidir.

Ön Bilgiye Karşı Öğrenme - II • Uygulamada, nadiren bir ajan başlangıç aşamasında tam özerkliğe ihtiyaç duyar: etmen az tecrübeliyse veya hiç tecrübeye sahip değilse, tasarımcı ona yardımcı olana kadar rastgele eylemde bulunmalıdır. • Yapay zekalı bir ajana, bir miktar ön bilgiyle birlikte öğrenme yeteneği verilmesi mantıklı olacaktır. • Çevresi hakkında yeterli tecrübe edindikten sonra, mantıklı bir ajanın davranışı, etkin bir biçimde ön bilgisinden bağımsız hale gelebilir. • Bu nedenle, öğrenmenin işin içine katılması, çok çeşitli ortamlarda başarılı olacak tek bir mantıklı ajanın tasarlanmasına izin verecektir.

Ajanın Nitelendirilmesi • Görev ortamları, mantıklı ajanların çözümü olduğu sorunlardır. • Başarım ölçütü, ortam ve ajanın gerçekleştiricileri ile algılayıcıları (PEAS), görev ortamı altında birleşirler. • Başarı bileşenleri:-PEAS • Başarı ölçüsü-Performance measure • Ortam-Environment • Tepkivericiler-Actuators • Algılayıcılar- Sensors

PEAS. Örnek: Taksi süren ajan • Mantıklı ajanların tasarımı için PEAS bileşenleri belirlenmelidir • Şimdiki durumu bilmek için algıların kullanılması • Araba nerededir? Şu anki sürat kaçtır? Hareket koşulları nasıldır? • Zıt amaçların varlığı ; Farklı ortamların varlığı

_PEAS(Örnekler) -devamı

Ortam Türleri • Tam gözlem-kısmı gözlem : • Zamanın verilmiş diliminde ajanın algılayıcıları tarafından ortamın tüm durumunun gözlemlenmesi mümkün mü? • Belirgin (deterministik)-tahmini (stokastik) • Belirgin ortam - ortamın sonraki durumu tümüyle şimdiki duruma ve ajanın hareketlerine bağlıdır. • Tam erişilebilirlik durumunda belirsizlik yoktur; ortam belirgindir • Epizodik (aralıklı, bağlantısız, bölümlü)-ardışık (sıralı) • Ajanın yaşamı atomik epizotlara (parçalara) bölünebilir. Epizottaki hareketin seçimi, yalnız epizodun kendisine bağlıdır. • Epizot önceki epizotlara bağlı değil

Ortam Türleri (devamı) • Statik (durağan)-Dinamik • Ajanın karar oluşturduğu (düşündüğü) süreç içinde ortam değişirse bu dinamik ortamdır, değişmezse statik ortamdır. Statik ortamlarda ajanın aralık görüntüleri kaydetmesine gerek yoktur • Yarım dinamik: ortam değişmez, ama ajanın başarısı değişe bilir • Ayrık-sürekli • algılamalar veya hareketler sayılabilirse (ayrık ise) ortam ayrık, sayılamıyorsa süreklidir • Satranç ortamı ayrıktır, çünkü her hamlede sınırlı sayıda hareketler var. • Tek ajan-çoklu ajan:Tek ajan ortamda kendi başına faaliyette bulunuyor. Çoklu ajanlarişbirliği yapıyorlar. • Çok zor ortamlar • Erişilebilmezlik, epizodik olmayan, dinamik, sürekli • Gerçek ortamlar çoğunlukla öyle karmaşıktır ki, onlara belirli olmayan (non-deterministic) ortam gibi bakılmalıdır

Ortam Türlerine Örnekler

Ortam Programları • Ajan programlarını test etmek için çevre simülatörü kullanılır. Simülatörler bir veya daha fazla ajanı giriş olarak alır, her bir ajana doğru algıları ileterek geriye eylemlerini alır. Simülatör ajanların eylemine bağlı olarak çevreyi yeniler. Yenileme işleminde ajan eylemine ek olarak bazı dinamik özellikler de eklenebilir. Bu nedenle çevre başlangıç durumu ve yenileme fonksiyonu ile tanımlanır. Aşağıda çevre simülatör programı görülmektedir

Ortam Programları Procedure Run-Çevre (durum, yenile-fn, ajanlar, kesme) girişler: durum, çevrenin ilk durumu yenile-fn, çevreyi yenileme fonksiyonu ajanlar, ajan kümesi kesme, programdan çıkış testi repeat for her ajan do Algı[ajan]  Algı-Al(ajan,durum) for her ajan do Eylem[ajan]  Program[ajan](Algı[ajan]) durum  Yenile-fn(eylemler, ajanlar, durum) until kesme(durum) Simülatör programına her bir ajanın performansını değerlendirecek performans fonksiyonu da eklenebilir.

Ajan Türleri • Basit tepki ajanı • Model tabanlı ajan • Amaca yönelik ajan • Faydaya yönelik ajan

Basit tepki ajanları • Bir kameradan gelen görüntü 50 Mbyte/sn. hızındadır (saniyede 25 çerçeve, her çerçeve 1000*1000 piksel ve her piksel 8 bit renk ve 8 bit yoğunluk bilgisi). Bir saat için gerekli look-up tablosu 260*60*50M girişli olacaktır. Genel giriş çıkış ilişkileri kullanılarak tablo kısaltılabilir. Örneğin öndeki araç fren yaparsa fren lambaları yanar ve sürücü buna dikkat ederek frene basar. Aynı işlem görsel giriş kullanılarak "öndeki araç fren yapıyor" koşulu ile ajan programındaki "fren yap" eylemi ilişkilendirilebilir. Bu ilişkiye koşul-eylem (condition-action) kuralı denir ve aşağıdaki şekilde yazılabilir: EĞER Öndeki_Araç_Frenliyor İSE frenle ( if/then) • İnsanlarda benzeri davranışlar bir öğrenmenin sonucunda (araba sürme gibi) veya refleks olarak (kızgın sobadan elin çekilmesi gibi) yapılır. Aşağıda koşul-eylem kuralının ajana algıdan eyleme bağlantıyı nasıl sağladığı görülmektedir.

Basit tepki ajanları ajanın hareketi yalnız şimdiki algılamalara bağlıdır, eski algılamalar dikkate alınmaz algılayıcılar • Koşul-hareket kuralları • Örnek:Eğer öndeki araba frenlediyse, o zaman frenlemeği başlat ajan Şimdi dünya nasıldır Ortam Şimdi hangi hareketi yapmalıyım Koşul-hareket kuralları tepkivericiler

Basit tepki ajanları function Basit_Tepki_Ajanı(algı) returns hareket static: kurallar /*koşul-hareket kuralları kümesi durum← Girişi_Yorumla(algı) kural ← Kural_Karşılaştır(durum, kurallar) hareket ← Kural_Hareket[kural] return hareket --------- • Basit Refleks Ajanı. Algılamayla tanımlanan mevcut duruma uyan kuralı bularak çalışır. • Giriş_Yorumla: Algılanan mevcut durumu soyut olarak tanımlar (abstraction). • Kural_Karşılaştır: Kural kümesinde mevcut duruma uyan ilk kuralı verir. • Kural_Hareket: Kurala bağlı olarak yapılacak eylemi verir. • Uygulama alanı kısıtlıdır

2 durumlu elektrik süpürgesi ortamında çalışan basit refleks ajanı için ajan programı function REFLEKS-SÜPÜRGE-AJANI([konum,durum]) returns eylem if durum= Kirlithen return Temizle else if konum= A then return Sağ else if konum= B then return Sol

Model tabanlı ajanlar • O anki algılamaya bağlı olarak doğru karar verilebiliyor ise basit refleks ajanlar başarılı olabilir. Arabanın arkasında fren lambalarına ek olarak dönüş sinyal lambaları da yer almaktadır. Frene basılıp basılmadığını saptamak için arabanın her iki kenarındaki lambanın kontrol edilmesi gerekmektedir. Bu amaçla bir önceki görüntünün saklanması gerekmektedir. Bir önceki görüntüde her iki lamba sönükse ve o anki görüntüde ikisi de yanıyor ise frene basıldığını söyleyebiliriz. Bu nedenle doğru eylemin seçilebilmesi için bazı bilgilerin saklanması gerekmektedir. Buna iç durum (internal state) adı verilir. • Sensörlerden gelen bilgi daha önceki duruma bağlı olarak farklı sonuçlar verebiliyor ise önceki durumun da saklanması gerekir. Dünyanın durumu yalnız o anki girişe değil bir önceki duruma da bakılarak saptanır.

Model tabanlı ajanlar Eğer ajanın gözlemleri tam değilse, dünyanın, şu an göremediği kısmı hakkında bilgilerin saklanması (eski algılara bağlı olan bazı durumların tutulması) çok etkili olabilir. Algılayıcılar • Hareketi seçmek için iç durum bellekte tutuluyor • Algılayıcılar tüm dünya durumuna erişimi sağlayamıyor ajan Durum Dünya şimdi nasıldır Ortam hareketler şimdi hangi hareketi yapmalıyım Koşul-hareket kuralları Tepkivericiler

Model tabanlı ajanlar • İçsel durum bilgisinin zamanla güncellenmesi, iki tip bilginin ajan programında kodlanmasını gerektirir: • dünyanın ajandan bağımsız olarak nasıl geliştiği hakkında bir miktar bilgi ve • ajanın eylemlerinin dünyayı nasıl etkilediği hakkında bir miktar bilgi. • “Dünyanın nasıl işlediği” hakkındaki bu bilgi, dünyanın modeli olarak adlandırılır. • Bu tip bir model kullanan ajanlar ise model tabanlı ajanlar olarak adlandırılır.

Model Tabanlı Ajanlar (2) function Model_Tabanlı_Ajan(algı) returns hareket static: durum, mevcut dünyanın durumunu tanımlar kurallar, koşul-hareket kuralları kümesi durum← Durum_Güncelle(durum,hareket, algı) kural ← Kural_Karşılaştır(durum, kurallar) hareket ← Kural_Hareket[kural] durum← Durum_Güncelle(durum,hareket) return hareket • Durum-güncelleme-yeni dünya durumları oluşturuluyor • Ddünya oluşumları bellekte tutuluyor

Amaca yönelik Ajanlar • Ortamın şu andaki durumunu bilmek, ne yapılacağına karar vermek için her zaman yeterli değildir. • Bazen ajan, şu andaki durum betimlemesi gibi, istenen durumları betimleyen bir tür hedef bilgisine ihtiyaç duyar. • Arama ve planlama Yapay Zeka’nın, ajanın hedeflerine ulaşmasını sağlayan eylem serilerini bulmaya adanmış alt alanlarıdır. • Bu tip bir karar verme, daha önceden bahsedilen koşul-eylem kurallarından, geleceği de hesaba kattığı için temelde farklıdır.

Bu şekilde karar verme daha önce anlatılan koşul-eylem kurallarından temel olarak farklıdır. Refleks ajan fren lambasını gördüğü zaman fren yapar. Amaç tabanlı ajan ise öndeki aracın fren lambaları yandığı zaman onun yavaşlayacağını çıkarır. Öndeki araca çarpmama amacını gerçekleştirecek eylem ise fren yapmaktır. Her ne kadar amaç tabanlı ajan etkin görünmese de esnektir. Örneğin yağış başladığı zaman frenlerin etkin bir şekilde kullanılabilmesi için bilgisini yenileyebilir. Diğer yandan refleks ajan için çok sayıda koşul-eylem kuralı yazmak gerekir. Amaç tabanlı ajanlarda amacı değiştirerek farklı noktalara erişmek mümkündür. Refleks ajanlar ise sadece bir noktaya giderler.

Amaca yönelik ajanlar • Amaç bilgisi • Hangi durumlar arzu edilendir? • Örnek: müşterinin adrese ulaşması • Mümkün hareketleri sonuçları ile birleştirmek • Bazı zamanlarda tek hareket, bazı zamanlarda hareketler ardışıklığı • Geleceği dikkate almak • Ne olacak? • Beni mutlu edecek bir şeyler olacak mı? • Koşul-hareket kurallarından daha esnek • Ortam değiştikte bilgilerin güncellenmesi daha kolaydır • Örnek:yağmurda frenleme

Amaca yönelik ajanlar ajan algılayıcılar durum Dünya şimdi nasıldır Dünya nasıl değişiyor Benim hareketlerim nasıl olmalıdır Ortam hareketi yapmış olsam ne olacak Şimdi hangi hareketi yapmalıyım Amaçlar tepkivericiler

Yarara (faydaya) yönelik ajanlar • Hedefler sadece “mutlu” ve “mutsuz” durumları arasında ikili kaba bir ayrım sağlarken, daha genel bir başarım ölçütü, erişildiklerinde farklı dünya durumlarının ajanı nasıl mutlu edeceğinin karşılaştırılmasına izin vermelidir. • “Mutlu” terimi, kulağa fazla bilimsel gelmemektedir. Geleneksel terminoloji, bir dünya durumu diğerine tercih ediliyorsa, onun ajan için daha faydalı olduğunu söyler. • Bir fayda fonksiyonu, bir durumu (veya bir durum serisini) mutluluk derecesini betimleyen bir gerçel sayıya eşler.

Yarara yönelik ajanlar • Amaçlara farklı yollarla ulaşılabiliyor • Bu yollardan hangisi daha arzu edilendir? • Dünya durumlarının faydası • Amaca ulaştıkta ajan ne kadar mutlu olacak? • Durumu gerçek sayıya dönüştürmeli • Amaca dayalı ajanın yapamadığı mantıklı kararlara izin veriyor • Yalnız birisine ulaşmak mümkün olan zıt amaçlar • Kesin olarak hiç birisine ulaşılamayacak birkaç amaç • Her mantıklı ajanın fayda fonksiyonu vardır • Belirgin fayda fonksiyonunun kullanılması • Bazı hallerde yalnız amaçların verilmesi daha iyi sonuçlar doğurabilir

Yarara yönelik ajanlar ajan algılayıcılar durum Dünya şimdi nasıldır hareketler Ben bu hareketi yapsam dünya nasıl olacak ORTAM Bu durumda ben ne kadar mutlu olacağım Fayda Şimdi hangi hareketi yapmalıyım Tepkiverici

Öğrenen ajanlar • Turing (1950), akıllı makinelerini gerçekten elle programlama fikrini düşünmüştür. Bunun ne kadar emek gerektirdiğini tahmin ederek “Daha hızlı bazı yöntemlere ihtiyaç var” demiştir. • Bu, ajanın başlangıçta bilinmeyen ortamlarda çalışmasını ve sadece başlangıç bilgisinin izin vereceği durumdan daha yetenekli hale gelmesini sağlar.

Öğrenen ajanlar • Öğrenen bir ajan dört kavramsal bileşene ayrılabilir: • Öğrenme Bileşeni • Başarım Bileşeni • Eleştirmen • Problem Oluşturucu

Öğrenen ajanlar • En önemli ayrım, gelişmeyi sağlamaktan sorumlu öğrenme bileşeni ile dışsal eylemlerin seçiminden sorumlu başarım bileşeni arasındadır. • Başarım bileşeni, önceden ajanın bütünü olarak ele aldığımız şeydir: duyumları alır ve eylemlere karar verir. • Öğrenme bileşeni, eleştirmenden gelen ve ajanın ne kadar iyi olduğunu gösteren geri beslemeyi kullanarak, gelecekte daha iyi olması için başarım bileşeninin nasıl değiştirilmesi gerektiğine karar verir. • Problem oluşturucu, yeni ve bilgilendirici tecrübelere yol açacak eylemler önerilmesinden sorumludur.

Ders Notu – 2 Ajanlar (Etmenler, Vekiller) - Agents