Hesap oluşturmak AWS Deepracer robotlarını kodlamak için Amazon’un Deepracer Öğrenci Ligi’nde hesap oluşturmak gerekir.
Proje oluşturmak
SahayI seçmek
Yapay zeka öğrenİm şekİllerİ PPO ( Proximal Policy Optimization ): Bu yapay zeka öğrenim algoritması, her denemeden topladığı verileri saklar. Sonrasında bu verileri analiz ederek en iyi rotayı çizmeye çalışır. Bu yüzden bu öğrenim şekli daha fazla veriye ihtiyaç duyar. Ancak çizdiği rotalar kararlıdır . SAC ( Soft Actor Critic ): Bu yapay zeka öğrenim algoritması, daha yeni verileri kullanır, eski verileri dikkate almaz. Böylece koşullara göre değişen durumlarda her zaman en iyiye yakın sonuçlar elde edebilir. Bu öğrenim şekli daha az veriye ihtiyaç duyar ancak daha kararsız rotalar çizer.
Yapay zeka öğrenİm şekİllerİ
Algorİtma yazmak
Reward function Reward nedir? Bir yapay zeka doğruya ne kadar yakın olduğunu « reward»la anlayabilir. Doğruya ne kadar yakınsa reward o kadar yüksek, ne kadar uzaksa o kadar düşük olur. Reward function , sürekli reward değerini döndürür ve yazılan algoritmaya göre yapay zekanın daha kararlı olmasını sağlar.
parametreler
All wheels on track
Closest waypoints
dİstance from center
steerİng angle
HİPERPARAMETRELER Hiperparametreler , araçların daha spesifik yollar izlemesi için kullanılır. Bu, aracı belli haritalarda çok iyi yaparken, bazı haritalara entegre olmasını zorlaştırır. Örneğin daire biçiminde bir harita için tanımlanmış bir hiperparametreden , daha düz bir haritada istenilen verim alınamaz. Hiperparametrlerle aracın seçebileceği aksiyonlar yaratırız. Bu aksiyonlar, aracın gidiş açısına ve hızına göre farklı iki değer aralığı alır.
HİPERPARAMETRELER Mesela daire bir harita için maksimum hızı sabit tutup daha kararlı bir yol çizilmesi sağlanabilir. Veya daha düz bir haritada dönüş açısına rağmen hız yüksek tutulabilir. Ancak bu hiperparametrelerle geliştirmeler yaparken olabildiğince çok opsiyon sunmaya çalışın. Böylece programladığınız sistem bu opsiyonlar arasında en uygun olanı seçebilir.