https://aicandy.vn/cach-du-doan-gia-co-phieu-hieu-qua-bang-mo-hinh-lstm/
Bản quyền thuộc về: https://aicandy.vn
Học tập toàn diện: Kết nối lý thuyết, thực hành và dữ liệu thực tế
https://aicandy.vn
11
return output
Dữ liệu đi qua ba lớp tích chập (conv1, conv2, conv3) đã được định nghĩa
trước đó. Mỗi lớp trích xuất và biến đổi các đặc trưng của đầu vào. Sau đó
chuyển đổi tensor đa chiều thành vector 2D, tự động tính toán kích thước
còn lại để làm phẳng tensor. Sau khi dữ liệu đã làm phẳng, dữ liệu tiếp tục
đi qua hai lớp fully connected (fc1 và fc2). Và cuối cùng là trả về giá trị Q
cho mỗi hành động.
5. Chương trình huấn luyện
Mục tiêu của chương trình này là sau quá trình huấn luyện sẽ tạo ra model
để sau đó bot tự chơi flappy bird và đạt được điểm số cao.
Bước 1: Cấu hình các tham số cơ bản về batch, learning_rate, optimizer_type
Để tăng tính linh hoạt khi train và tùy chỉnh các tham số này, sử dụng
parse_arguments() cùng với các tham số default.
parser = argparse.ArgumentParser(
"""AIcandy.vn Flappy Bird""")
parser.add_argument("--img_size", type=int, default=84,
help="The common width and height for all images ")
parser.add_argument("--batch_count", type=int, default=32,
help="The number of images per batch")
parser.add_argument("--optimizer_type", type=str,
choices=["sgd", "adam"], default="adam")
parser.add_argument("--learning_rate", type=float, default=1e-6)
parser.add_argument("--discount_factor", type=float,
default=0.99)
parser.add_argument("--start_epsilon", type=float, default=0.1)
parser.add_argument("--end_epsilon", type=float, default=1e-4)
parser.add_argument("--total_iterations", type=int,
default=2000000)
parser.add_argument("--memory_size", type=int, default=50000,