Метою кредитного модуля є формування у студентів системного наукового світогляду, загальнокультурного кругозору та компетентностей виявляти, ставити та вирішувати проблеми дослідницького характеру в сфері комп’ютерних наук, оцінювати та забезпечувати якість виконуваних досліджень. Зокрема, засвоїти як фундаментальні засади теорії покрокового прийняття оптимальних рішень (теорія марковських процесів прийняття рішень) та динамічного програмування, так і вміти застосовувати одержані теоретичні знання для розв’язання прикладних, зокрема, задач прийняття оптимальних рішень в промисловості (технічна підтримка промислових систем, система експертизи промислової безпеки); робототехніці (автоматизоване прогнозування); бізнесі (маркетинг, керування запасами); інформатиці (усунення несправностей мереж, оптимізація запитів до серверів розподілених баз даних); державній безпеці та військових науках (пошук рухомих цілей, ідентифікація цілей,
розподіл зброї); охороні здоров’я (медична діагностика, розробка протоколів лікування). Студенти мають оволодіти наступними компетентностями:
загальними - ЗК 1 Здатність застосовувати знання в практичних ситуаціях; ЗК 3 Здатність абстрактно мислити, застосовувати методи аналізу і синтезу; ЗК 7Здатність до пошуку, оброблення та аналізу інформації з різних джерел; ЗК 11 Здатність генерувати нові ідеї (креативність); ЗК 12 Здатність працювати в команді та автономно виконувати командні рішення;
фаховими – ФК 1 Здатність використовувати системний аналіз в якості сучасної міждисциплінарної методології, заснованої на прикладах математичних методів та сучасних інформаційних технологіях, і орієнтована на вирішення задач аналізу і синтезу технічних, економічних, соціальних, екологічних та інших складних систем; ФК 6 Здатність до комп’ютерної реалізації математичних моделей реальних систем і процесів; проектувати, застосовувати і супроводжувати програмні засоби моделювання, прийняття рішень, оптимізації, обробки інформації, інтелектуального аналізу даних; ФК 7 Здатність використовувати сучасні інформаційні технології для комп’ютерної реалізації математичних моделей та прогнозування поведінки конкретних систем, а саме: об’єктно-орієнтований підхід при проектуванні складних систем різної природи, прикладні математичні пакети, застосування баз даних і знань; ФК 10 Здатність розробляти експериментальні та спостережувальні дослідження і аналізувати дані, отримані в них.
По завершенню курсу студенти мають набути такі програмні результати навчання: ПРН 9 Вміти створювати ефективні алгоритми для обчислювальних задач системного аналізу та систем підтримки прийняття рішень; ПРН 12 Застосовувати методи і засоби роботи з даними і знаннями, методи математичного, логіко-семантичного, об’єктного та імітаційного моделювання, технології системного і статичного аналізу; ПРН 14 Розуміти і застосовувати на практиці методи статичного моделювання і прогнозування, оцінювати вихідні дані; ПРН 17 Зберігати та примножувати досягнення і цінності суспільства на основі розуміння місця предметної області у загальній системі знань.
Предмет вивчення.
Задачі та класи методів навчання з підкріпленням рівно як і область знань, що їх включає задач покрокового прийняття оптимальних рішень із частковими спостереженнями
Основні завдання кредитного модуля.
Згідно з вимогами програми навчальної дисципліни аспіранти після засвоєння кредитного модуля мають продемонструвати такі результати навчання:
знання:
методів та засобів навчання з підкріпленням.
уміння:
розв’язувати реальні проблеми за допомогою методів та алгоритмів навчання з підкріпленням.
Зокрема, формалізувати задачу покрокового прийняття оптимальних рішень як частково спостережуваного марковського процесу прийняття рішень з можливо невідомими перехідними ймовірностями та винагородами, застосовувати сучасні алгоритми наближеного розв’язання таких задач, уміння користуватись актуальними інформаційними технологіями та створювати власні програмні продукти для розв’язання реальних задач прийняття оптимальних рішень в промисловості (технічна підтримка промислових систем, система експертизи промислової безпеки); робототехніці (автоматизоване прогнозування); бізнесі
(маркетинг, керування запасами); інформатиці (усунення несправностей мереж, оптимізація запитів до серверів розподілених баз даних); державній безпеці та військових науках (пошук рухомих цілей, ідентифікація цілей, розподіл зброї); охороні здоров’я (медична діагностика, розробка протоколів лікування).
досвід:
створення дослідницької лабораторії навчання з підкріпленням (парадигма організованої співпраці за досвідом провідних національних лабораторій США), де роль кожного члена команди полягає в тому, щоб спеціалізуватися на певній задачі, щоб стати найкращим у ній, маючи при цьому цілісний погляд на весь процес.