Uczenie ze wzmocnieniem
Informacje ogólne
Kod przedmiotu: | 23A1M0-S |
Kod Erasmus / ISCED: |
11.9
|
Nazwa przedmiotu: | Uczenie ze wzmocnieniem |
Jednostka: | Szkoła Główna Handlowa w Warszawie |
Grupy: | |
Punkty ECTS i inne: |
3.00 (zmienne w czasie)
|
Język prowadzenia: | polski |
Efekty uczenia się: |
Wiedza: Student zna podstawowe pojęcia teoretyczne związane z uczeniem ze wzmocnieniem. Student zna obszary zastosowań uczenia ze wzmocnieniem, a także różnicę pomiędzy uczeniem ze wzmocnieniem a innymi działami uczenia maszynowego. Student rozumie różnice pomiędzy różnymi algorytmami uczenia ze wzmocnieniem oraz ograniczenia tych metod. Student zna podstawowe narzędzia programistyczne pozwalające na implementacje i uczenie algorytmów uczenia ze wzmocnieniem. Umiejętności: Student potrafi zaimplementować algorytm uczenia ze wzmocnieniem Student potrafi zaprojektować i przeprowadzić eksperyment symulacyjny. Student potrafi przeprowadzić analizę wyników działania algorytmu uczenia ze wzmocnieniem. Student potrafi zaprezentować wyniki przeprowadzonego procesu modelowania. Student umie krytycznie odnieść się do literatury dotyczącej zastosowań algorytmów uczenia ze wzmocnieniem. Kompetencje społeczne: Student potrafi komunikować wyniki modeli uczenia ze wzmocnieniem specjalistom i decydentom. Student posiada zdolność weryfikacji informacji na temat uczenia ze wzmocnieniem. Student jest zdolny do dalszego samodzielnego poszerzania wiedzy w tematyce uczenia ze wzmocnieniem. |
Zajęcia w cyklu "Preferencje - Semestr letni 2024/25" (jeszcze nie rozpoczęty)
Okres: | 2025-02-15 - 2025-09-30 |
Przejdź do planu
PN WT ŚR CZ PT |
Typ zajęć: |
Zajęcia prowadzącego
|
|
Koordynatorzy: | (brak danych) | |
Prowadzący grup: | Bartosz Pankratz | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Ocena
Zajęcia prowadzącego - Ocena |
Zajęcia w cyklu "Semestr letni 2024/25" (jeszcze nie rozpoczęty)
Okres: | 2025-02-15 - 2025-09-30 |
Przejdź do planu
PN WT ŚR CZ PT |
Typ zajęć: |
Laboratorium, 14 godzin
|
|
Koordynatorzy: | (brak danych) | |
Prowadzący grup: | (brak danych) | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Ocena
Laboratorium - Ocena |
|
Skrócony opis: |
Celem przedmiotu jest przedstawienie podstawowych pojęć związanych z uczeniem ze wzmocnieniem. W ramach zajęć studenci poznają podstawowe algorytmy i modele uczenia ze wzmocnieniem, nauczą się kiedy ich stosowanie jest właściwe i jak należy interpretować ich wyniki, w szczególności w kontekście rosnącej popularności tego typu narzędzi. W trakcie trwania przedmiotu studenci nauczą się samodzielnie projektować i implementować algorytmy uczenia ze wzmocnieniem, a także przygotowywać środowiska do ich uruchamiania. Część praktyczna odbywa się z wykorzystaniem języka programowania Julia. Wykład zakłada wcześniejsze ukończenie przedmiotu Zaawansowane Modelowanie Symulacyjne i Statystyczne Reguły Decyzyjne. |
|
Pełny opis: |
Przedstawienie pojęć związanych z uczeniem ze wzmocnieniem. Omówienie działania modeli tej klasy i sytuacji, w których takie modelowanie jest właściwym narzędziem do rozwiązywania problemów analitycznych. Nauczenie samodzielnego projektowania i implementacji algorytmów uczenia ze wzmocnieniem przy wykorzystaniu języka Julia. Wykład zakłada wcześniejsze ukończenie przedmiotu Zaawansowane Modelowanie Symulacyjne i Statystyczne Reguły Decyzyjne. |
|
Literatura: |
Literatura podstawowa: Sutton R. S., Barto A. G. (2020), Reinforcement learning: an introduction, second edition (http://incompleteideas.net/book/RLbook2020.pdf) Kochenderfer M. J., Wheeler T. A. i Wray K. H. (2022), Reinforcement learning: an introduction, second edition (https://algorithmsbook.com/files/dm.pdf) Rao A., Jelvis T. (2022), Foundations of Reinforcement Learning with Applications in Finance, first edition (http://web.stanford.edu/class/cme241/) Literatura uzupełniająca: Kamiński: The Julia Epress, http://bogumilkaminski.pl/files/julia_express.pdf; B. Kamiński, P. Szufel: Julia 1.0 Programming Cookbook, https://www.packtpub.com/application-development/julia-10-programming-cookbook; Publikacje własne: Przemysław Szufel, Bartosz Pankratz, Anna Szczurek, Bogumił Kamiński, Paweł Prałat , Vehicle Routing Simulation for Prediction of Commuter?s Behaviour, W: JOURNAL OF ADVANCED TRANSPORTATION,2022; Bogumił Kamiński, Bartosz Pankratz, Reliable signals and the sexual selection: agent-based simulation of the handicap principle,W: red. T. M. K. Roeder, P. I. Frazier, R. Szechtman, S. E. Chick, T. Huschka, E. Zhou, Proceedings of the 2016 Winter Simulation Conference ,2016 |
|
Uwagi: |
Kryteria oceniania: egzamin tradycyjny-pisemny: 0.00% egzamin testowy: 0.00% kolokwium: 0.00% referaty/eseje: 0.00% ocena z ćwiczeń: 0.00% inne: 0.00% projekty: 100.00% studia przypadków: 0.00% prezentacje indywidualne lub grupowe: 0.00% |
Zajęcia w cyklu "Semestr zimowy 2024/25" (w trakcie)
Okres: | 2024-10-01 - 2025-02-14 |
Przejdź do planu
PN WT ŚR CZ PT |
Typ zajęć: |
Laboratorium, 14 godzin
|
|
Koordynatorzy: | (brak danych) | |
Prowadzący grup: | (brak danych) | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Ocena
Laboratorium - Ocena |
|
Skrócony opis: |
Celem przedmiotu jest przedstawienie podstawowych pojęć związanych z uczeniem ze wzmocnieniem. W ramach zajęć studenci poznają podstawowe algorytmy i modele uczenia ze wzmocnieniem, nauczą się kiedy ich stosowanie jest właściwe i jak należy interpretować ich wyniki, w szczególności w kontekście rosnącej popularności tego typu narzędzi. W trakcie trwania przedmiotu studenci nauczą się samodzielnie projektować i implementować algorytmy uczenia ze wzmocnieniem, a także przygotowywać środowiska do ich uruchamiania. Część praktyczna odbywa się z wykorzystaniem języka programowania Julia. Wykład zakłada wcześniejsze ukończenie przedmiotu Zaawansowane Modelowanie Symulacyjne i Statystyczne Reguły Decyzyjne. |
|
Pełny opis: |
Przedstawienie pojęć związanych z uczeniem ze wzmocnieniem. Omówienie działania modeli tej klasy i sytuacji, w których takie modelowanie jest właściwym narzędziem do rozwiązywania problemów analitycznych. Nauczenie samodzielnego projektowania i implementacji algorytmów uczenia ze wzmocnieniem przy wykorzystaniu języka Julia. Wykład zakłada wcześniejsze ukończenie przedmiotu Zaawansowane Modelowanie Symulacyjne i Statystyczne Reguły Decyzyjne. |
|
Literatura: |
Literatura podstawowa: Sutton R. S., Barto A. G. (2020), Reinforcement learning: an introduction, second edition (http://incompleteideas.net/book/RLbook2020.pdf) Kochenderfer M. J., Wheeler T. A. i Wray K. H. (2022), Reinforcement learning: an introduction, second edition (https://algorithmsbook.com/files/dm.pdf) Rao A., Jelvis T. (2022), Foundations of Reinforcement Learning with Applications in Finance, first edition (http://web.stanford.edu/class/cme241/) Literatura uzupełniająca: Kamiński: The Julia Epress, http://bogumilkaminski.pl/files/julia_express.pdf; B. Kamiński, P. Szufel: Julia 1.0 Programming Cookbook, https://www.packtpub.com/application-development/julia-10-programming-cookbook; Publikacje własne: Przemysław Szufel, Bartosz Pankratz, Anna Szczurek, Bogumił Kamiński, Paweł Prałat , Vehicle Routing Simulation for Prediction of Commuter?s Behaviour, W: JOURNAL OF ADVANCED TRANSPORTATION,2022; Bogumił Kamiński, Bartosz Pankratz, Reliable signals and the sexual selection: agent-based simulation of the handicap principle,W: red. T. M. K. Roeder, P. I. Frazier, R. Szechtman, S. E. Chick, T. Huschka, E. Zhou, Proceedings of the 2016 Winter Simulation Conference ,2016 |
|
Uwagi: |
Kryteria oceniania: egzamin tradycyjny-pisemny: 0.00% egzamin testowy: 0.00% kolokwium: 0.00% referaty/eseje: 0.00% ocena z ćwiczeń: 0.00% inne: 0.00% projekty: 100.00% studia przypadków: 0.00% prezentacje indywidualne lub grupowe: 0.00% |
Właścicielem praw autorskich jest Szkoła Główna Handlowa w Warszawie.