Szkoła Główna Handlowa w Warszawie - Centralny System Uwierzytelniania

Uczenie ze wzmocnieniem

Informacje ogólne

Kod przedmiotu:	23A1M0-D
Kod Erasmus / ISCED:	11.9 Kod klasyfikacyjny przedmiotu składa się z trzech do pięciu cyfr, przy czym trzy pierwsze oznaczają klasyfikację dziedziny wg. Listy kodów dziedzin obowiązującej w programie Socrates/Erasmus, czwarta (dotąd na ogół 0) – ewentualne uszczegółowienie informacji o dyscyplinie, piąta – stopień zaawansowania przedmiotu ustalony na podstawie roku studiów, dla którego przedmiot jest przeznaczony. / (0619) Komputeryzacja (inne) Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu:	Uczenie ze wzmocnieniem
Jednostka:	Szkoła Główna Handlowa w Warszawie
Grupy:
Punkty ECTS i inne:	3.00 (zmienne w czasie) Podstawowe informacje o zasadach przyporządkowania punktów ECTS: roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS; tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h; 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się; tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS; nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta. zobacz reguły punktacji
Język prowadzenia:	polski
Efekty uczenia się:	Wiedza: Student zna podstawowe pojęcia teoretyczne związane z uczeniem ze wzmocnieniem. Student zna obszary zastosowań uczenia ze wzmocnieniem, a także różnicę pomiędzy uczeniem ze wzmocnieniem a innymi działami uczenia maszynowego. Student rozumie różnice pomiędzy różnymi algorytmami uczenia ze wzmocnieniem oraz ograniczenia tych metod. Student zna podstawowe narzędzia programistyczne pozwalające na implementacje i uczenie algorytmów uczenia ze wzmocnieniem. Umiejętności: Student potrafi zaimplementować algorytm uczenia ze wzmocnieniem Student potrafi zaprojektować i przeprowadzić eksperyment symulacyjny. Student potrafi przeprowadzić analizę wyników działania algorytmu uczenia ze wzmocnieniem. Student potrafi zaprezentować wyniki przeprowadzonego procesu modelowania. Student umie krytycznie odnieść się do literatury dotyczącej zastosowań algorytmów uczenia ze wzmocnieniem. Kompetencje społeczne: Student potrafi komunikować wyniki modeli uczenia ze wzmocnieniem specjalistom i decydentom. Student posiada zdolność weryfikacji informacji na temat uczenia ze wzmocnieniem. Student jest zdolny do dalszego samodzielnego poszerzania wiedzy w tematyce uczenia ze wzmocnieniem.

Zajęcia w cyklu "Semestr letni 2024/25" (w trakcie)

Okres:	2025-02-15 - 2025-09-30	Aktualnie rejestracja jest zamknięta - nikt nie może się rejestrować. szczegóły... Wybrany podział planu: tygodniowy cykl przedmiotu Przejdź do planu PN WT ŚR CZ PT
Typ zajęć:	Laboratorium, 15 godzin więcej informacji Wykład, 15 godzin więcej informacji
Koordynatorzy:	(brak danych)
Prowadzący grup:	(brak danych)
Lista studentów:	(nie masz dostępu)
Zaliczenie:	Przedmiot - Ocena Wykład - Ocena
Skrócony opis:	Celem przedmiotu jest przedstawienie podstawowych pojęć związanych z uczeniem ze wzmocnieniem. W ramach zajęć studenci poznają podstawowe algorytmy i modele uczenia ze wzmocnieniem, nauczą się kiedy ich stosowanie jest właściwe i jak należy interpretować ich wyniki, w szczególności w kontekście rosnącej popularności tego typu narzędzi. W trakcie trwania przedmiotu studenci nauczą się samodzielnie projektować i implementować algorytmy uczenia ze wzmocnieniem, a także przygotowywać środowiska do ich uruchamiania. Część praktyczna odbywa się z wykorzystaniem języka programowania Julia. Wykład zakłada wcześniejsze ukończenie przedmiotu Zaawansowane Modelowanie Symulacyjne i Statystyczne Reguły Decyzyjne.
Pełny opis:	Przedstawienie pojęć związanych z uczeniem ze wzmocnieniem. Omówienie działania modeli tej klasy i sytuacji, w których takie modelowanie jest właściwym narzędziem do rozwiązywania problemów analitycznych. Nauczenie samodzielnego projektowania i implementacji algorytmów uczenia ze wzmocnieniem przy wykorzystaniu języka Julia. Wykład zakłada wcześniejsze ukończenie przedmiotu Zaawansowane Modelowanie Symulacyjne i Statystyczne Reguły Decyzyjne.
Literatura:	Literatura podstawowa: Sutton R. S., Barto A. G. (2020), Reinforcement learning: an introduction, second edition (http://incompleteideas.net/book/RLbook2020.pdf) Kochenderfer M. J., Wheeler T. A. i Wray K. H. (2022), Reinforcement learning: an introduction, second edition (https://algorithmsbook.com/files/dm.pdf) Rao A., Jelvis T. (2022), Foundations of Reinforcement Learning with Applications in Finance, first edition (http://web.stanford.edu/class/cme241/) Literatura uzupełniająca: Kamiński: The Julia Epress, http://bogumilkaminski.pl/files/julia_express.pdf; B. Kamiński, P. Szufel: Julia 1.0 Programming Cookbook, https://www.packtpub.com/application-development/julia-10-programming-cookbook; Publikacje własne: Przemysław Szufel, Bartosz Pankratz, Anna Szczurek, Bogumił Kamiński, Paweł Prałat , Vehicle Routing Simulation for Prediction of Commuter?s Behaviour, W: JOURNAL OF ADVANCED TRANSPORTATION,2022; Bogumił Kamiński, Bartosz Pankratz, Reliable signals and the sexual selection: agent-based simulation of the handicap principle,W: red. T. M. K. Roeder, P. I. Frazier, R. Szechtman, S. E. Chick, T. Huschka, E. Zhou, Proceedings of the 2016 Winter Simulation Conference ,2016
Uwagi:	Kryteria oceniania: egzamin tradycyjny-pisemny: 0.00% egzamin testowy: 0.00% kolokwium: 0.00% referaty/eseje: 0.00% ocena z ćwiczeń: 0.00% inne: 0.00% projekty: 100.00% studia przypadków: 0.00% prezentacje indywidualne lub grupowe: 0.00%

Zajęcia w cyklu "Semestr zimowy 2024/25" (zakończony)

Okres:	2024-10-01 - 2025-02-14	Aktualnie rejestracja jest zamknięta - nikt nie może się rejestrować. szczegóły... Wybrany podział planu: tygodniowy cykl przedmiotu Przejdź do planu PN WT ŚR CZ PT
Typ zajęć:	Laboratorium, 15 godzin więcej informacji Wykład, 15 godzin więcej informacji
Koordynatorzy:	(brak danych)
Prowadzący grup:	(brak danych)
Lista studentów:	(nie masz dostępu)
Zaliczenie:	Przedmiot - Ocena Wykład - Ocena
Skrócony opis:	Celem przedmiotu jest przedstawienie podstawowych pojęć związanych z uczeniem ze wzmocnieniem. W ramach zajęć studenci poznają podstawowe algorytmy i modele uczenia ze wzmocnieniem, nauczą się kiedy ich stosowanie jest właściwe i jak należy interpretować ich wyniki, w szczególności w kontekście rosnącej popularności tego typu narzędzi. W trakcie trwania przedmiotu studenci nauczą się samodzielnie projektować i implementować algorytmy uczenia ze wzmocnieniem, a także przygotowywać środowiska do ich uruchamiania. Część praktyczna odbywa się z wykorzystaniem języka programowania Julia. Wykład zakłada wcześniejsze ukończenie przedmiotu Zaawansowane Modelowanie Symulacyjne i Statystyczne Reguły Decyzyjne.
Pełny opis:	Przedstawienie pojęć związanych z uczeniem ze wzmocnieniem. Omówienie działania modeli tej klasy i sytuacji, w których takie modelowanie jest właściwym narzędziem do rozwiązywania problemów analitycznych. Nauczenie samodzielnego projektowania i implementacji algorytmów uczenia ze wzmocnieniem przy wykorzystaniu języka Julia. Wykład zakłada wcześniejsze ukończenie przedmiotu Zaawansowane Modelowanie Symulacyjne i Statystyczne Reguły Decyzyjne.
Literatura:	Literatura podstawowa: Sutton R. S., Barto A. G. (2020), Reinforcement learning: an introduction, second edition (http://incompleteideas.net/book/RLbook2020.pdf) Kochenderfer M. J., Wheeler T. A. i Wray K. H. (2022), Reinforcement learning: an introduction, second edition (https://algorithmsbook.com/files/dm.pdf) Rao A., Jelvis T. (2022), Foundations of Reinforcement Learning with Applications in Finance, first edition (http://web.stanford.edu/class/cme241/) Literatura uzupełniająca: Kamiński: The Julia Epress, http://bogumilkaminski.pl/files/julia_express.pdf; B. Kamiński, P. Szufel: Julia 1.0 Programming Cookbook, https://www.packtpub.com/application-development/julia-10-programming-cookbook; Publikacje własne: Przemysław Szufel, Bartosz Pankratz, Anna Szczurek, Bogumił Kamiński, Paweł Prałat , Vehicle Routing Simulation for Prediction of Commuter?s Behaviour, W: JOURNAL OF ADVANCED TRANSPORTATION,2022; Bogumił Kamiński, Bartosz Pankratz, Reliable signals and the sexual selection: agent-based simulation of the handicap principle,W: red. T. M. K. Roeder, P. I. Frazier, R. Szechtman, S. E. Chick, T. Huschka, E. Zhou, Proceedings of the 2016 Winter Simulation Conference ,2016
Uwagi:	Kryteria oceniania: egzamin tradycyjny-pisemny: 0.00% egzamin testowy: 0.00% kolokwium: 0.00% referaty/eseje: 0.00% ocena z ćwiczeń: 0.00% inne: 0.00% projekty: 100.00% studia przypadków: 0.00% prezentacje indywidualne lub grupowe: 0.00%

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Szkoła Główna Handlowa w Warszawie.