Szkoła Główna Handlowa w Warszawie - Centralny System UwierzytelnianiaNie jesteś zalogowany | zaloguj się
katalog przedmiotów - pomoc

Real-Time Analytics

Informacje ogólne

Kod przedmiotu: 222891-D Kod Erasmus / ISCED: (brak danych) / (brak danych)
Nazwa przedmiotu: Real-Time Analytics
Jednostka: Szkoła Główna Handlowa w Warszawie
Grupy: Major courses for AAB - masters
Przedmioty obowiązkowe na programie SMMD-ADA
Punkty ECTS i inne: 3.00 (zmienne w czasie)
zobacz reguły punktacji
Język prowadzenia: angielski
Skrócony opis:

1. Modelling, learning and prediction in batch mode (offline learning) and incremental (online learning) modes. Problems of incremental machine learning.

2. Data processing models in Big Data. From flat files to Data Lake. Real-time data myth and facts

3. NRT systems (near real-time systems), data acquisition, streaming and analytics.

4. Algorithms for estimating model parameters in incremental mode. Stochastic Gradient Descent

5. Modern streaming application architectures

6. Preparation of the microservice with the ML model for prediction use.

7. Processing structured and unstructured data in Python. Function and Object-oriented connection to RDB and NoSQL

8. Aggregations and reporting in NoSQL databases (MongoDB)

9. Basics of object-oriented programming in Python in linear and logistic regression, neural network analysis using the sklearn, TensorFlow and Keras.

10. IT streaming architecture. Apache Spark and Jupyter notebook environment using docker tool. Analysis of data

Pełny opis:

Making the right decisions based on data and their analysis in business is a process and daily. Modern methods of modelling by machine learning (ML), artificial intelligence (AI), or deep learning not only allow better understanding of business, but also support making key decisions for it. The development of technology and increasingly new business concepts of working directly with the client require not only correct but also fast decisions. The classes offered are designed to provide students with experience and comprehensive theoretical knowledge in the field of real-time data processing and analysis, and to present the latest technologies (free and commercial) for the processing of structured data (originating e.g. from data warehouses) and unstructured (e.g. images, sound, video streaming) in on-line mode. The course will present the so called lambda and kappa structures for data processing into data lake along with a discussion of the problems and difficulties encountered in implementing real-time modelling for large amounts of data. Theoretical knowledge will be gained (apart from the lecture part) through the implementation of test cases in tools such as Apache Spark, Nifi, Microsoft Azure and SAS. During laboratory classes student will benefit from fully understand the latest information technologies related to real-time data processing.

Literatura:

Literatura podstawowa:

1. Frątczak E., red. "Modelowanie dla biznesu, Regresja logistyczna, Regresja Poissona, Survival Data Mining, CRM, Credit Scoring". SGH, Warszawa 2019.

2. Frątczak E., red., "Zaawansowane metody analiz statystycznych", Oficyna Wydawnicza SGH, Warszawa 2012.

3. Rubach P., Zając S., Jastrzebski B., Sulkowska J.I. , Sulkowski P., "Genus for biomolecules", Web Server, Nucleic Acids Research, 2019.

4. Zając S., Piotrowski E. W., Sładkowski J., Syska J., "The method of the likelihood and the Fisher information in the construction of physical models" Phys. Status Solidi B vol. 246 No 5 (2009)

5. Indest A., Wild Knowledge. Outthik the Revolution. LID publishing.com 2017.

6. Real Time Analytic. "The Key to Unlocking Customer Insights & Driving the Customer Experience". Harvard Business Review Analytics Series, Harvard Business School Publishing, 2018.

7. Svolba G., "Applying Data Science. Business Case Studies Using SAS". SAS Institute Inc., Cary NC, USA, 2017.

8. Ellis B. "Real-Time Analytics Techniques to Analyze and Visualize Streaming data." , Wiley, 2014

9. Familiar B., Barnes J. "Business in Real-Time Using Azure IoT and Cortana Intelligence Suite" Apress, 2017

Literatura uzupełniająca:

1. Frątczak E., "Statistics for Management & Economics" SGH, Warszawa, 2015

2. Simon P., "Too Big to IGNORE. The Business Case for Big Data", John Wiley & Sons Inc., 2013

3. Nandi A. "Spark for Python Developers", 2015

4. Frank J. Ohlhorst. "Big Data Analytics. Turning Big Data into Big Money". John Wiley & Sons. Inc. 2013

5. Russell J. "Zwinna analiza danych Apache Hadoop dla każdego", Helion, 2014

6. Todman C., "Projektowanie hurtowni danych, Wspomaganie zarządzania relacjami z klientami", Helion, 2011

Efekty uczenia się:

Wiedza:

Know the history and philosophy of data processing models

Know the types of structured and unstructured data

Know the possibilities and areas of real-time data processing

Know the theoretical aspects of lambda and kappa structure

Be able to choose the IT structure for a given business problem

Understand the business needs of making decisions in a very short time

Umiejętności:

Distinguish between structured and unstructured data types

Be able to prepare, process and save data generated in real time

Understand the limitations arising from time processing by devices and IT systems

Apply and construct a system for real-time processing

Be able to prepare reporting for real-time processing system

Kompetencje społeczne:

Formulate an analytical problem along with its IT solution

Consolidate the ability of independent supplementing theoretical and practical knowledge in the field of programming, modelling, new information technologies using real-time analysis.

Metody i kryteria oceniania:

egzamin tradycyjny-pisemny: 0.00%

egzamin testowy: 40.00%

egzamin ustny: 0.00%

kolokwium: 20.00%

referaty/eseje: 40.00%

ocena z ćwiczeń: 0.00%

inne: 0.00%

Zajęcia w cyklu "Semestr zimowy 2020/21" (zakończony)

Okres: 2020-10-01 - 2021-02-19
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 20 godzin więcej informacji
Wykład, 10 godzin więcej informacji
Koordynatorzy: (brak danych)
Prowadzący grup: (brak danych)
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie
Wykład - Egzamin

Zajęcia w cyklu "Semestr letni 2020/21" (zakończony)

Okres: 2021-02-20 - 2021-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 20 godzin więcej informacji
Wykład, 10 godzin więcej informacji
Koordynatorzy: (brak danych)
Prowadzący grup: (brak danych)
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie
Wykład - Egzamin

Zajęcia w cyklu "Semestr zimowy 2021/22" (w trakcie)

Okres: 2021-10-01 - 2022-02-18
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 20 godzin więcej informacji
Wykład, 10 godzin więcej informacji
Koordynatorzy: (brak danych)
Prowadzący grup: (brak danych)
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie
Wykład - Egzamin

Zajęcia w cyklu "Semestr letni 2021/22" (jeszcze nie rozpoczęty)

Okres: 2022-02-19 - 2022-09-30
Wybrany podział planu:


powiększ
zobacz plan zajęć
Typ zajęć: Laboratorium, 20 godzin więcej informacji
Wykład, 10 godzin więcej informacji
Koordynatorzy: (brak danych)
Prowadzący grup: (brak danych)
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Egzamin
Laboratorium - Zaliczenie
Wykład - Egzamin
Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Szkoła Główna Handlowa w Warszawie.