Table of Contents

B0M33BDT – Technologie pro velká data

Důležité odkazy

Prerekvizity

Pro absolvování předmětu je potřeba umět aspoň na základní úrovni:

Doporučujeme si nosit vlastní notebook, který se dokáže připojit na internet. Je potřeba mít aplikace na SCP připojení (např. WinSCP) a na SSH připojení (např. PuTTY). Hodí se i inteligentní textový editor pro psaní skriptů v Pythonu a SQL (Notepad++, PSPad apod.).

Rozvrh

Výuka probíhá vždy ve středu v budově na Karlově náměstí.

První týden semestru je lichý, dále viz níže. Rozdělení do paralelek na cvičení a supercvičení je věcí vaší dohody. Kapacita místnosti na cvičení je 22 míst, ostatní pak musí sedět vedle, na židli bez stolečku nebo se k někomu vmáčknout. V minulých letech bylo na první paralelce přeplněno a na druhé relativně volno.

Sylabus a plán semestru

Domácí úkoly

Klasifikační požadavky (zápočet, zkouška)

Zápočet je možné získat jedním ze dvou způsobů (navzájem se nevylučují):

Zápočtový test proběhl ve středu 8. 1. Aktuální náhradní termín je 15. 1. od 9.15 v E-307.
Obsahem testu budou praktické úlohy na zpracování dat pomocí Hadoopu a jeho technologií. Každý pracuje samostatně, ale je povoleno používat vlastní i internetové podklady: zápisky, vzorové kódy z přednášek i cvičení, Google, Stack Overflow apod.

Zkouška proběhne formou pohovoru s přednášejícím na teoretická témata přednesená během semestru. Počet bodů získaných pro zápočet má vliv na známku u zkoušky.

Kontakt

Jan Hučín

Literatura

Hadoop: The Definitive Guide, 4th Edition, by Tom White