courses:bd6b36pjc:ukoly:semestralka [CourseWare Wiki]

Semestrální práce

Protože upload systém nepodporuje vlákna (jedno odevzdání má vždy alokováno pouze jedno jádro) a protože bychom od vás rádi viděli větší, samostatně vyrobený program, tento úkol se odevzdává mailem a my ho budeme bodovat manuálně.

Zadání

Zadání je stanoveno na základě domluvy studenta s cvičícím. Součástí zadání jsou i stručné požadavky na funkcionalitu programu.

Student	Téma semestrální práce
Bouša Zdeněk	Nejkratší cesty mezi všemi vrcholy
Čičmanec Martin	Grafové algoritmy
Jelínek David	K-means
Mareš Petr	Maticové algoritmy→ Násobení matic
Müller Matěj	Conway's Game of Life
Navrátil Tomáš	Konvexní obal množiny bodů v rovině
Nekovářová Tereza	Word Count
Nenál Marek	Determinant matice
Penčáková Karolína	Minimální kostra
Šeliga Jan	Autocorrect
Štorek David	Výpočet Mandelbrotovy množiny a Juliových množin
Tetour David	Problém batohu
Venclů Marie	Řešení soustav lineárních rovnic
Yazykov Vladyslav	Výpočetní geometrie
Zavadil Karel	Problém obchodního cestujícího
Zelenková Michaela	Determinant matice

Obecné požadavky

Všechny odevzdané práce musí

Obsahovat implementaci s jedním i více vlákny.
- Mezi oběma implementacemi jde volit pomocí přepínače na příkazové řádce.
Porovnat obě implementace.
- Implementace používající více vláken musí být rychlejší než implementace s jedním vláknem.
- Implementace musí být specializované pro případ běhu s více vlákny / pouze jedním vláknem.
Bez problémů projít kontrolou nástroji jako je Valgrind, Helgrind, …
Program musí být přenositelný napříč architekturami a operačními systémy. Je zakázáno používat rozšíření jazyka podporovaná pouze některými kompilátory. Je zakázáno přímo používat rozhraní WINAPI a POSIX. (Zalinkovat knihovnu `pthread` do programu je povoleno, viz níže.)
Program poskytuje neinteraktivní rozhraní, tj. přebírá vstupy z příkazové řádky, vstupní data ze souboru či ze standardního vstupu
Program implementuje přepínač –help – vypíše použití a skončí
Program neakceptuje neznámé přepínače (vypíše chybu)

Odevzdání, termín a hodnocení

Semestrální práci je nutno odevzdat cvičícímu e-mailem. Tento e-mail musí obsahovat:

zdrojové soubory,
soubory popisující postup stavby programu: CMakeLists.txt, Makefile, nebo projektové soubory IDE (.vcxproj, apod.)
vzorová vstupní data (pokud je program přijímá)
soubor readme (prostý textový dokument, markdown, případně slušně vypadající PDF), který obsahuje
popis vašeho zadání,
popis vaší implementace,
výsledky běhu programu a naměřené časy při porovnání jedno- a více- vláknové verze

Pokud je potřeba vysvětlit složité součásti návrhu (velká funkce, komplikovaná třída, složitá synchronizace), není nutné psát detaily do readme, raději je pište do komentářů v kódu.

Termín odevzdání je konec 3. zkouškového týdne, neděle 4. února 2018. Odevzdání je možné i 4. týden zkouškového období, ale již bude aplikována penalizace ve výšce poloviny bodů z možného bodového maxima.

Za semestrální práci je možné získat až 30 bodů, z nichž je potřeba alespoň 15 k získání zápočtu. Za velmi kvalitní práci může cvičící přidat i bonusové body nad 30.

Příklady zadání

Protože občas může být těžké vymyslet si vlastní zadání, uvádíme několik možných příkladů. Pozor na to, že i pokud si vyberete z následujícího seznamu, zadání vám musí schválit cvičící.

Maticové algoritmy

V závislosti na zvoleném algoritmu či metodě paralelizace můžete (po domluvě) uvažovat vstupní data ve speciálním tvaru (např. pouze čtvercové matice; matice, které mají délku strany mocninu dvou, …).

Násobení matic

Násobení matic je jedna z výpočetně nejzajímavějších operací v lineární algebře. Zaprvé protože je velmi časté, zadruhé protože je to operace, která dobře naimplementovaná opravdu může dosáhnout limitu výpočetní rychlosti procesoru (narozdíl třeba od sčítání vektorů, které jsou omezeny rychlostí přístupu do paměti).

Očekáváme, že naimplementujete něco sofistikovanějšího než 3 for loopy dle definice maticového násobění.

Výpočet determinantu čtvercové matice

Determinant lze jednoduše počítat dle definice nebo Laplaceovou expanzí, v praxi tyto algoritmy ale nejsou vhodné kvůli své časové složitosti. Efektivní implementace jsou založené na Gaussově eliminační mětodě (LU dekompozice). Očekáváme, že váš program bude schopen pracovat s maticemi 1000×1000 v rozumném čase (tj. řádově vteřiny, max. desítky vteřin). Aplikace na vstupu dostane čtvercovou matici, na výstupu vypíše hodnotu jejího determinantu.

Řešení soustav lin. rovnic

Další z velmi důležitých úloh lineární algebry. Aplikace na vstupu dostane rozšířenou matici soustavy a na výstup vypíše vektor jejího řešení, případně zprávu o tom, že řešení neexistuje. Pokud je řešení nekonečně mnoho, program vypíše jedno partikulární řešení a bázi lineárního prostoru řešení přidružené homogenní soustavy. K implementaci je nejvýhodnější použít Gaussovu eliminaci se zpětným dosazením.

Grafové algoritmy

Aplikace načte vstupní graf ze souboru, příp. standardního vstupu v libovolném vámi zvoleném formátu. Doporučujeme použít jednoduchý textový formát, např.

<počet-vrcholů> <počet-hran>
0 <počet hran z vrcholu 0> <cílový vrchol 1> <délka 1. hrany> <cílový vrchol 2> <délka 2. hrany> ...
1 <počet hran z vrcholu 1> <cílový vrchol 1> <délka 1. hrany> <cílový vrchol 2> <délka 2. hrany> ...
...

Pokud byste si chtěli grafy vizualizovat, je možné použít nástroj dot z toolkitu Graphviz nebo C++ knihovnu OGDF.

Minimální kostra (minimum spanning tree)

Minimální kostry mají široké využití - od návrhů tras elektrického vedení, přes vytváření routovacích tabulek v počítačových sítích až po shlukování (clustering) bodů v analýze dat či detekce útvarů v počítačovém vidění. Doporučujeme použít Borůvkův algoritmus. Na výstupu programu bude seznam vrcholů minimální kostry a její cena nebo přímo popis celého grafu pro Graphviz, s barevně odlišenými vrcholy v kostře.

Nejkratší cesty mezi všemi vrcholy (shortest paths)

Další z velmi dobře prozkoumaných grafových algoritmů, které mají využití jak ve fyzickém světě, tak ve světě počítačů. Na výstupu je seznam dvojic vrcholů s délkou minimální cesty mezi nimi (pokud existuje) a vypsanou cestou.

Problém obchodního cestujícího

Problém obchodního cestujícího (Travelling salesman problem) spočívá v nalezení nejkratší (nejlevnější) hamiltonovské cesty v orientovaném grafu, tj. takové cesty, která obsahuje každý vrchol právě jednou. Je to NP těžký problém, který se při použití metody větví a mezí dobře paralelizuje. Možný algoritmus je popsaný v materiálech k předmětu Logika a grafy v sekci Hledání nejkratší hamiltonovské cesty. Na výstupu bude posloupnost vrcholů cesty a její cena nebo přímo popis celého grafu pro Graphviz, s barevně zvýrazněnými hranami v cestě.

k-means (clustering)

K-means je jednoduchý iterativní algoritmus pro shlukování množiny bodů do k skupin (kde k je známé předem) s jednoduchou paralelizací. Vstupem je množina bodů (standardní vstup nebo soubor) a počet skupin (parametr na příkazové řádce), na výstupu vrací seznam bodů a jejich příslušnost do skupiny. Výsledek je vhodné vizualizovat výstupem do obrázku SVG. Pro snadnou vizualizaci doporučujeme pracovat ve 2D.

Výpočetní geometrie (computational geometry)

Úlohy z oblasti výpočetní geometrie se zabývají geometrickými výpočty v rovině a prostoru. Protože náročnost soudobých grafických aplikací stále stoupá, jsou známy dobře paralelizovatelné algoritmy.

Konvexní obal množiny bodů v rovině (convex hull)

Konvexní obal (convex hull) množiny bodů si lze jednoduše představit jako nejmenší konvexní mnohoúhelník, uvnitř kterého leží všechny body množiny. Jako konkrétní algoritmus je možné zvolit třeba Quickhull. Vstupem pro aplikaci bude textový soubor se souřadnicemi bodů, výstupem pak bude seznam vrcholů konvexního obalu. Doporučujeme si napsat jednoduchý generátor vstupních dat a program či skript pro převod vstupních a výstupních dat do obrázku SVG pro snadnou vizualizaci a ověření správnosti řešení.

Kombinatorické problémy

Knapsack Problem solver

Knapsack problem (též známý jako problém batohu) je NP-těžký problém z kombinatorické optimalizace, který se ale dá překvapivě dobře paralelizovat. Vstupní data doporučujeme generovat o požadované velikosti, aby bylo možné vyzkoušet různé velikosti problémů.

Nezapomeňte, že výstupem by měla být nejenom optimální hodnota batohu, ale i jeho optimální složení.

Word Count souborů

Typický problém s jednoduchou paralelizací. Na vstupu je sada souborů, na výstupu je seřazený výpis obsažených slov a jejich četnost.

Krom slov se dají počítat i tzv. n-gramy.

Autocorrect

Další častý problém. Uživatel něco napíše a my chceme vědět, jestli to opravdu napsat chtěl, nebo jestli se přehmátl na klávesnici. Samozřejmě, bez technologie pro čtení myšlenek to perfektně nejde, ale můžeme porovnat napsané slovo se slovníkem, a pokud v něm není, zkusit najít nějaké blízké slovo.

Na vstupu je slovník a slovo, nebo celá sada slov. Na výstupu je buďto samotné slovo, nebo množina nejbližších, a tudíž pravděpodobně zamýšlených slov. Slovník můžete mít uložený v arbitrárním formátu.

Příklad průvodního Readme

# π-estimator

π-estimator je program pro aproximaci π za pomocí Monte Carlo simulace. V jedné iteraci je vygenerován náhodný bod z [0, 1]x[0, 1] a zjistí se, jestli vygenerovaný bod spadá do jednotkového kruhu. Po vygenerování N bodů se dá spočítat π jako 4 * <množství bodů uvnitř kruhu> / N.

## Implementace
Implementace pro jedno vlákno je triviální, vícevláknová implementace pak vydělí množství iterací množstvím spuštěných vláken a nechá každé vlákno provést implementaci pro jedno vlákno. Množství vláken je určeno dle množství jader počítače, jejich synchronizace je triviální, přes atomickou proměnnou.

Množství iterací je předáno jako druhý argument. Pokud druhý argument není předán, pak je použita defaultní hodnota 10M iterací.

## Měření
Měřil jsem na 4 jádrovém i5-6600K CPU taktovaném na 3.5 GHz s vypnutým HT. Výsledekem bylo, že jsem naměřil 458ms pro jednovláknovou variantu a 116ms pro 4-vláknovou variantu, došlo tedy ke zhruba 4x zrychlení.

Výstup z měření
```
ST inside points: 7853087
MT inside points: 7853934
PI value: 3.14159
ST PI time needed: 458ms value: 3.14123
MT PI time needed: 116ms value: 3.14157
```

Příklad odevzdaného kódu

Pozor, ukázka v příloze je těsně na úrovni zápočtu, ne-li pod ní.

Rady

Kompilace programů používající vlákna na Linuxu

Pokud pracujete na Linuxu a vidíte chybu s textem podobným undefined reference to `pthread_create', váš program nepůjde zlinkovat, pokud kompilátoru nepředáte -pthread, třeba takto:

clang++ -std=c++14 -g -Wall -Wextra -pthread main.cpp

Kompilace programů používající vlákna v CLion IDE

Clion používá CMake a CMakeLists.txt pro kontrolu kompilace. Jako kompilátor ale používá buďto g++ nebo Clang, a tudíž je mu též potřeba říct, aby linkoval vlákna. Nejjednodušší způsob je v CMakeLists.txt změnit set(CMAKE_CXX_FLAGS “${CMAKE_CXX_FLAGS} -std=c++14”) na set(CMAKE_CXX_FLAGS “${CMAKE_CXX_FLAGS} -std=c++14 -pthread”).

Generátor náhodných čísel

Pokud potřebujete generátor náhodných čísel a jeho rychlost není až tak důležitá, doporučujeme Mersenne Twister ze standardní knihovny. Minimální příklad použití pro získání double v rozsahu (-1000, 1000):

double get_random_double() {
	static std::mt19937 mt{ std::random_device{}() };
	static std::uniform_real_distribution<> dist(-1000, 1000);
	return dist(mt);
}

Pokud je rychlost velmi důležitá, budete muset použít něco rychlejšího, například std::minstd_rand.

Měření uběhnutého času

Součástí zadání je porovnat čas běhu vašeho algoritmu využívajícího více vláken, s časem běhu jednoduchého algoritmu, který vlákna nepoužívá. K tomu vám poslouží hlavička <chrono>, která se používá takto:

template <typename TimePoint>
std::chrono::milliseconds to_ms(TimePoint tp) {
    return std::chrono::duration_cast<std::chrono::milliseconds>(tp);
}
 
 
int main() {
    auto start = std::chrono::high_resolution_clock::now();
    // do work
    auto end = std::chrono::high_resolution_clock::now();
    std::cout << "Needed " << to_ms(end - start).count() << " ms to finish.\n";
}

Table of Contents