====== Cvičení 11: Objekty, halda, asociativní pole ====== ==== Úkol 1: Genealogie (Objekty dokončení) ==== * Využijte následující třídu pro reprezentaci rodinných vztahů


class Person:
    def __init__(self, name, sex):
        self.name = name
        self.sex = sex   
        self.children = []  
        self.parents = []   # parents of this node
        self.partner = None   # partner (=husband/wife of this node)

    def addChild(self, node):
        self.children.append(node)

    def addParent(self, node):
        self.parents.append(node)
        
    def setPartner(self, node):
        self.partner = node

    def __repr__(self):
        s = "Female" if self.sex == 'F' else "Male" 
        return self.name + " " + s

* Každá osoba může mít více potomků a max. jednoho partnera (manžela/manželku) * Třída by měla obsahovat: * Seznam potomků, odkaz na rodiče, a partnera * Metody pro manipulaci s těmito prvky (např. addChild, setPartner ..) * Vytvořte objekt Tree - genealogický strom, který bude obsahovat seznam všech lidí a bude umět přidávat lidi i vztahy mezi nimi. * Objekt Tree otestujte přidáním 4 objektů: dva partnery a dvě děti. * Otestujte, zda byly vytvořeny správné vazby, tj. aby objekty děti ukazovaly na rodiče a naopak. * Napište funkce pro: * nalezení všech vnuků dané osoby * nalezení všech vnuček dané osoby * nalezení všech babiček dané osoby * Rozšiřte předchozí kód o načítání ze souboru: * na každém řádku je jeden záznam * záznam pro rodiče-děti: ''P name1 name2 sex1 sex2'' značí že osoba ''name1'' je rodičem osoby ''name2''. ''sex1'' a ''sex2'' označují pohlaví těchto osob (buď F nebo M) * záznam pro partnery: ''M name1 name2 sex1 sex2'' značí že osoby ''name1'' a ''name2'' jsou partneři, ''sex1'' a ''sex2'' jsou opět F nebo M Vstupní soubor family.txt:


M Jana Jan F M
P Jana Martin F M
P Jana Robert F M
P Robert Gabriel M M
P Robert Oleg M M
P Robert Ondrej M M
P Martin Jiri M M
P Martin Rudolf M M
P Jan Petra M F
P Jan Uxana M F
P Uxana Klara  F F
P Uxana Jakub F M
P Uxana Adam F M
P Petra Alex F M
P A C M M
P A D M F
P D K F F
P C J M M 
P C I M F
P C H M M
P B E F F
P B F F M 
P B G F F

Schéma rodiny ve family.txt: * Červeně: females * Modrá hrana: partneři {{courses:b3b33alp:cviceni:family.png?800|}} ===== Prémie navíc: zobrazení přes dot format ===== Uložení načtených dat do '[[ https://en.wikipedia.org/wiki/DOT_(graph_description_language) | Dot ]]' souboru, který lze pak vykreslit do png nástrojem **dot** z balíku nástrojů [[http://www.graphviz.org/|Graphviz]]:


dot -Tpng family.dot  > family.png

Příklad family.dot:


digraph G {
Jana[ color=red];
Jana->Martin [label="child"];
Jana->Robert [label="child"];
Jana->Jan[color=blue; penwidth=4];
Jan[ color=green];
Jan->Petra [label="child"];
Jan->Uxana [label="child"];
Jan->Jana[color=blue; penwidth=4];
Martin[ color=green];
Martin->Jiri [label="child"];
Martin->Rudolf [label="child"];
Martin->Jana [style=dashed];
...
}

==== Binární halda ==== [[https://en.wikipedia.org/wiki/Binary_heap | Binární halda ]] je binární stromová datová struktura. Je tvořena uzly, které mají max. dva potomky (levý a pravý potomek) (odtud přídavné jméno binární), pričemž potomek je opět uzel. Její důležitou vlastností je, že: * hodnota každého uzlu je **rovna nebo menší** než hodnoty jejich potomků. * Pokud je tato vlastnost splněna tak platí, že prvek v tzv. kořenu stromu obsahuje **nejmenší** prvek mezi všemi prvky. * **V tomto cvičení budeme předpokládat tuto variantu.** * Takové haldě se někdy říká min-halda. Binární haldu lze samozřejmě realizovat i s opačnou vlastností: * hodnota každého uzlu je **rovna nebo větší** než hodnoty jejich potomků. * Pokud je tato vlastnost splněna tak platí, že prvek v tzv. kořenu stromu obsahuje **největší** prvek mezi všemi prvky. * Takové haldě se říká max-halda. Použití binární haldy: * Pro realizaci prioritní fronty, v důsledku toho např. pro hledání cest v grafech, mapách, plánování pohybu robotů {{courses:b3b33alp:cviceni:heap.png?400|}} === Binární halda: vyjmutí nejmenšího prvku === Předpokládejme, že máme existující binární haldu. Při vyjmutí prvky stačí vzít prvek v kořeni stromu, neboť ten již z definice obsahuje nejmenší hodnotu mezi všemi uzly. Po odebrání prvku je ale nutné zbylé prvky přeskupit a určit nový kořen haldy. Postup je: * Vyjmout prvek z kořene haldy ( prvek s nejmenší hodnotou ) * Vzít poslední prvek v poslední úrovni a přesunout na pozici kořene. * Nyní je třeba nahrat prvky v haldě tak, aby byla splněna vlastnost min-haldy. Jelikož budeme začínat od kořene a procházet strom směrem dolu, říká se tomuto postupu tzv. bubble-down. ==Bubble-down:== * Předpokládejme, že jsme v uzlu $U$. * Porovnáme hodnotu $U$, $U$.left a $U$.right. Pokud je splěna vlastnost min-haldy (tj. hodnota $U$ je menší nebo rovna hodnotám jejích potomků), končíme. * Pokud ne, vybereme toho potomka, který je menší než $U$. Vyměníme hodnotu $U$ s tímto potomek. * Pokračujeme bubble-down z tohoto potomka. * Algoritmus končí, pokud už jsme narazili na uzel bez potomka. === Binární halda: vložení prvku === Předpokládejme, že máme existující binární haldu. Vložení prvku se provede takto: ===Bubble-up=== * Vložíme prvek na poslední nejpravější místo v poslední úrovni. * Porovnáme hodnotu tohoto prvku s jeho rodičem. Pokud je splněna vlastnost haldy (tj. u min-haldy: hodnota prvku je větší nebo rovna hodnotě jeho rodiče), pak končíme. * Pokud ne, vyměníme hodnotu prvku za hodnotu rodiče a opakujeme tento postup od změněného rodiče. Tento algoritmus se nazývá bubble-up, jelikož při něm procházíme haldu ze spodní úrovně nahoru. ==== Realizace binární haldy na poli ==== Nejjednodušší realizací binární haldy je implementaci na poli. Použijeme jednoduchý trik: * Nechť uzel má v poli index $i$. * Jeho levý potomek má v poli index $2i+1$. * Jeho pravý potomek má v poli index $2i+2$. {{courses:b3b33alp:cviceni:heap1.png?200|}} * Jaký je index rodiče, pokud má potomek index v poli $i$? === Implementace haldy z přednášky ===


# Implementace haldy
#
# http://interactivepython.org/runestone/static/pythonds/Trees/BinaryHeapImplementation.html
# Jan Kybic, 2016

class MinHeap:
  """ binarni halda __init__ konstruktor """
  def __init__(self):
     self.heap = [] # indexujeme od nuly

  def bubble_up(self,i):
    """ probubla prvek i nahoru, zajisti splneni podminek haldy """
    while i>0:
      j=(i-1)//2 # index rodice
      if self.heap[i] >= self.heap[j]:
        break
      self.heap[j],self.heap[i]=self.heap[i],self.heap[j]
      i = j
  
  def insert(self,k):
    """ vloz prvek do haldy """    
    self.heap+=[k]
    self.bubble_up(len(self.heap)-1)

  def peek(self):
    """ vrati nejmensi prvek """
    return self.heap[0]

  def size(self):
    """ vrati pocet prvku v halde """
    return len(self.heap)

  def is_empty(self):
    """ je halda prazdna? """
    return self.size()==0 
  
  def bubble_down(self,i):
     """ probublej prvek dolu """
     n=self.size()
     while 2*i+1 < n:
        j=2*i+1 # zjisti index mensiho syna
        if j+1 < n and self.heap[j] > self.heap[j+1]:
          j+=1
        if self.heap[i]>self.heap[j]:
          self.heap[i],self.heap[j]=self.heap[j],self.heap[i]
        i=j
                  
  def pop(self):
    """ odebere nejmensi prvek a uprav haldu """
    element=self.heap[0]
    self.heap[0]=self.heap[-1]
    self.heap.pop() # smaz posledni prvek
    self.bubble_down(0)
    return element

==== Úkol 2: implementace funkce delete === Implementujte metody pro odebrání prvku na pozici i z binární haldy: * Metodu pojmenujte ''delete(i)'' * metoda dále smaže tento prvek z haldy * ošetřete tuto metodu tak, aby ji bylo možné volat i na prázdnou haldu, případně pokud je i větší než velikost haldy Pomocí této funkce smažte z haldy vytvořené z pole všechna sudá čísla (Nejdříve haldu vytvořte se všemi čísly a pak smažte všechna sudá čísla z haldy):


pole=[10,21,7,11,31,6,1,-11,31,42,-12,80,25,-7,-12,9,14]

==== Úkol 3: Karty v haldě ==== * Upravte implementaci haldy tak, aby byla realizována min-halda s kartami ve formátu cvičení 7 příklad 6. * Vytvořte haldu z následujících karet:


cards = [[0, 'Q'], [2, '6'], [1, 'K'], 
         [1, '8'], [2, '10'], [2, '4'], 
         [3, '4'], [0, '4'], [1, '3'], 
         [2, '5'], [0, 'K'], [3, 'A'], 
         [1, 'J'], [0, '3'], [0, '9']]

* V cvičení 8 jsme pro porovnání karet využívali funkci index a dvojího porovnání (nejdříve barvu a pak hodnotu). Nyní definujte pořadí pomocí asociativního pole a operací sčítání a násobení. ==== Úkol 4: Asociativní pole a římská čísla ==== * Využijte následující asociativní pole k převodu římského čísla na dekadické číslo:


conv={'I':1,'V':5,'X':10,'L':50,'C':100,'D':500,'M':1000}

* Převeďte na číslo např. MCMXCIX ===== Domácí úkol ===== Tento domácí úkol bude ohledně šifrování algoritmem RSA. Algoritmus RSA rozlišuje **veřejný** klíč a **soukromý** klíč. Pro oba klíče je potřeba mít dvě prvočísla //p//, //q//, která budou v našem případě "malá", $p< 2^{20}$ a $q < 2^{20}$. Základem každého klíče je číslo $n = p \cdot q$. Druhé významné číslo pro definici klíčů je hodnota funkce $\varphi(n) = (p-1)(q-1)$. Pro skutečně velká //n// (čísla o velikosti $2^{2048}$) je pro výpočet funkce $\varphi$ nutné najít prvočísla //p//,//q//, což je v současné době prakticky neřešitelné. **Veřejný** klíč je určen dvěma čísly $(n, e)$, kdy pro //e// platí $nsd(e, \varphi(n)) = 1$ (funkce ''nsd()'' značí největšího společného dělitele), tedy čísla //e// a $\varphi(n)$ jsou nesoudělná. Pokud již máme definovaný veřejný klíč, pak **soukromý** klíč je definován dvěma čísly $(n, d)$, kde $d = e^{-1} \in \mathbb{Z}_{\varphi(n)}$. Číslo //d// lze spočítat pomocí rozšířeného Euklidova algoritmu. Rozšířený Euklidův algoritmus při hledání největšího společného dělitele najde i dvě čísla $\alpha$ a $\beta$, pro která platí $nsd(e, \varphi(n)) = \alpha \cdot e + \beta \cdot \varphi(n)$. I přes to, že čísla $\alpha$ nebo $\beta$ mohou být záporná, lze je použít k výpočtu //d// z čísel //e// a $\varphi(n)$. Pokud chce Bob poslat zprávu Alici, tak zprávu zakóduje veřejným klíčem Alice, tedy pomocí dvou čísel $(n, e)$, která Alice zveřejnila. Pokud tedy Bob chce zakódovat číslo //a//, pak s využitím veřejného klíče Alice $(n,e)$ spočte číslo $b = a^e \in \mathbb{Z}_n$. Dešifrování privátním klíčem $(n, d)$ se provede obdobně, pro kód //b// se spočte číslo $c = b^d \in \mathbb{Z}_n$. Číslo //c// je rovno původnímu číslu //a//. Tedy pro zakódování čísla a = 1634234218 veřejným klíčem $(n = 1015282856477, e = 914394312011)$ je potřeba spočítat $(1634234218^{914394312011}) \% 1015282856477$. K výpočtu této mocniny je nutné použít algoritmus rychlého mocnění. Algoritmus pro rozšířený Euklidův algoritmus i algoritmus rychlého mocnění můžete nastudovat třeba v této [[https://ksp.mff.cuni.cz/kucharky/teorie-cisel/| kuchařce celých čísel]]. ==== Lehká varianta:==== * Napište program **sifruj.py**, který jako parametr dostane veřejný klíč Alice, tedy dvě čísla //n// a //e//. Dále si program přečte ze standardního vstupu jeden řádek textu a tento text zakóduje následujícím způsobem: * ze čtyř po sobě jdoucích znaků 'abcd' textové zprávy vypočtěte číslo ''x = ( (ord(a)*256 + ord(b))*256 + ord( c ) )*256 + ord(d)'' * pokud by vstupní řetězec neobsahoval 4 znaky, pak se doplní nulovými znaky jejichž hodnota ord je rovna 0 * na výstup se zapíše šifra čísla x, tedy hodnota $(x^e)\%n$ * Př.: pro řetězec ''pes kocka slon'' se postupně zakódují podslova ''pes '', ''kock'', ''a sl'' a ''on'' a šifry těchto 4 řetězců se vypíší na výstup * Vstup programu: * sys.argv[1] - obsahuje číslo //n// z veřejného klíče Alice * sys.argv[2] - obsahuje číslo //e// z veřejného klíče Alice * input() - vrátí řetězec, tedy zprávu, kterou máte zašifrovat veřejným klíčem * Výstup programu: * celá čísla oddělená mezerami, každé číslo odpovídá šifře pro 4 znaky vstupní zprávy === Příklady === * Po spuštění programu ''python3 sifruj.py 1015282856477 914394312011'' na standardni vstup:


ahoj, jak se mate?

vygeneruje výstup:


647324878004 696320697151 743669304106 886127950532 29493035087

Zdůvodnění: Text ''ahoj, jak se mate?'' se převede na čísla 1634234218, 740321889, 1797288805, 544039284, 1698627584, která se veřejným klíčem zašifrují na uvedené kódy. * Po spuštění programu ''python3 sifruj.py 940600625927 1031749'' na standardni vstup:


Uz je to jasnejsi?

vygeneruje výstup:


220880649389 164682853469 771838036852 276855377185 166690468278

Zdůvodnění: Text ''Uz je to jasnejsi?'' se převede na čísla 1434067050, 1696625775, 543842675, 1852140147, 1765736448, která se veřejným klíčem zašifrují na uvedené kódy. * Po spuštění programu ''python3 sifruj.py 854757130933 339289'' na standardni vstup:


Slava! Mate to hotove.

vygeneruje výstup:


237393968415 4435742947 83633252887 427633018709 332159983823 451324201656

Zdůvodnění: Text ''Slava! Mate to hotove.'' se převede na čísla 1399611766, 1629560909, 1635018016, 1953439848, 1869901686, 1697513472, která se veřejným klíčem zašifrují na uvedené kódy. ==== Těžká varianta:==== * Napište program ''attack.py'', který dostane číslo //n// z veřejného klíče a zprávu zakódovanou veřejným klíčem Alice. Víte, že číslo //e// z veřejného klíče Alice je větší než $2^{18}$ a menší než $2^{20}$. Program ''attack.py'' dekóduje zprávu a na standardní výstup vypíše tuto dekódovanou zprávu. O vstupní zprávě víte, že obsahuje alespoň jedno z následujících slov:


Tento predmet proste nejlepsi genialni

* Vstup programu: * sys.argv[1] - číslo //n// z veřejného i privátního klíče Alice * input() - zpráva zakódovaná veřejným klíčem Alice * Výstup programu: * dekódovaná zpráva - jeden řádek textu. * Poznámka: * Nejdříve si naprogramujte lehkou úlohu, až budete umět zprávu kódovat, pak obdobným způsobem můžete zprávu dekódovat po výpočtu čísel $\varphi(n)$, $e$ a $d$. * Pro dekódování je nutné vyzkoušet všechny hodnoty //e// která jsou větší než $2^{18}$ a menší než $2^{20}$ a pro která platí $nsd(e, \varphi(n)) = 1$ === Příklad === * Při spuštění programu ''python3 attack.py 865149046207''


352566354542 704277294015 506632666345 494928356066 824421528359 325069048254 839239812833 536096809854 278474205010

Výstupem programu bude:


Tento predmet je proste genialni!!

protože $p=932119$ a $q=928153$, pak $\varphi(n)=865147185936$ a $e=305867$ a $d=696989570531$. Tyto hodnoty jsou použity pro dekódování zprávy. * Při spuštění programu ''python3 attack.py 983293323431''


842181607974 871844623718 433288674900 698725571210 783570923028 327222551412 311846871040 379330380505 84902973359 15529751204

Výstupem programu bude:


Na ALP je nejlepsi zkusit si nove veci.

protože $p=1025147$ a $q=959173$, pak $\varphi(n)=983291339112$ a $e=599311$ a $d=538813418959$. Tyto hodnoty jsou použity pro dekódování zprávy. * Při spuštění programu ''python3 attack.py 952371739433''


727632176438 36244668976 814914613242 835595208469 315384816693 483612417694 400515700122 599076310518 552651231198 183702874860

Výstupem programu bude:


Bavi vas proste programovat v Pythonu3?

protože $p=1011817$ a $q=941249$, pak $\varphi(n)=952369786368$ a $e=766663$ a $d=247562256631$. Tyto hodnoty jsou použity pro dekódování zprávy.