Search
Podklady přednášek pro aktuální akademický rok 2021/2022. Podklady se skládají z promítaných slidů, které jsou také k dispozici ve zkrácených verzích šetrnějších k případnému tisku, bez přechodů mezi snímky a ve formátu čtyř a devíti snímků na stránku.
Podklady tvoří podpůrný materiál a jejich učelem není nahradit vlastní zápisky z přednášky, které jsou prostředkem osvojení si studované problematiky.
Tématicky je náplň přednášek pokryta v knize Stephen G. Kochan: Programming in C (3rd Edition), Sams Publishing, 2005. Před přednáškou je doporučeno pročíst si odkazované kapitoly.
V přednáškách uvedené zdrojové kódy jsou přiloženy v příslušném .zip archivu. Kromě vyzkoušení programů je též vřele doporučeno si složitější úlohy samostatně naprogramovat a přednáškové příklady využít pro inspiraci.
.zip
./
— Jan Faigl 2022/11/23 14:50
Doplnění načítání vstupu
Při načítání vstupu funkcí scanf() lze rozlišit tři případy - úspěšné načtení požadované hodnoty, detekce ukončení vstupu a vstup neodpovídající načítané hodnotě, více viz man 3 scanf.
man 3 scanf
#include <stdio.h> int main(void) { int v; int r; int c = 0; while ((r = scanf("%d", &v)) > 0) { c += 1; } if (r == EOF) { printf("End of file detected, no. of parsed values %i\n", c); } else { printf("Error occur during parsing value no. %i\n", c + 1); } return 0; }
Při interaktivním vstupu z klávesnice lze vstup ukončit kontrolním znakem Ctrl+D (nebo Ctrl+Z na win).
Ctrl+D
Ctrl+Z
— Jan Faigl 2022/10/05 15:12
Dotazy z přednášky
Q: Proč je návratový typ programu (funkce main) int, když maximální hodnota předaná interpretu příkazu pouze 255?
int
Je to dáno historicky. Cčko nelimituje rozsah a definuje int, nicméně zaleží na procesu, který program spouští. V našem případě interpret příkazů. Dokonce je to tak, že GNU bash limituje rozsah na 7-bitů, POSIX shell na 8 bitů a třeba Windows na 32-bit unsigned int. V tomto kontextu stojí za zmínku speciální návratové hodnoty.
Q: Jaká je vnitřní reprezentace typu _Bool?
Norma standardu C uvádí, že dostatečná pro uložení hodnot 0 a 1. Prakticky je to char, tj. jeden byte, viz příklad lec02/bool.c.
char
lec02/bool.c
Q: Jak vytisknu znak '%' nebo '\' ve funkci printf()?
printf()
Jako dvojici znaků, tj.
printf("%% a \\ a následně nový řádek \n");
— Jan Faigl 2022/10/12 20:33
#define BITS 4 //number of bits to print (4 to make it readable) void print_binary(char *prefix, uint8_t n) { printf(prefix, n); int mask = 1<<(BITS-1); // we need to shift 1 to BITS position, thus -1 for (int i = 0; i < BITS; ++i) { putc((n & mask) ? '1' : '0', stdout); mask = mask >> 1; // } printf("\n"); } uint8_t a = 4; print_binary("a dec: %d bin: ", a);
Q: Proč program i po stísku Ctrl+D dále pokračuje v načítání vstupu?
Je to proto, že Ctrl+D bylo stisknuto pro nějaký rozepsaný vstup, který nebyl programu ještě odeslán klávesou Enter, resp. znakem nového řádku. Vstup programu na stdin je v našem případě předáván prostřednictvím emulátoru terminálů, který je ve výchozím nastavení řádkově orientovaný, tj. náš vstup je programu předám po stisku klávesy Enter. Stiskem kombince Ctrl+D vyvoláme předání aktuálního vstupu programu. Pokud je aktuální vstup prázdný, generuje terminál EOF (End Of File), standardní vstup je uzavřen a následně čtení např. funkcí scanf() nebo getchar() vrací hodnotu EOF (-1). Více informací lze nalézt např. v manuálové stránce termios v části Special Characters znak EOF.
Enter
stdin
EOF
scanf()
getchar()
Q: Jak mohu porovnat dva soubory?
Kromě použítí příkazu diff existují další nástroje, např. https://meldmerge.org/, případně konzolový vimdiff nebo grafický gvimdiff editoru vim, více např. vimdiff-nastroj-drsnaku.
diff
vimdiff
gvimdiff
Q: Proč kompilátor hlásí chybu chybějícího znaku nového řádku na konci souboru?
Při kompilaci programu bez znaku konce řádku na konci souboru, např. při kompilaci clang -pedantic -Wall -Werror main.c, dojde k chybě.
clang -pedantic -Wall -Werror main.c
error: no newline at end of file [-Werror,-Wnewline-eof]
Je do dáno historickým rozhodnutím, že neprázdný zdrojový soubor by měl být zakončem znakem nového řádku. Je tak součástí standardu jazyka.
Dobrý důvod proč je vhodné zakončovat soubory koncem řádku je například při použit vložení souborů příkazem preprocesoru #include, který nevkládá nový řádek, přestože to mnoho moderních kompilátorů dělá. Stále však platí, že starší kompilátory s tím mohou mít potíže a může to být velmi těžko odhalitelná chyba. V novém C++11, již tento požadevek není, stále však zůstává pro C99.
#include
V případě VS Code, podobně jako v celé řadě jiných programů, lze chování editor nastavit, např. Insert New Line at the End of Files.
Q: Je možné umístit návěští pro příkaz goto před cyklus?
goto
V zásadě ano, jediným zásadním omezením je pouze v rámci jedné funkce. Dále je nutné, aby za návěštím byl příkaz, například definice proměnné není příkaz. Musí existovat adresa instrukce, na kterou má goto skočit.
int a; // začátek platnosti a outer: for (int i = 0; i < 3; ++i) { goto outer; }
outer: // definice proměnné není příkaz int a; for (int i = 0; i < 3; ++i) { goto outer; }
outer: // po návěští je příkaz ; int a; for (int i = 0; i < 3; ++i) { goto outer; }
Nicméně podstatnou nevýhodou umístění návěští před cyklus je horší čitelnost a tím také vyšší náchylnost k chybě a zacyklení.
— Jan Faigl 2022/10/19 20:15
— Jan Faigl 2022/10/19 20:15 Aktualizace: Oprava slide 28 (návratová hodnota) a slide 38 (pořadí argumentů).
Q: Jak inicializovat hodnoty pole při definici?
Při definici proměnné typu pole můžeme rovnou nastavit jednotlivé prvky a využít tzv. designated initializers. V takovém případě jsou incializované všechny prvky. Ty uvedené na zadanou hodnotu, jinak je nastavena výchozí hodnota 0.
int a[6] = {10, 12, [3] = 3, 5}; //pole a má 6 prvků s hodnotami {10, 12, 0, 3, 5, 0}, tj. nespecifkované prvky mají hodnotu 0. int b[] = {1, 2, 3}; // pole má pouze 3 prvky {1, 2, 3} int c[6] = {1, 2, 3}; // pole má 6 prvků { 1, 2, 3, 0, 0, 0} int d[4] = {}; // pole má 4 prvky incializované na 0, tj. {0, 0, 0, 0}
Načítání hodnot celých čísel funkcí scanf() ve smyčce while:
while
#include <stdio.h> int main(void) { int v; int i = 0; while (scanf("%d", &v) > 0) { printf("%d %d\n", ++i, v); } printf("No. of read values %d\n", i); return 0; }
Skončil v nekonečné smyčce, neboť původní podmínka cyklu
while (scanf("%d", &v)) { ... }
— Jan Faigl 2022/10/26 21:26
— Jan Faigl 2022/10/26 18:0 Aktualizace: Oprava slide 16, void free(pointer);.
void free(pointer);
Q: Snažím se načíst celé číslo do typu unsigned int funkcí scanf() a když dám na vstup celé záporné číslo, např. -10, nejen, že se hodnota načte, ale hodnota je veliká. Jak je to možné?
unsigned int
Minimální kód programu read_unsigned.c může být například:
read_unsigned.c
#include <stdio.h> int main(void) { unsigned int i; int r = scanf("%+u", &i); printf("Return value %i read value %u\n", r, i); return 0; }
Výstup pak například
clang read_unsigned.c && echo "-10" | ./a.out Return value 1 read value 4294967286
man scanf
NAME scanf, fscanf, sscanf, vscanf, vsscanf, vfscanf — input format conversion LIBRARY Standard C Library (libc, -lc) ... u Matches an optionally signed decimal integer; the next pointer must be a pointer to unsigned int. ...
“%u”
integer
unsigned long
'-
— Jan Faigl 2021/11/07 08:48 Aktualizace: Přidání příkladu reprezentace hodnot typu float.
float
— Jan Faigl 2022/11/02 14:48
Doplnění k HW06 “přetypování” dynamického pole na statické pole
V domácím úkolu 6 na matice je povinné zadání možné realizovat pouze s využitím proměnných typu pole (VLA). V zásadě nám stačí postupně načíst dvě matice a spočítat výsledek. Matice můžeme načíst tak, že nejdříve načteme rozměry matice a následně alokujeme matici na zásobníku jako dvourozměrné VLA pole. Problém tak dekomponujeme na funkce pro
Celkově je implementace do cca 150 řádků a méně. Nemusíme řešit alokaci/dealokaci a procvičíme si práci s polem VLA.
Při implementaci volitelného zadání vystačíme se čtyřmi proměnnými pro matice a postupně načítáme matice a co je možné spočítat můžeme rovnou vyčíslit, např. v případě tří matice v součtu můžeme první dvě sečít, v případě násobení můžeme dvě matice rovnou vynásobit. Nicméně zde se nám už může hodit dynamická alokace a funkce pro načtení matice nám přímo alokuje paměť na haldě což je pohodlnější, jen pak nesmím zapomenout na uvolnění paměti voláním free(). Jestliže jsme použili pro povinné zadání VLA pole, nemusíme funkce přepisovat, ale můžeme využít faktu, že pole i vícerozměrné je souvislý blok paměti. Proto pokud alokujeme matici dynamicky jako souvislý blok paměti o velikosti počet řádku krát počet sloupců můžeme využít faktu, že proměnná pole ukazuje na první prvek podobně jako hodnota ukazatele dynamického pole.
free()
void print(int rows, int cols, int m[cols][rows]) { for (int r = 0; r < rows; ++r) { for (int c = 0; c < cols; ++c) { printf("%4d", m[r][c]); } print("\n"); } } ... int *matrix_p = malloc(cols * rows * sizeof(int)); int (*matrix)[cols] = (int (*)[cols]) matrix_p; print(rows, cols, matrix); // s proměnnou matrix můžem pracovat jako s dvojrozměrným polem free(matrix_p);
V případně bonusové úlohy, ale také i volitelného zadání lze s výhodou použít složený typ struct, který bude obsahovat položky definující velikost matice a vlastní data. V tomto případě se dynamické alokaci nevyhneme, proto může být výhodné kromě struktury, implementovat též funkce pro alokaci případně dealokaci. Můžete si též vyzkoušet dynamickou alokaci jako jednorozměrnné pole (souvislý blok paměti) nebo dynamickou alokaci dvourozměrného pole jako pole ukazatelů na dynamické pole hodnot. V tomto případě však nebude matice reprezentována jako souvislý blok paměti a celkově je potřeba také více paměti, tj. rows * sizeof(int*) + rows * cols * sizeof(int), protože pole řádku je pole ukazatelů na int.
struct
rows * sizeof(int*) + rows * cols * sizeof(int)
Q: Je nutné nebo vhodné explicitně typovat ukazatel návratové hodnoty z volání funkce malloc()?
malloc
Vyloženě nutné to v současných verzích Cčka není, přestože pro některé kompilátory (zvláště pak před standarem) to nutné bylo. V současné době je typ void* chápan jako generický ukazatel, jehož přetypování na konktrétní typ ukazatel na proměnné příslušné typu je zřejmé dle typu proměnné a není tak nutné explicitní přetypování uvádět. Jestli je vhodné explicitně přetypovat, tak na to se názory různí. Například v knize S.G.Kochan: Programming in C (3rd Edition), Sams Publishing, 2005 je uváděn malloc vždy s explicitním přetypováním:
void*
int *a = (int*)malloc(10 * sizeof(int));
Naproti tomu v knize K.N. King: C Programming A Modern Approach, Second Edition. W. W. Norton & Company, Inc., 2008 je preferována varianta bez přetypování:
int *b = malloc(10 * sizeof(int));
Obě varianty jsou přípustné, argumenty proti explicitnímu přetypování jsou uváděny například: přehlednější kód a je to zbytečné, neboť dochází k přetypování automaticky. Na druhé straně relativně silné argumenty pro explicitní přetypování uvedené v diskusi http://stackoverflow.com/questions/605845/do-i-cast-the-result-of-malloc jsou například:
You do cast, because:
Je to tak spíše věc osobního vkusu, preferencí, případně používaného kódovacího stylu.
Q: Jak funguje ukazatelová aritmetika v případě void*?
Přičítá se hodnota jednoho bajtu, například pro hodnotu ukazatele void *a = 0x100; bude je hodnota (a+1) rovna 0x101.
void *a = 0x100;
(a+1)
Q: Proč se říká, že reprezentace 0.1 má největší chybu?
V případě reprezentace dle IEEE-754 je strojová přesnost dána rozdílem mezi 1 a dalším reprezentovatelným číslem, která je 2^{-52}, která je v knihovně <float.h> definována jako symbolická konstanta DBL_EPSILON. S využitím např. https://www.h-schmidt.net/FloatConverter/IEEE754.html uvidíme, že hodnota 0.1 je binárně reprezentovaná jako 0-01111011-10011001100110011001101 (znaménko 1 bit, exponent 8 bitů a mantisa 23 bitů), což odpovídá nejbližšímu reprezentovatelnénu číslu 0.100000001490116119384765625. Chyba reprezentace je tak 1.490116119384765625E-9. Například v případě hodnoty 0.15 je chyba reprezentace 5.9604644775390625E-9, takže chyba reprezentace 0.1 není zas tak zásadně velká. Spíše může být překvapivé, proč číslo 0.1 má takovou chybu, když reprezentujeme hodnotu mantisou a exponentem. Důvod hledejme v reprezentaci v soustavě o základu 2. Binární reprezentaci hodnotu 0.1 najdeme dělením 2, jenže brzo zjistíme, že v rozvoji se opakuje 0011, takže přesnost reprezentace je dána počtem bitů v mantise. Proto 0.1 bude reprezentovan0 jinak v případně float než double. Obecně tak při přetypování dojde k chybě a proto není příliš moudré spoléhat na porovnání hodnot necelých čísel operátorem ==. Na druhou stranu, pokud do jedné proměnné double a do druhé hodnoty double přiřadíme stejné číslo, tak pochopitelně bude binární reprezentace identická a operátor == zafunguje podle očekávání. Více o reprezentaci číselných hodnot čekejte v předmětu APO.
<float.h>
DBL_EPSILON
0-01111011-10011001100110011001101
0.100000001490116119384765625
1.490116119384765625E-9
5.9604644775390625E-9
0.1
double
==
Převod 0.1 do dvojkové soustavy (desetiná čísla dělíme 2^{-i} kde i je desetinná část což odpovídá násobení 2). 0.1 * 2 = 0.2 -> 0 0.2 * 2 = 0.4 -> 0 0.4 * 2 = 0.8 -> 0 0.8 * 2 = 1.6 -> 1 0.6 * 2 = 1.2 -> 1 0.2 * 2 = 0.4 -> 0 0.4 * 2 = 0.8 -> 0 0.8 * 2 = 1.6 -> 1 0.6 * 2 = 1.2 -> 1 0.2 * 2 = 0.4 -> 0 ...
— Jan Faigl 2021/12/30 20:32 Aktualizace: Oprava popisu návratové hodnoty fread a fwrite.
fread
fwrite
— Jan Faigl 2022/11/08 20:50 Umístění errno.h
Chybové kódy standardní knihovny C jsou definovány v souboru errno.h, umístění souboru s definicí chyb je však na různých systémch různé. V unixovových systém se jedná zpravidla o /usr/include/errno.h případně /usr/include/sys/errno.h, popis jednotlivých konstant a hodnot lze také najít např. v man errno. V distribucích Linuxu je situace trošku složitější, neboť umístění záleží na konkrétní distribuci, např. lP5oGIqdWEU
errno.h
/usr/include/errno.h
/usr/include/sys/errno.h
man errno
Konkrétní soubor můžeme najít například příkazem
grep -R 17 /usr/include/**/errno*.h /usr/include/asm-generic/errno-base.h:#define EEXIST 17 /* File exists */ /usr/include/asm-generic/errno.h:#define EUCLEAN 117 /* Structure needs cleaning *
jehož výstup nám napoví, že na tomto konkrétním Linuxu jsou rozděleny chybové kódy do souborů errno-base.h (obsahující základní kódy) a errno.h obsahující rozšířené kódy, tj. kódy s vyšší hodnotou.
errno-base.h
Dále je většinou v Linuxu standardní knihovna libc realizována jako GNU libc (glibc ), což přináší některé zajímavé funkce , které na druhou stranu nejsou dostupné na jiných OS, nelinuxového typu, např. OS X.
GNU libc
Q: Je nějaké omezení na hloubku rekurzivního volání?
Ano, při volání funkce se minimálně ukládá na zásobník adresa odkud funkci voláme, aby mohlo dojít k návratu z volání funkce. Dále se při každém volání mohou vytvářet na zásobníku lokální proměnné. Tedy omezení je dáno velikostí zásobníku. Omezení si můžeme vyzkoušet následujícím programem.
#include <stdio.h> void printValue(int v); int main(void) { printValue(1); } void printValue(int v) { printf("value: %i\n", v); printValue(v + 1); }
a spuštěním s omezenou velikostí zásobníku
ulimit -s 1000; ./a.out | tail -n 3 value: 31730 value: 31731 Segmentation fault
a s větší velikostí.
ulimit -s 10000; ./a.out value: 319816 value: 319817 Segmentation fault
V obou případech končí volání chybou. Ve druhém případě došlo k hlubšímu zanoření. Zotavení z chybějícího místa na zásobníku je velmi náročné, narozdíl od dynamické alokace. Výchozí hodnota zásobníku je nastavana na relativně dostačující velikost pro běžné programy. Nicméně v případě rekurzivního řešení je dobré pamatovat, že místo na zásobníku není neomezené. Proto je vždy vhodné rozumět úloze a konkrétním (typickým) vstupům a prostředí. Například na základě velikosti vstupu můžeme odhadnout, potřebnou velikost zásobníku a případně uživatele informovat. Asi nejhorší případ je, když program padá a netušíme proč tomu tak je.
— Jan Faigl 2022/11/23 14:47 Jak úsporně napsat dynamickou alokaci bez dvojího zápisu typu proměnné od Ondřeje T.
int *array = malloc(100 * sizeof *array);
sizeof
*array
— Jan Faigl 2022/11/23 14:47
while (!feof(f) && !exit) { -> while (!exit) { if (g->num_edges == g->capacity) { if (g->num_edges == g->capacity) { enlarge_graph(g); enlarge_graph(g); } } edge_t *e = g->edges + g->num_edges; edge_t *e = g->edges + g->num_edges; while (!feof(f) && g->num_edges < g->capacity) { -> while (g->num_edges < g->capacity) {
feof()
TRUE
— Jan Faigl 2022/12/07 15:17
— Jan Faigl 2022/12/10 23:30 Aktualizace: Přidání tdijkstra binárky pro OS X (intel and arm).
— Jan Faigl 2017/12/23 08:09 Aktualizace: Zjednoušení návratové hodnoty funkce dijkstra_solve() a zpřehlednění podmínky v pq_down().
dijkstra_solve()
pq_down()
— Jan Faigl 2018/01/08 08:48 Aktualizace: tdijkstra verze 2.3.6. - fix segfault při pokusu testovat řešení většího grafu než je vstupní graf
— Jan Faigl 2018/01/08 08:48 Aktualizace: tdijkstra verze 2.3.7. - fix návrat 0 při chybě
— Jan Faigl 2022/12/03 23:48 Dotazy z přednášky
Q: Jak se používá fflush()?
fflush()
Funkce int fflush(FILE *stream) slouží k předání dat bufferu (vyrovnávací paměti) operačnímu systému (OS), např. při nastavení bufferu souboru (streamu/proudu) funkcí (setbuf()). Nemění stav souboru, data jsou předána nižší zapisovací funkci. OS může data dále bufferovat.
int fflush(FILE *stream)
setbuf()
Volání funkce int fsync(int fd) z knihovny unistd.h je systémové volání, které dává pokyn OS, aby data byla zapsaná na fyzické zařízení. Funkce pracuje s fd – celočíselným file deskriptorem, který je možné získat z proudu funkcí int fileno(FILE *stream) ze standardní knihovny stdio.h.
int fsync(int fd)
unistd.h
fd
int fileno(FILE *stream)
stdio.h
— Jan Faigl 2022/12/14 13:16
— Jan Faigl 2022/09/08 17:17
Zkouškový test Např. systémy pro správu verzí * prezentace: b0b36prp-lec14-slides.pdf * zkrácená verze: b0b36prp-lec14-handout.pdf * zkrácená verze 2×2: b0b36prp-lec14-handout-2x2.pdf * zkrácená verze 3×3: b0b36prp-lec14-handout-3x3.pdf