Table of Contents

Lab 07 - Dynamická alokace 2/2

Úkoly

Náhodná permutace načtených řádků

Výchozí řešení z 6. cvičení (předpokládané)

Předpokládáme, že máme implementované funkce pro tisk načtení jednoho řádku.

int print(char *str); //return error value
char* read(int *error);
S řešením chybové návratové hodnoty
enum {
   ERROR_OK = EXIT_SUCCESS,
   ERROR_IN = 100,
   ERROR_MEM = 101,
   ERROR_OUT = 102,
};

Dále předpokládáme návrhy funkcí pro tisk a načtení řádků.

int print_lines(size_t n, char **str);
char** read_lines(size_t *n, int *error);
void free_lines(size_t n, char ***str);

Implementace funkcí print_lines a free_lines je relativně přímočará.

int print_lines(size_t n, char **str)
{
   int ret = ERROR_OK;
   if (str) {
      for (size_t i = 0; i < n && ret == ERROR_OK; ++i) {
         ret = print(str[i]);
      }
   }
   return ret;
}

Ve funkci free_lines chceme nastavovat hodnotu ukazatele alokované paměti na prokazatelně neplatnou adresu NULL, proto předáváme ukazatel na datový typ proměnné, který je v našem případě ukazatel na ukazatel na char, proto tři hvězdičky.

void free_lines(size_t n, char ***str)
{
   if (str && *str) {
      for (int i = 0; i < n; ++i) {
         free((*str)[i]);
      }
      free(*str);
   }
   *str = NULL;
}

Implementace programu (rozšíření řešení z 6. cvičení)

Naše výchozí implementace funkce main může vypadat například následovně.

int main(void)
{
   int ret = ERROR_OK;
   size_t n = 0;
   char **lines = read_lines(&n, &ret);
   unsigned int a[n];
   init(n, a);
   permute(n, a);
   for (int i = 0; i < n && ret == ERROR_OK; ++i) {
      ret = print(lines[a[i]]);
   }
   free_lines(n, &lines);
   return ret; 
}

Základní strategie návrhu funkce read_lines() vychází z funkce read, kde jsme postupně načítali znaky a v případě potřeby rozšiřovali paměť voláním realloc. Při načítání řádků postupujeme podobně, jen místo volání getchar() budeme volat funkci read(), která může skončit chybou, kdy vrací hodnotu NULL a indikaci chyby v proměnné error. Rámcově tak implementace funkce může vypadat následovně.

char** read_lines(size_t *n, int *error)
{
   sizet_t size = INIT_SIZE; //Počáteční velikost dynamicky alokovaného pole ukazatelů na jednotlivé řádky.
   char **lines = malloc(...);
   *n = 0;
   *error = ERROR_OK; //Předpokládáme, že vše proběhne v pořádku, případné chyby budeme indikovat přepsání hodnoty.
   if (lines) {
     char *str; // Ukazatel na načtený řádek
     while ((str = read(error))) {
        if (*n == size) {
           ... //Re-alokace paměti, nebo opuštění cyklu (případně uvolnění paměti a nastavení příznaku chyby
        }
        lines[*n] = str; //Řádek se provede pouze pokud je dostatečné místo v lines.
        *n = *n + 1;
     }
     ... /// Ukončení načítání a případně uvolnění paměti pokud nastala chyba načítání 
   } else {
     *error = ERROR_MEM; //První malloc se nezdařil. Proměnná lines je NULL.
    }
   return lines; 

V programu budeme dále uvažovat, že počet řádků může být výrazně vyšší než je velikost zásobníku pro uložení permutace celých čísel (např. v Linuxu je zásobník typicky 8 MB), proto výchozí implementaci s VLA nahradíme dynamickou alokací.

Stále předpokládáme, že počet řádku bude menší než je maximálního hodnota unsigned int.

int main(void)
{
   int ret = ERROR_OK;
   size_t n = 0;
   char **lines = read_lines(&n, &ret);
   unsigned int *a = malloc(n * sizeof(unsigned int));
   if (a) {
      init(n, a);
      permute(n, a);
      for (int i = 0; i < n && ret == ERROR_OK; ++i) {
	 ret = print(lines[a[i]]);
      }
      free(a);
   } else {
      ret = ERROR_MEM;
   }
   free_lines(n, &lines);
   return ret; 
}

Testovaní programu

Program opět můžeme otestovat při definování omezené paměti.

clang -c rand.c -o rand.lnx
ulimit -v 5000
./rand.lnx <in-long.txt; echo $?
101

Redukce alokované paměti na skutečně využitou kapacitu

Při dynamické re-alokaci jsme využili relativně přímočarou strategii rozšiřování alokované paměti na dvojnásobek předchozí hodnoty. Určitě lze zvolit jinou strategii, případně nemusíme řešit, pokud jsou alokovaná pole (řádky) relativně malé. Přesto můžeme na závěr načtení řádku paměť redukovat, podobně jako pole ukazatelů na dynamicky alokované řetězce. Při návrhu funkce můžeme uvažovat, že takovou funkci použijeme jak pro řádky, tak pro pole ukazatelů. Pokusíme se proto funkci reduce() navrhnout obecně.

která v případě, že požadavek na paměť size je menší než aktuálně alokovaná paměť na adrese ptr, paměť uvolní, tj. odřízne konec.

void* reduce(size_t size, void *ptr);

void* reduce(size_t size, void *ptr)
{
   void *ret = NULL;
   if (size > 0 && ptr) { //
      ret = realloc(ptr, size);
   }
   if (!ret) {
      fprintf(stderr, "ERROR: Calling reduce() failed!\n");
      exit(ERROR_MEM);
   }
   return ret; // Because of if (!t), it always return non-NULL.
}

Další procvičovaná témata

Teoretická příprava

Úlohy k procvičení

  1. Napište funkci, která formátovaně vypíše obecné pole reálných čísel.
  2. Napište funkci, která vypočte směrodatnou odchylku z prvků zadaného pole.
  3. Napište funkci, která zajistí načtení n prvků z klávesnice do pole a toto pole předá do volající funkce. Počet prvků bude zadán jako parametr funkce.
  4. Společně s cvičícím si předveďte použití Valgrindu pro diagnostiku přístupů do paměti a správné alokace.
  5. Aplikujte funkce pro výpis a výpočet směrodatné odchylky na pole získané načítací funkcí. Nezapomeňte na dealokaci pole při ukončení programu!
  6. Upravte předchozí funkci tak, aby byla schopna načíst libovolnou posloupnost reálných čísel do pole ukončenou vhodnou zarážkou nebo lépe pomocí EOF, umí-li to vaše konzole.
  7. Upravte předchozí kód tak, aby bylo možné načíst od uživatele více datových řad a pro každou zvlášť spočítat směrodatnou odchylku. Jednoduše to zařídíte tak, že vytvoříte dvourozměrné pole, které ale může mít různé délky řádků. Nezapomeňte zajistit i dealoakaci celého pole!
  8. Vždy kontrolujte program na přístup do paměti a alokaci nástrojem valgrind.

Pointerová aritmetika

  1. Určete výsledek a ověřte programem:

int *up, **uup, array[] = {5, -6, 0, 8, -9, 3, 1, -4};
 
up = array;
uup = &up;
 
printf("array[1] = %d \n", array[1]);
printf("array[1] + 4 = %d \n", array[1] + 4);
printf("(array + 1)[2] = %d \n", (array + 1)[2]);
 
printf("*up = %d \n", *up);
printf("*up + 4 = %d \n", *up + 4);
printf("*(up + 1) = %d \n", *(up + 1));
 
printf("**uup = %2d \n", **uup);
printf("*(*uup + 2) = %2d \n", *(*uup + 2));
printf("**uup + 4 = %2d \n", **uup + 4);