Načtení .dsv souboru do slovníku

Abyste mohli jednoduše pracovat s daty v souboru truth.dsv, bude asi vhodné data z něj načíst do slovníku. V něm pak snadno pro každý soubor zjistíte, jaké číslo či písmeno je na příslušném obrázku.

Načtení vlastními silami

Načtení dat do slovníku není těžké, můžete si to zkusit naprogramovat sami:

  • otevřít soubor pro čtení
  • pro každý řádek souboru:
    • odstraňte bílé znaky na začátku a konci řádku pomocí str.strip()
    • zavolejte metodu str.split(':'), která řádek rozdělí na dvě části podle dvojtečky
    • ve slovníku založte klíč z části 1 a jako hodnotu mu přiřaďte část 2.

Využití modulu ''csv''

Python obsahuje standardní modul csv pro snazší práci se soubory typu .csv, .dsv a podobnými. Ten lze k načtení truth.dsv souboru použít podobně, jako je popsáno zde. Jen budete patrně muset správně určit oddělovač, tj. nastavit parametr delimiter=“:” u csv.reader().

Nicméně konkrétně v tomto případě si využitím modulu .csv moc práce neušetříte (v porovnání s tím, když si načítání naprogramujete sami, viz výše).

courses/b3b33kui/semestralni_ulohy/5_ml/readcsv.txt · Last modified: 2023/04/28 17:53 by xposik