Warning
This page is located in archive. Go to the latest version of this course pages. Go the latest version of this page.

Načtení .dsv souboru do slovníku

Abyste mohli jednoduše pracovat s daty v souboru truth.dsv, bude asi vhodné data z něj načíst do slovníku. V něm pak snadno pro každý soubor zjistíte, jaké číslo či písmeno je na příslušném obrázku.

Načtení vlastními silami

Načtení dat do slovníku není těžké, můžete si to zkusit naprogramovat sami:

  • otevřít soubor pro čtení
  • pro každý řádek souboru:
    • odstraňte bílé znaky na začátku a konci řádku pomocí str.strip()
    • zavolejte metodu str.split(':'), která řádek rozdělí na dvě části podle dvojtečky
    • ve slovníku založte klíč z části 1 a jako hodnotu mu přiřaďte část 2.

Využití modulu ''csv''

Python obsahuje standardní modul csv pro snazší práci se soubory typu .csv, .dsv a podobnými. Ten lze k načtení truth.dsv souboru použít podobně, jako je popsáno zde. Jen budete patrně muset správně určit oddělovač, tj. nastavit parametr delimiter=“:” u csv.reader().

Nicméně konkrétně v tomto případě si využitím modulu .csv moc práce neušetříte (v porovnání s tím, když si načítání naprogramujete sami, viz výše).

courses/b3b33kui/semestralni_ulohy/5_ml/readcsv.txt · Last modified: 2023/04/28 17:53 by xposik