Pozvánka na předmět Datová analytika pro studenty hum. a soc. věd (zápis prodloužen do 25.2.)

Ústav formální a aplikované lingvistiky zve studenty a studentky do semestrálního kurzu datové analytiky, který pořádájí spolu se Sorbonne a Varšavskou univerzitou jako projekt 4EU+. Kurz se koná v LS, každé úterý 10:40-12:10 on-line, od 15. 2. Pracovním jazykem je angličtina. Máme celkem 25 míst pro studenty ze všech tří univerzit.
Ve výuce se neprogramuje, ale studenti se seznámí s „klikacím“ nástrojem na tvorbu datových vizualizací a infografik (Tableau).
Vyzkouší si zpracování sbírky korespondence francouzského slavisty a polyglota A. Mazona (1. pol. 20. století) a  budou prohledávat a analyzovat svědectví migrantů v datovém souboru „I am a migrant“.
Zatímco korpus svědectví o migraci je veřejně přístupný a poměrně známý, Mazonova korespondence dosud čeká na zpracování ve formě bitmapových souborů faksimilí ve francouzštině, ruštině, češtině, němčině a několika dalších jazycích. Mnoho Mazonových korespondenčních přátel patřilo k ruské elitě, která prchla před ruskou revolucí a osídlila evropské metropole, hojně také Prahu. Mazon si psal s i diplomaty a důstojníky umístěnými v exotických zemích, jakož i s osobnostmi českého kulturního a intelektuálního života („Vážený příteli, na kterou z těchto pařížských škol máme poslat naši Bóžu?“). Je to tedy sbírka velice rozmanitá a zajímavá!
Studenti se naučí zacházet s programy pro rozpoznávání rukopisného textu (pokročilejší OCR) Transkribus a PERO, seznámí se s autoritami pro „wikifikaci“ pojmenovaných entit (např. VIAF) a vybudují strojově čitelný textový korpus automaticky označkovaný NLP nástroji. Ukážeme jim, jak takový korpus prohledávat dotazovacím jazykem CQL (používaným např. Českým národním korpusem). Dozvědí se něco o strojovém učení. Právní specialistka z Varšavy je seznámí s úskalími sdílení výzkumných dat, sociolog M. Hájek bude analyzovat mediální diskurz – a k tomu všemu studenti ještě dostanou půlroční bezplatný přístup do excelentního e-learningového systému „opravdové“ datové analytiky a programování DataCamp.
Studenti svými domácími úkoly přispějí k zpřístupnění Mazonovy sbírky odborné veřejnosti a osvojí si základy práce s Tableau, které se jim budou hodit i mimo akademickou sféru (např. ve veřejné správě nebo v byznysu).
Vítáni jsou všichni, obzvlášť studenti schopní číst francouzsky a rusky (těchto dat je v kolekci Mazonovy korespondence nejvíc).
Prosím, šiřte tuto pozvánku po všech pracovištích UK, kde by studenti mohli mít zájem. Těšíme se na pestrý a zábavný semestr a doufáme, že náš kurz studenty zbaví strachu z nových technologií a že je časem potkáme i v programovacích kurzech!
Sylabus je k nahlédnutí zde:  https://ufal.mff.cuni.cz/courses/npfl134
Úvod > Příležitosti > Pozvánka na předmět Datová analytika pro studenty hum. a soc. věd (zápis prodloužen do 25.2.)