DIGIRES COVID-19 Corpus v.1 DIGIRES COVID-19 Corpus v.1 consists of 351 Lithuanian media articles about COVID-19 pandemics. The corpus was compiled from various internet public Lithuanian media sources. Corpus contains 351 files in plain text format (TXT) with UTF-8 encoding. Each article consists of a title (in the 1st line) and an article body. Files are classified into two subcorpora: 1) "unrealiable" that contains articles, which were identified by professional fact checkers as fake news; 2) "reliable" that contains trustworthy articles. Subcorpus Files Word tokens Reliable: 175 67902 Unreliable: 176 118747 Total 351 186649 -- DIGIRES COVID-19 tekstynas v.1 DIGIRES COVID-19 tekstyną (v.1) sudaro 351 lietuvių kalbos žiniasklaidos straipsniai apie COVID-19 pandemiją. Tekstynas sudarytas iš įvairių internetinių viešųjų Lietuvos žiniasklaidos šaltinių. Tekstyną sudaro 351 paprasto tekstinio formato failai (TXT) su UTF-8 koduote. Kiekvienas straipsnis yra atskirame faile, kurį sudaro pavadinimas (1-oje eilutėje) ir straipsnio turinys. Failai suskirstyti į du patekstynius: 1) „nepatikimi“ (unreliable) straipsniai, kuriuos profesionalūs faktų tikrintojai identifikavo kaip melagingus; 2) „patikimi“ (reliable) straipsniai. Patekstynis Failai Žodžiai Reliable: 175 67902 Unreliable: 176 118747 Viso 351 186649