----------------------------------------------------------- ANGLŲ-LIETUVIŲ LYGIAGRETUSIS KIBERNETINIO SAUGUMO TEKSTYNAS 2.0 versija 2024-12-31 ----------------------------------------------------------- APRAŠYMAS Anglų-lietuvių lygiagretusis tekstynas DVITAS v2 susideda iš originalių anglų kalba parašytų tekstų apie kibernetinį saugumą ir jų vertimų į lietuvių kalbą. Tekstai sukurti laikotarpyje nuo 2006 m. iki 2021 m. 1 tekstyno versija kartu su anglų-lietuvių palyginamuoju tekstynu buvo sukurti projekto „Dvikalbis automatinis terminų atpažinimas“ reikmėms. 2-oji versija yra 1-osios versijos atnaujinimas. Duomenų rinkinys susideda iš 107 sulygiuotų failų TMX formate, kurie yra pusiau automatiškai sulygiuoti sakinio lygmenyje ir 214 nelygiuotų pradinių failų (107-anglų kalbos ir 107 lietuvių kalbos). Tekstyno dydis yra 1,97 mln. žodžių (EN-1,08 mln. ir LT-0,88 mln), 53792 sulygiuoti segmentai. VERSIJOS v1 - 80 failų (id. nr.: 001-205) sudaryti DVITAS projekto metu (https://clarin.vdu.lt/xmlui/handle/20.500.11821/46) v2 - 27 failai (id. nr.: 206-230) atnaujinta versija su metaduomenimis sudaryta Jolantos Mickevič META DUOMENYS meta-data-EN.tsv - tabuliacijomis askirtas metaduomenų failas anglų kalba (File, CELEX, Title, Author, Form, Year, Status, Words, Website, URL) meta-data-LT.tsv - tabuliacijomis askirtas metaduomenų failas lietuvių kalba (File, CELEX, Title, Author, Form, Year, Status, Words, Website, URL) DUOMENYS Koduotė: UTF-8 Tipas: paprastas tekstas (.txt) ir vertimo atminties formatas (angl. translation memory exchange, .tmx) Failai (anglų k., EN): 107 Failai (lietuvių k., LT): 107 Failai (TMX): 107 Segmentai: 53792 Žodžių sk. (EN): 1083926 Žodžių sk. (LT): 884993 Žodžių sk. (viso): 1968919 PROJEKTAS Pavadinimas: Dvikalbis automatinis terminų atpažinimas Laikotarpis: 2020-2022 Nr.: P-MIP-20-282 https://klc.vdu.lt/dvitas/lt Vytauto Didžiojo universitetas Mykolo Romerio universitetas