Klasszikus drámáink is kutathatóak mesterséges intelligenciával

2021.11.09.
Klasszikus drámáink is kutathatóak mesterséges intelligenciával
Izgalmas program zajlott az ELTE-n már a Magyar Tudomány Ünnepe első napján: a Bölcsészettudományi Karon bemutatták a Digitális Örökség Nemzeti Laboratórium harmadik saját fejlesztésű irodalmi adatbázisát, a Drámakorpuszt. 

2020 őszén kezdte meg munkáját a Digitális Örökség Nemzeti Laboratórium az ELTE koordinációjával. Az Innovációs és Technológiai Minisztérium által kezdeményezett program keretében létrejött, intézményközi összefogásban működő laboratórium célja, hogy kidolgozza a nemzeti kulturális örökség mesterséges intelligencia alapú feldolgozásának, kutatásának és oktatásának, valamint a lehető legszélesebb körű közzétételének módszertanát.

tavasszal bemutatott Verskorpusz és Regénykorpusz után az ELTE Digitális Bölcsészet Tanszék 2021. november 3-án vitte a nagyközönség elé legújabb fejlesztését, a Drámakorpuszt. Az új adatbázis a magyar drámairodalom szövegeit teszi elérhetővé és kereshetővé a felhasználók számára. A mesterséges intelligenciát is használó adatbázisokkal – így ezzel is – a műveket a legtöbbet használt főnevek alapján lehet szűrni, ami a korábbiaktól eltérő összefüggések feltárulásához vezethet.

A Magyar Tudomány Ünnepének keretében rendezett konferenciát Frank Fischer, a DraCor (Drama Corpora Project) vezetője nyitotta meg, ecsetelve a digitális bölcsészetben rejlő előnyöket.

A korpuszok forradalmasítják az irodalomról alkotott tudásunkat

– írta a bemutató résztvevőihez intézett levelében Bartus Dávid, a kar dékánja is. – Segítségükkel új belső összefüggéseket tárhatunk fel az irodalomban, ami az oktatástól kezdve a művek színreviteléig elősegítheti kultúránk sokszínű értelmezését és kreatív felhasználását.

Az interneten szabadon elérhető irodalmi korpuszok folyamatosan bővülnek, jelenleg a Regénykorpusz 81 író 100 regényét, a Verskorpusz több mint 40 költő tízezret is meghaladó számú versét tartalmazza. A Drámakorpusz különlegessége, hogy a 40 klasszikus dráma mellé kortárs mű, Szakonyi Károly Adáshiba című darabja is bekerült.

A bemutatón a 90 éves Kossuth- és József Attila-díjas író is megjelent. A Digitális Irodalmi Akadémia alapító tagja elmondta: egyből elfogadta a hozzájárulására irányuló felkérést, és fantasztikus szellemi teljesítménynek tartja a digitális bölcsész akadémikusok munkáját.

A rendszer működését Szemes Botond, az ELTE DH munkatársa szemléltette, előadásából kiderült például, hogy Madách Az ember tragédiája című művében leggyakrabban olyan elvont fogalmakat szerepeltet, mint a „társadalom” és az „eszme”, Lucifer legfőbb kulcsfogalmai pedig a „szépen”, a „kérd”, a „tagadás” és az „ördög”. A kutató elmondta: Szakonyi Károly darabja mellett a későbbiekben más kortárs drámákat is bevonnak az adatbázisba.

Az új korpuszba kerülő drámák elsődleges forrása a Magyar Elektronikus Könyvtár. A szövegeket TEI XML formátumba kódolva, részletes annotációval ellátva egységesítették; ez a formátum egyrészt a szövegek felhasználóbarát megjelenítését, másrészt a keresőfelület működését teszi lehetővé.

Drámakorpusz az európai darabok feldolgozására létrehozott Drama Corpora Project (DraCor) része, amely az említettekhez hasonló módszerekkel kívánja kereshetővé és összehasonlíthatóvá tenni a kontinens drámairodalmát. A program keretében már készítettek okostelefonokra letölthető appot és kártyajátékot is. 

Forrás: elte.hu