Vedci vytvorili technológiu, ktorá pomôže určiť autora textu

Vedci vytvorili technológiu, ktorá pomôže určiť autora textu Reprofoto EP

Vedci z Filozofickej fakulty Univerzity Palackého v Olomouci vyvinuli technológiu, ktorá dokáže pomocou rozboru textu určiť jeho autora, jeho psychické rozpoloženie či sociálne prostredie. Pri svojom výskume analyzovali frekvenciu slov v textoch spisovateľov, politikov i vrahov a získané poznatky využili pri tvorbe postupu pre profilovanie osôb. Technológiu je možné využiť v prispôsobení internetového obsahu konkrétnemu užívateľovi, reklame, personalistike, psychológii, kriminalistike aj v oblasti bezpečnosti štátu. Novinku už eviduje patentový úrad Spojených štátov, povedal novinárom Dan Faltýnek z katedry všeobecnej lingvistiky FF UP.

 Odborníci z katedry všeobecnej lingvistiky FF UP sa frekvenčnými analýzami textu zaoberajú už niekoľko rokov, metóda sa používa napríklad pri určení autorstva písaného slova. Doteraz sa vedci zameriavali na slová s vyššou frekvenciou výskytu, autori novej metódy zvolili odlišný postup. „S kolegami sme zistili, že podľa nízko frekventovaných, ale pravidelne rozmiestnených, opakujúcich sa slov možno autora spoznať tiež. A čo viac, ešte s vyššou mierou istoty. Už niekoľko rokov sa teda zameriavame na opačné spektrum, na zvláštnu skupinu slov v danej slovnej zásobe konkrétneho človeka," uviedol Faltýnek.

Metóda je podľa lingvistky Martiny Benešovej založená na tom, že odborníci v texte hľadajú akýsi slovný odtlačok, ktorý je možné použiť pri analýze a určení autora textu. Napríklad z rozboru mnohých textov Václava Havla vyplynulo, že kládol dôraz na slovo "konečne".

"Postupom času sme vyvinuli technológiu, ktorá nám umožňuje nájsť nízkofrekventované kľúčové slová, ktoré sú spoločne s dôrazom na postoj rečníka k určitej téme odtlačkom autora," podotkol Faltýnek.

Objav je podľa neho prevratný, pretože doterajšie metódy takúto vysokú istotu autorstva textu neprinášali. Olomouckým vedcom teraz vďaka novej technológii stačí analyzovať iba 200 až 500 slov, aby mohli s určitou mierou presnosti dokázať autorstvo. Pokiaľ majú k dispozícii približne 1500 slov, tak sú schopní autorstvo zaručiť s veľmi vysokou mierou pravdepodobnosti. Predtým si boli istí až po analýze 6000 slov.

Nová technológia podľa Benešovej dokáže extrahovať profil ľudí. Opakovanie určitých slov môže poukázať na psychický stav človeka alebo jeho sociálne prostredie. Vedcov napríklad šokovali výsledky analýzy manifestu amerického vraha, z ktorej vyplynul jeho motív aj miesto následného násilného činu.

Novú technológiu je možné využiť v personalistike, on-line psychoterapii, súdnictve alebo pri komunikácii s ohrozenými skupinami. Svoje miesto nájde aj v personalizovanej reklame aj v boji proti extrémizmu, terorizmu či dezinformáciám. Možno ju využiť aj na obranu proti personalizácii človeka na internete.

"Najjednoduchším variantom využitia našej technológie bude v dohľadnej dobe aplikácia, ktorá ľuďom umožní dozvedieť sa niečo o sebe a pomôže im v sebarozvoji," povedala Benešová.

Ďalším súčasným trendom je využitie umelej inteligencie na automatické písanie textov. „Na textové technológie umelej inteligencie sa teraz začína spoliehať viac a viac ľudí, príkladom aktuálnej technológie je ChatGPT, od ktorej používatelia očakávajú, že napíše lepšie texty a v kratšom čase. Napríklad Google v tejto súvislosti upozornil, že takto vygenerované texty vedia detekovať a budú to penalizovať," uviedol riaditeľ spoločnosti Mailkit Jakub Olexa.