TextProcessing

Opis projektu

Náš projekt sa zaoberá automatizáciou tvorby bibliografických záznamov z dokumentov a budovaním znalostnej bázy. Takéto spracovanie dokumentov umožní používateľom rýchlejšie a presnejšie vyhľadávanie, pričom získajú relevantné dokumenty, obsahovo zodpovedajúce požadovaným kritériám nielen na základe termínu, ale aj ich významu. Znalostná báza v sebe naviac vzájomne prepája všetky významovo súvisiace objekty a poskytuje tak množstvo ďalších možností jej využitia.


Ciele: Zimný semester

Medzi ciele nášho tímového projektu v zimnom semestri patrí predovšetkým prvotné predspracovanie textov, extrakcia kľúčových slov, návrh a spôsob priraďovania textov k danej téme a tiež vytvorenie rozhrania pre používateľov. Rozhranie bude používateľom umožňovať niekoľko operácií nad textami: vkladať ich v slovenskom jazyku jednotlivo aj dávkovo, spracovať a priradiť ich ku konkrétnej téme zodpovedajúcej obsahu daného textu. Používateľ bude mať možnosť prezerať ním vložené dokumenty, prípadne všetky dokumenty v systéme a prezerať si už spracované dokumenty s priradenou témou a kľúčovými slovami, ktoré reprezentujú daný dokument. Tiež si bude môcť vybrať dokument a ten aktuálne spracovať, či vybrať dokumenty a následne ich exportovať spolu s priradenou témou a kľúčovými slovami. Zameriame sa taktiež na budovanie znalostnej bázy, pre ktorú navrhneme a následne implementujeme dátový model na základe vybraných zdrojov. Pre dané zdroje budeme implementovať metódy na extrakciu dát a ich import do našej znalostnej bázy, ktorú budeme postupne dopĺňať aj pri spracovaní textov. V znalostnej báze sa pokúsime prepájať súvisiace termíny a dokumenty na základe významu tak, aby poskytovala pohľad na danú tému, kľúčové slová , či samotný dokument aj vo významových súvislostiach.


Ciele: Letný semester

V letnom semestri sa budeme venovať vizualizácii znalostnej bázy a takisto by sme chceli venovať rozširovaniu funkcionality pre používateľov prostredníctvom webového rozhrania, prípadne vytvoriť aj API pre využitie jednotlivých výsledkov nášho riešenia v iných systémoch.

Náš tím

Marcel Klamárik

Manažér tímu

Jakub Mikolaj

Scrum master

Miroslav Šedivý

Manažér vývoja

Peter Škrak

Manažér technológií

Patrik Horemuž

Manažér vývoja

Norbert Varga

Manažér kvality

Robert Oros

Manažér dokumentácie

Časová os


Adam | 2 október 2019

  • Vytvorenie tímového webu
  • Vytvorenie plagátu
  • Nastavenie servera
  • Výber technológií

Božena | 16 október 2019

  • Dokončenie tímového webu
  • Analýza a prebratie projektu z minulého roku

Cyril | 30 október 2019

  • Analyzovanie a otestovanie metód pre extrakciu kľúčových slov
  • Automatizácia pripojenia do OpenVPN
  • Identifikovanie kľúčových slov v dokumentoch

Dávid | 13 november 2019

  • Identifikácia zdrojov pre znalostnú bázu
  • Vytvorenie dátového modelu pre znalostnú bázu
  • Rozhranie pre extrakciu kľúčových slov podľa zvolenej metódy

Emil | 28 november 2019

  • Naplnenie znalostnej bázy
  • Tvorba používateľov a identifikácia rolí
  • Rozhranie pre extrakciu kľúčových slov podľa zvolenej metódy

Dokumentácia

TextProcessing

Prosím počkajte...