vi.ikt.ui.sav.sk

Súhlas bol prijatý0
Nesúhlas bol prijatý0
Karma:0 (súhlas-nesúhlas)



0 získal odznaky

Nenašli sa žiadne odznaky



Definície (21)

1

0 Thumbs up   0 Thumbs down

pojem stemovanie


Stemovanie je proces úpravy slov na ich základny (koreňový) tvar. Napr. koreňom slova „autá“ je slovo „auto“. Existujú rôzne prístupy na hľadanie základných tvarov slov. Niektoré využívajú slovníky, podľa ktorých identifikujú slovo alebo úpravu ktorá sa má vykonať, iné využívajú úpravy ktoré sa aplikujú podľa aktuálneho tvaru slova alebo umiestneni [..]
Zdroj: vi.ikt.ui.sav.sk (offline)

2

0 Thumbs up   0 Thumbs down

slovníkový algoritmus


Tento algoritmus vychádza z predpokladu, že máme k dispozícii slovník rozvinutých tvarov a k nim prislúchajúcich základných tvarov. Samotný algoritmus iba vyhľadáva v tomto slovníku slová a nahrádza ich základným tvarom. Nevýhodou tejto metódy je pomerne veľká pamäťová a časová náročnosť na vyhľadanie slov v slovníku. Tiež je problémom takýto slovn [..]
Zdroj: vi.ikt.ui.sav.sk (offline)

3

0 Thumbs up   0 Thumbs down

porovnávací algoritmus


Ide o obdobu slovníkového algoritmu. Je tu však jeden rozhodujúci rozdiel. A to ten, že na miesto udržiavania všetkých rozvinutých tvarov slov, udržujeme iba „jadro“ slov, ktoré je identické pre všetky jeho rozvinuté tvary. Napr. Majme slovo „auto“ jeho rozvinuté tvary „autom“, „autá“, „autami“... Jeho jadrom sa zdá byť teda slovo „aut“ ktoré samo [..]
Zdroj: vi.ikt.ui.sav.sk (offline)

4

0 Thumbs up   0 Thumbs down

algoritmus odstraňovania sufixov


Zakladá sa na odstraňovaní sufixov zo slov. V slovenskom jazyku je skor potreba odstránenie sufixu doplniť o nahradenie základného sufixu. Napr. pri slove „autami“ dosiahneme základný tvar odstránením sufixu „ami“ a pridaním nového sufixu „o“. Spôsob hľadania sufixov musí vychádzať z gramatiky jazyka. Keďže sa zaoberáme slovenským jazykom, vychádza [..]
Zdroj: vi.ikt.ui.sav.sk (offline)

5

0 Thumbs up   0 Thumbs down

algoritmus odstraňovania prefixov a sufixov


Podobne ako u algoritmu odstraňovania sufixov postupuje aj tento algoritmus. Umožňuje však silnejšie úpravy odstraňovaním nie len sufixov ale aj prefixov. Napr. slovo „nemali“ dokáže odstránením prefixu „ne“ a nahradením sufixu „ali“ za „ať“ upraviť na tvar „mať“. Nevýhodou algoritmov tohto typu je správne určenie ktoré ktorý sufix akým nahradiť. N [..]
Zdroj: vi.ikt.ui.sav.sk (offline)

6

0 Thumbs up   0 Thumbs down

lemmatizačný algoritmus


Proces tohto algoritmu je založený na identifikovaní významu slova z kontextu. Pravidlá normalizácie slova sa potom určujú podľa toho v akej pozícii vo vete sa nachádza. Pravidlá normalizácie predstavujú zväčša odstraňovanie sufixov alebo prefixov.
Zdroj: vi.ikt.ui.sav.sk (offline)

7

0 Thumbs up   0 Thumbs down

stochasticky algoritmus


Základným princípom tohto algoritmu je využívanie trénovania na množine rozvinutých slov a ich základných tvarov a následné aplikovanie natrénovaných pravidiel na slová u ktorých hladáme základný tvar. Výsledkom trénovania je model pravdepodobností, podľa ktorého sa následne vyberajú pravidlá normalizácie slov. Tu je nevýhodou, že nájdené základné [..]
Zdroj: vi.ikt.ui.sav.sk (offline)

8

0 Thumbs up   0 Thumbs down

hybridné prístupy


Ide o kombináciu rôznych prístupov. Cieľom je vhodnou kombináciou docieliť najlepšie výsledky. Napr. pri odstraňovaní sufixov použijeme slovníkový prístup na identifikovanie typu slova (určíme aké pravidlá pre toto slovo platia).
Zdroj: vi.ikt.ui.sav.sk (offline)

9

0 Thumbs up   0 Thumbs down

porter stemming algorithm


Webové rozhranie poskytuje možnosť transformácie anglického textu na text v základnom tvare. Ide o webové rozhranie ktoré slúži výhradne na testovacie účely.
Zdroj: vi.ikt.ui.sav.sk (offline)

10

0 Thumbs up   0 Thumbs down

the lancaster stemming algorithm


Nástroj ktorý slúži na testovanie použitého algoritmu. Je implementovaný v jave a poskytuje grafické rozhranie. Používa odstraňovanie affixov.
Zdroj: vi.ikt.ui.sav.sk (offline)


Prihláste sa, aby ste videli všetky definície od 21.