Dokumentácia
Obsah- Úvod
- Čo je to synonymum?
- Čo by som mal brať do úvahy, keď chcem niečo vložiť alebo zmeniť?
- Čo to znamená v základnom tvare?
- Prečo sa musím zaregistrovať?
- Na stiahnutie
- Čo sú to „Wikipedia-odkazy“?
- Je implementovaná kontrola preklepov?
- Môžem integrovať vyhľadávanie v slovníku do svojej stránky?
- O čom je funkcia podradený/nadradený?
- Kto mi odpovie na moje otázky?
- Prispievatelia
Projekt OpenThesaurus je PHP/MySQL web rozhranie, ktoré umožňuje spoluprácu viacerých ľudí na tvorbe synonymického slovníka. Projekt umožňuje export do týchto formátov: OpenOffice.org, KWord a prostý text.
Ako základ pre Otvorený Slovenský Synonymický Slovník boli použité dáta z českého projektu (http://nlp.fi.muni.cz/projekty/czthes/), ktoré preložil a zrevidoval Tibor Bako.
Ktokoľvek môže kontrolovať tieto údaje, opravovať chyby, alebo vkladať nové synonymá. Vyhľadávanie hľadá všetky významy, v ktorých sa dané slovo objaví. Ak slovo nie je nádejné, je vám ponúknuté, aby ste toto slovo vložili do slovníka.
Aby ste mohli začal spolupracovať na tomto projekte, musíte sa zaregistrovať. Predtým je však dôležité, aby ste si prečítali túto dokumentáciu dokonca, aby ste spoznali niektoré pravidlá.
Skôr ako vložíte alebo zmeníte nejakú položku musíte pochopiť, ako sú dáta v slovníku štruktúrované - podľa významu. Napríklad slovo agent môže byť význame sprostredkovateľ (poistenia), alebo vo význame vyzvedač. Pritom slová sprostredkovateľ a špión synonymami nie sú. Preto pre agenta musia v slovníku existovať dva synonymické rady (významy): v jednom bude slovo sprostredkovať a v druhom bude špión.
V prípade, že hľadané slovo má viac významov, tak sa za ním zobrazí číslo, ktorá vyjadruje počet definícií. Kliknutím na neho sa vám zobrazia všetky významy.
Ak dve alebo viac slov majú v istom kontexte rovnaký význam, tak ich hovoríme, že sú to synonymá. Napríklad:
agresívny, útočný
nemravný, neslušný, obscénny
žalobaba, donášač
Synonymá vytvárajú synonymické rady - skupiny slov s rovnakým významom. Preto sa slová s rôznym významom -- ako napríklad agent -- objavujú vo viacerých skupinách synonym:
Synonymická skupina 1: agent, sliedič, vyzvedač,
špión
Synonymická skupina 2: agent, sprostredkovateľ, zástupca
Poznámka pre expertov: Angličtina pre synonymické rady používa označenie synsets (WordNet).
Čo by som mal brať do úvahy, keď chcem niečo vložiť alebo zmeniť?
V skratke:
- V našom úmysle je vytvoriť otvorený a slobodný slovník. Z tohoto dôvodu nesmú byť do databázy vkladané dáta, ktoré neumožňujú voľné šírenie (t.j. prepisovanie slov z existujúcich databáz, či už v elektronickej alebo inej forme, ktoré sú chránené proti neautorizovanému šíreniu).
- Používajte iba slovenské slová. Cudzojazyčné slová používajte iba v prípade, ak sú často používané. Nemá zmysel vytvoriť dlhý synonymický rad, z ktoré väčšinu slov nie je možné použiť v bežnom texte.
- Nevkladajte skratky.
- Pred vložením dát, skontrolujte pravopis. Slovník momentálne nemá kontrolu pravopisu pri vkladaní údajov do databázy.
- Pokiaľ to nie je nutné, tak nepoužívajte viacslovné spojenia. Napríklad: nemá zmysel vkladať výraz rozpočet na reklamu, ak už slovník obsahuje synonymá pre slovo rozpočet.
- Nevkladajte do databázy názvy miest (dedín, údolí... ;-) ), firiem a podobne.
- Nevkladajte zastaralé slová.
- Pokiaľ vám chýba nejaká kategória, tak mi napíšte: (zdposter (at) gmail (dot) com), rád ju doplním.
Čo to znamená v základnom tvare?
Do databázy majú byť vkladané slová v základnom tvare tzn. slovesá v neurčitku, podstatné mená v jednotnom čísle a prvom páde, prídavné mená v prvom stupni. Napríklad:
správne: bežať, nesprávne: bežal
správne: dom, nesprávne: domy
správne: dlhý, nesprávne: dlhší
Registrácia je nutná, kvôli súhlasu s podmienkami projektu. Pokiaľ nemáte v úmysle zapisovať do databázy, nemusíte sa registrovať.
Tieto dáta je možné šíriť v zmysle tejto licencie.
- Slovenské dáta pre
synonymický slovník programu OpenOffice.org 1.x (349 KB, generované 2024-02-19 17:09)
Poznámka: Tieto súbory správne fungujú iba v slovenskej verzií programu OpenOffice 1.1.4. Nižšie verzie nedokážu správne pracovať s niektorými písmenami, a preto veľa synonym nie je nájdených prípadne zle zobrazených. Inštalácia je popísaná v README súbore. - Slovenské dáta pre
synonymický slovník programu OpenOffice.org 2.x (241 KB, generované 2024-02-19 17:09)
- Rozšírenie so slovenskými dátami pre synonymický slovník programu OpenOffice.org (3.0 a novší) (246 KB, generované 2024-02-19 17:12) — generuje sa denne. Toto rozšírenie nepoužívajte v kombinácií s rozšírením „Slovak dictionary package / Slovenské slovníky“, keďže oba rozšírenia obsahujú dáta pre thesaurus. Namiesto neho si nainštalujte „rozšírenie iba s kontrolou preklepov a delením slov“ (bez synonymického slovníka).
- synonymický slovník vo formáte pre ElasticSearch / SOLR — spravuje ho lab.SNG na GitHub-e.
- Synonymický slovník pre KWord min. verzia 1.3beta1 (komprimovaný, 70 KB, vygenerovaný 2024-02-19 17:10). Inštalácia: rozbaľte súbor do priečinku $KDEDIR/share/apps/thesaurus/ a potom v KThesaurus vyberte zmeňte jazyk.
- Pre vývojárov: MySQL-dump (215 KB, vygenerovaný 2020-08-30 20:29). PHP kód projektu si môžete stiahnuť tu (215 KB, vygenerovaný 2020-08-30 20:29).
- Krátky manuál (233 KB, umiestnený 2020-08-30 20:29) - ako vkladať nové synonymá. Bol som dosť prekvapený, koľko námahy ma to stálo, kým so ho dostal aspoň do tohoto stavu :-O. Uvítam každé vylepšenie (napr. vhodnejšie obrázky so šírkou 425 bodov).
V časti pre Wikipédiu sú odkazy, ktoré s textom súvisia. Vzhľadom k tomu, že Wikipédia je encyklopédia a nie slovník, budú sa tu zobrazovať zobrazovať hlavne podstatné mená, a nie slovesá alebo prídavné mená.
Je implementovaná kontrola preklepov?
Kontrola preklepov (spellcheck) je integrovaná čiastočne — pri prehľade (overview) slova (pozri napr. slovo proces). Kontrola je vykonávaná pomocou projektu http://aspell.net.
Pokiaľ ste presvedčený, že slovo je napísané správne po slovensky, pošlite chybové hlásenie na zdposter (at) gmail (dot) com — pomôžete tým k rozšíreniu slovníkovej zásoby pre aspell-sk.Môžem integrovať vyhľadávanie v slovníku do svojej stránky?
S nasledujúcim HTML je možné integrovať vyhľadávanie do Vašich stránok:
<form action="http://www.sk-spell.sk.cx/thesaurus/overview.php" method="get"> <input type="hidden" name="search" value="1" /> <input type="text" size="18" name="word" /> <input type="submit" value="Synonymá…" /> </form>
O čom je funkcia podradený/nadradený?
Je mi ľúto, ale táto časť dokumentácie ešte nie je pripravená...
Kto mi odpovie na moje otázky?
Skúste napísať mi napísať:-): Zdenko Podobný (zdposter (at) gmail (dot) com). Ak budem stíhať, tak odpíšem.
Vďaka patrí Tiborovi Bakovi za počiatočnú verziu dát, Jurajovi Bednárovi za poskytnutie priestoru na servery.
Aktualizované: 17-01-2009