Počítačová lingvistika

Z Necyklopedie

Přejít na: navigace, hledání

Počítačová lingvistika je věda o jazyce zaměřená na počítačovou analýzu textu a určování slovních druhů a větných členů.

[editovat] Algoritmy pro češtinu

[editovat] Pičurinův

První a nejjednodušší algoritmus pro češtinu vymyslil Čurin Kozolič Pičurin a zapsal jej v Lispu. Tento program vzbudil spoustu ohlasů, protože na svou jednoduchost byl relativně dosti funkční. Vypadal takto:

((((let
      (((slova
        ((cons (slovo1
          (cons (slovo2
            (cons (slovo3
              ((cons (slovo4
                (cons (slovo5 nil))
              ))
             )
            )
           )
          )
         )
        )
       )
      )))
))()))

((((let(it(be))))))

Poslední řádek však po zevrubném zkoumání odborníkem na programování ukazuje, že se Pičurin na program standardně vykašlal.

Baltie-parsing

Program pro větný rozbor "napsaný" v Baltíkovi 4 C# Pro ve stejném duchu jako Pičurinův. Baltík nejdříve dlouho přemýšlí (pětkrát obejde dvorek) a pak vyřkne výsledek. Vstupní parametry programu: nejsou.

[editovat] Hitlerův

Druhý, již trochu složitější nápad dostal v neznámé chvíli Adolf Hitler. Protože však neuměl žádný programovací jazyk, zapsal si jej do pseudokódu.

seznam slov = (slovo1, slovo2, slovo3, slovo4, slovo5)
seznam slovních druhů = (druh1, druh2, druh3, druh4, druh5, druh6, druh7, druh8, druh9, druh10)
seznam větných  členů = (člen1, člen2, člen3, člen4, člen5, člen6, člen7, člen8, člen9, člen10)

pro každé slovo s ze seznamu slov
  slovní druh = náhodné číslo(od 0 do počtu slovních druhů)
  větný  člen = náhodné číslo(od 0 do počtu větných členů)

Vědecké výzkumy ukázaly, že i přes usilovnou práci ústavu ÚFAL je Hitlerův postup ten nejpřesnější, jaký se kdy komu povedl napsat.


Dalším, poměrně rozšířeným jazykem na Internetu je 133t.

Počítače
El666

Počítače: AcerAppleBarbie PCCMEUDellDetektor lžiElektronika 666HPIntelLenovoNový JeruzalémRačunik-RTuringův strojUral 2
Hardware: Caps LockCD-RWDěrná páskaF13iPrdKompresorScroll lockŠkoda 1000MBŠkvorPaměť WOM
Software: BSODEmacsKVGЛинуксMicrosoft WordMooreův zákonPoznámkový blokPřekladSvatý TučňákVálka s švábyWindowsVista
Programování: C SharpLispnOTHINGOpenOSTRAJavaPočítačová lingvistika
Aplikace: AhE-mailEndInternetKomprese datRodné čísloTrabant AussichtDOSBoxDvě minuty nenávisti

uncyclopedia