Strojový překlad - Biblioteka.sk

Upozornenie: Prezeranie týchto stránok je určené len pre návštevníkov nad 18 rokov!
Zásady ochrany osobných údajov.
Používaním tohto webu súhlasíte s uchovávaním cookies, ktoré slúžia na poskytovanie služieb, nastavenie reklám a analýzu návštevnosti. OK, súhlasím


Panta Rhei Doprava Zadarmo
...
...


A | B | C | D | E | F | G | H | CH | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9

Strojový překlad
 ...

Strojový překlad (angl. machine translation) je proces automatického překladu z jednoho přirozeného jazyka do jiného pomocí počítače. Strojový překlad byl poprvé použit v 50. letech v USA. Úkol v oblasti zpracování přirozeného jazyka a umělé inteligence stále však nebyl plně vyřešen. Poslední technologií jsou neuronové strojové překlady (neuron machine translation, NMT), které se blíží k tzv. lidské paritě neboli shodě s tím, jak by bilingvní osoba přeložila daný text a zda se přeložené shoduje s NMT.[1] Výsledky jsou již dostatečně kvalitní pro použití v mnoha oblastech, kde pomáhají lidským překladatelům.

Historie strojového překladu

Pokusy o strojový překlad cizojazyčných textů začaly krátce po 2. světové válce. Očekávalo se, že pro počítače, jejichž první prototypy byly v té době uvedeny do provozu, nebude tento úkol nijak složitý. Brzy se však ukázalo, že tento předpoklad byl zcela mylný.

První systém pro strojový překlad byl veřejnosti představen 7. ledna 1954 v ústředí firmy IBM. Událost přitáhla značnou pozornost médií i široké veřejnosti. Systém samotný byl ale z dnešního pohledu velmi jednoduchý, jeho slovník obsahoval pouze 250 slov a při předvádění překládal pouze 49 zvlášť vybraných vět z ruštiny do angličtiny. I přes tuto jednoduchost ale systém vzbudil dojem, že praktické nasazení strojového překladu už není daleko, což pomohlo získat dostatečné finanční prostředky na další výzkum v tomto oboru.

Hlavní motivací pro vývoj dalších podobných systémů byla eskalující studená válka. USA se začaly obávat náskoku tehdejšího Sovětského svazu ve vývoji raketové i jiné vojenské techniky a snažily se pečlivě monitorovat pokrok sovětské vědy. První systémy pro strojový překlad byly proto používány především pro překládání ruskojazyčných vědeckých a odborných publikací do angličtiny. Kvalita překladu však byla velmi nízká a takto vzniklé texty se používaly pouze pro získání základní orientace v obsahu dokumentu a rozhodování, zda stojí za to nechat dokument přeložit profesionálním překladatelem.

V průběhu dalších desetiletí bylo do vývoje v oblasti strojového překladu investováno značné úsilí jak v komerční, tak i v akademické sféře. Dosahované pokroky byly ale po celou dobu velmi skromné a ani dnešní nejmodernější systémy nedokáží překládat na úrovni, která by byla srovnatelná s člověkem.

Metody strojového překladu

Pravidlový strojový překlad

Nejstarším přístupem ke strojovému překladu je pravidlový přístup, obvykle označovaný jako RBMT (Rule-based Machine Translation). Pravidlový překladový systém obvykle sestává ze slovníku (který může být vytvořen ručně či poloautomaticky) a sady překladových pravidel. Tato pravidla analyzují zdrojovou větu a za pomoci slovníku ji transformují do cílového jazyka. Vývoj pravidlového systému je časově náročný (obvykle se hovoří o desítkách let potřebných pro vytvoření reálně použitelného systému) a vyžaduje práci skupiny jazykových a počítačových expertů.

Pravidlových překladových systémů, které byly nasazeny do praxe, je velice málo a existují jen pro několik málo jazykových párů, zejména angličtinu s francouzštinou (částečně díky Kanadě a jejím jazykovým zákonům, vyžadujícím aby mnohé dokumenty byly k dispozici v anglické i francouzské verzi). Pravidlové systémy se přesto osvědčily pro překlady textů z velmi omezené jazykové domény, v kterémžto případě je možné slovníkem a sadou pravidel téměř plně postihnout texty, které je nutné překládat. V těchto situacích pravidlový překlad často dosahuje lepší kvality než obecně úspěšnější statistický překlad. Příkladem takového systému může být METEO, kanadský systém pro překlad předpovědi počasí.

Statistický strojový překlad

Zvyšování výpočetní síly počítačů umožnilo v 90. letech 20. století masivní nástup statistických metod do počítačové lingvistiky, což v mnoha jejích oblastech způsobilo doslova revoluci. Nejinak tomu bylo u strojového překladu. Najednou již nebylo potřeba jazykových expertů desítek let vývoje. Ukázalo se, že dostatečné množství paralelních jazykových dat a statistické modelování dokáží v krátkém čase a s nevelkými náklady překonat mnohé stávající pravidlové systémy; stejně tak stvoření překladového systému pro nový jazykový pár se prakticky stalo pouze otázkou získání dostatečného množství dat.

Základem statistického překladového systému (SMT, Statistical Machine Translation) je dvojjazyčný (paralelní) korpus – sada dokumentů ve zdrojovém jazyce a jejich lidských překladů do cílového jazyka (nebo obráceně), typicky automaticky sesbíraných z internetu a dalších volně dostupných zdrojů. Z těchto dat si překladový systém extrahuje překladovou tabulku, tj. slovník obohacený o pravděpodobnosti (četnosti) jednotlivých možných překladů. Nejobvyklejším přístupem je frázový překlad, kdy překladová tabulka (zde nazývaná frázová tabulka) obsahuje nejen překlady jednotlivých slov, ale zejména krátkých frází – je tomu tak mimo jiné proto, že slova zdrojového a cílového jazyka si obvykle neodpovídají 1:1, a překlad celých víceslovných frází proto obvykle vede k lepším výsledkům.

Druhou zásadní částí statistického překladače je jazykový model pro cílový jazyk, který má za úkol z možných překladů jednotlivých frází vybrat takovou kombinaci, která vede ke koherentní a smysluplné cílové větě. Jazykový model se vytváří na základě jednojazyčného (monolinguálního) korpusu cílového jazyka. Pokud takový není k dispozici, lze použít i cílovou stranu paralelního korpusu, ale v typickém případě je jednojazyčných dat k dispozici řádově více než dvojjazyčných.

Komerčně nejúspěšnějším systémem se stal Google Translate, který během několika let nabídl překlad mezi desítkami světových jazyků, v kvalitě obvykle postačující pro základní porozumění textu, v mnoha případech dokonce již umožňující správné porozumění většině obsahu přeloženého textu. Systém je pro běžné uživatele dostupný zdarma online, pro profesionální použití je možné používat placené API.

V akademické sféře se prosazuje open-source překladový systém Moses, který je dostupný zdarma na internetu.

Hybridní strojový překlad

Hybridní překlad se snaží kombinovat výhody pravidlových a statistických systémů. Zásadní výhodou statistického přístupu je výrazně větší pokrytí než u pravidlového. Naopak pravidlové systémy obvykle dobře postihují gramatické jevy, které se obvykle řídí danými pravidly, zatímco statistické systémy se gramatická pravidla snaží (mnohdy neúspěšně) odhadovat z dat, bez lingvistických znalostí.

Neuronový strojový překlad

Neuronový strojový překlad, založený na hlubokém učení, dosáhl v posledních letech rychlého pokroku.

Překladače založené na práci s umělou neuronovou sítí jsou běžně dostupné od roku 2017. Google nasadil v tomto roce neuronovou síť ve svém Překladači[2] a vznikl též konkurenční projekt DeepL, o němž se má za to, že od roku 2022 obvykle poskytuje nejlepší výsledky strojového překladu, obvykle stále vyžadují následnou úpravu člověkem.[3][4][5] V porovnání s Google Překladačem též dosahuje lepších výsledků.[6]

Strojový překlad v Česku

Strojový překlad má v České republice dlouhou a bohatou tradici, vznikla zde celá řada úspěšných akademických i komerčních systémů.

Akademické systémy

Centrem akademického výzkumu je už po několik desetiletí Ústav formální a aplikované lingvistiky při Matematicko-fyzikální fakultě Univerzity Karlovy. V průběhu sedmdesátých a osmdesátých let zde byla pod vedením prof. Petra Sgalla vytvořena rozsáhlá teorie pro formální popis přirozeného jazyka pomocí závislostní syntaxe nazvaná funkčně-generativní popis. Na těchto teoretických základech pak na přelomu sedmdesátých a osmdesátých let minulého století vznikl pod vedením Zdeňka Kirschnera experimentální anglicko-český strojový překladač APAČ a o několik let později podobný systém pro překlad mezi češtinou a ruštinou nazvaný RUSLAN.

Komerční systémy

Komerční systémy pro strojový překlad přišly na český trh krátce po nástupu osobních počítačů na začátku devadesátých let a poměrně rychle si mezi uživateli získaly značnou popularitu.

PC Translator

PC Translator byl první a komerčně nejúspěšnější softwarový nástroj pro překlad cizojazyčných textů na českém trhu. Během 30 let distribuce (od r. 1988) měl více než 40 tisíc legálních uživatelů. Pomáhal uživateli při překladu tím, že rozdělil větu na jednotlivá slova a skupiny slov a pro každé vyhledal ve slovníku několik nejvhodnějších překladů. Výsledek zobrazil v přehledné tabulce, podle níž pak uživatel sám sestavoval finální text. Novější verze byly doplněny i o skloňování a časování, anglická verze navíc o větný parser. Překladač umožňoval překlad ze šesti jazyků (angličtina, němčina, ruština, francouzština, italština a španělština) do češtiny a slovenštiny. Autorem programu byl Ing. Rostislav Janča. Program se na českém trhu velmi rychle etabloval a v České republice stále patří mezi nejpoužívanější překladatelské nástroje. Výrobcem a distributorem programu je od roku 1997 firma Langsoft s.r.o.

Transen

Transen byl první překladač na českém trhu, který dokázal v přeloženém textu sám skloňovat nebo časovat česká slova. K tomuto účelu obsahoval podrobně rozpracovanou databázi českých ohýbacích vzorů a sadu základních pravidel české syntaxe. Anglická syntaxe v něm byla popsána pomocí větných šablon sestavených podle knihy "A Guide to Patterns and Usage in English" významného britského lingvisty A. S. Hornbyho. Klíčové součásti překladače vyvinul bratislavský programátor Jozef Baruník, původně pro překlad z angličtiny do slovenštiny. Systém byl na českém trhu nabízen v první polovině devadesátých let, ale nedosáhl většího rozšíření.

Skik

Překladač Skik byl na český trh uveden v polovině devadesátých let. Dokázal provádět základní analýzu syntaxe anglické věty a uměl i skloňovat nebo časovat česká slova v přeloženém textu. Autorem překladače byl Vladimír Smetáček. Program se na českém trhu prodával přibližně deset let, poté jeho autor své komerční aktivity ukončil a vyvinuté know-how nabídl české akademické komunitě.

Eurotran

Překladač Eurotran přišel na český trh na konci devadesátých let a byl prvním překladačem, který byl zaměřený na překlad internetových stránek. Autorem byl Milan Šustek. Program používal překladový model založený na paralelní bezkontextové gramatice, později přidal statistický bigramový model pro vyhlazování českého textu. Díky nasazení inovativních technik byl hned od počátku nástrojem, který poskytoval v češtině nejvyšší kvalitu překladu.[7]

Související články

Reference

  1. Wayback Machine. web.archive.org . . Dostupné v archivu pořízeném z originálu dne 2023-08-17. 
  2. Google skokově vylepšil překlad. Umělá inteligence se zakousla do češtiny. iDNES.cz . 2017-04-19 . Dostupné online. 
  3. KATSNELSON, Alla. Poor English skills? New AIs help researchers to write better. Nature. 2022-08-29, roč. 609, čís. 7925, s. 208–209. Dostupné online . DOI 10.1038/d41586-022-02767-9. (anglicky) 
  4. KORAB, Petr. DeepL: An Exceptionally Magnificent Language Translator. Medium . 2022-02-18 . Dostupné online. (anglicky) 
  5. DeepL outperforms Google Translate – DW – 12/05/2018. dw.com . . Dostupné online. (anglicky) 
  6. COLIN. DeepL Translator Review: Is It Better Than Google Translate? online. 2022-05-18 cit. 2023-08-17. Dostupné online. (anglicky) 
  7. MF DNES: Stroj živého překladatele hned tak nenahradí, test překladačů PC Translator, Skik a Eurotran.

Externí odkazyeditovat | editovat zdroj

Zdroj:https://cs.wikipedia.org?pojem=Strojový_překlad
Text je dostupný za podmienok Creative Commons Attribution/Share-Alike License 3.0 Unported; prípadne za ďalších podmienok. Podrobnejšie informácie nájdete na stránke Podmienky použitia.


Írán
Úmrtí v roce 2022
Číňané
Časová osa ruské invaze na Ukrajinu (2022)
Časová osa ruské invaze na Ukrajinu (2023)
Černá Hora
Česká hokejová reprezentace do 20 let
Česká Wikipedie
Česko
Ču Jou-sung
Říše Čching
Říše Ming
Šipky
Švédsko
1. květen
1. leden
1584
1585
1673
1674
1862
19. duben
1904
1908
1909
1912
1922
1924
1942
1954
1974
1977
1992
2. leden
20. duben
23. duben
24. duben
26. duben
28. duben
3. leden
5. květen
5. leden
7. leden
Airbus A350
Akronym
Amundsen–Scott (polární stanice)
Anglie
Antarktida
Apple II
Azovstal
Benjamin Netanjahu
Bitva o Madagaskar
Bitva o Mariupol
Bitva u Puebly
Bombardier Dash 8
BRICS
Bzenecká lípa
Christian Oliver
Chu Čeng-jen
Commons:Featured pictures/cs
CQD
Cvi Zamir
Dněpr
Doněcké akademické oblastní činoherní divadlo
Druhá světová válka
Dynastie Jižní Ming
Egypt
Ekonomické důsledky ruské invaze na Ukrajinu (2022)
Emmanuel Macron
Encyklopedie
Etiopie
Filip Počta
Finsko
First-person shooter
Francie
Francouzská intervence v Mexiku
Gene L. Coon
George Gershwin
Guy Lafleur
Hlavní strana
Hnutí Svoboda (Slovinsko)
Hospodářský růst
Hrnčiříkovití
IBM
Ignacio Zaragoza
Ingenuity
Izrael
Jack Phillips
Janez Janša
Jan Kostrhun
Japan Airlines
Japonská pobřežní stráž
Japonsko
John Pilger
Kaligrafie
Kategorie:Čas
Kategorie:Články podle témat
Kategorie:Život
Kategorie:Dorozumívání
Kategorie:Geografie
Kategorie:Historie
Kategorie:Hlavní kategorie
Kategorie:Informace
Kategorie:Kultura
Kategorie:Lidé
Kategorie:Matematika
Kategorie:Příroda
Kategorie:Politika
Kategorie:Právo
Kategorie:Rekordy
Kategorie:Seznamy
Kategorie:Společnost
Kategorie:Sport
Kategorie:Technika
Kategorie:Umění
Kategorie:Věda
Kategorie:Vojenství
Kategorie:Vzdělávání
Kategorie:Zdravotnictví
Ken Liu
Kišin Šinojama
Klaus Schulze
Kuo-c’-ťien
Kyjev
Letiště Haneda
Loď
Luboš Kohoutek
Luke Humphries
Luke Littler
Madagaskar
Maia Sanduová
Manuel Estiarte
Mariupol
Meda Mládková
Metro sovětského typu
Metro v Kyjevě
Mezinárodní hokejová federace
Mezinárodní měnový fond
Mistrovství světa juniorů v ledním hokeji 2024
Mittelbau-Dora
Moldavsko
Morseova abeceda
Mwai Kibaki
Nápověda:Úvod
Nápověda:Úvod pro nováčky
Nápověda:Obsah
Nadace Wikimedia
Nanking
Nejvyšší soud Státu Izrael
Neutrinová observatoř IceCube
New York
Niklaus Wirth
Noto (poloostrov)
Obolonsko-Teremkivska (linka metra v Kyjevě)
Oldřich Semerák
Oto Kanás
Pandemie covidu-19
Pandemie covidu-19 v Česku
Pavel Vondra
Pavol Mešťan
PDC Mistrovství světa v šipkách
Pečeť
Perseverance
Peter Magubane
Podilsko-Vyhurivska (linka metra v Kyjevě)
Podněstří
Portál:Aktuality
Portál:Doprava
Portál:Geografie
Portál:Historie
Portál:Kultura
Portál:Lidé
Portál:Loďstvo
Portál:Náboženství
Portál:Obsah
Portál:Příroda
Portál:Sport
Pravda (noviny)
Prefektura Išikawa
Provozovatel drážní dopravy
Provozovatel dráhy
Radim Uzel
Rallye Dakar 2024
Rapsodie v modrém
Richterova stupnice
Robert Fico
Robert Golob
Robert Kaliňák
Ruská invaze na Ukrajinu
Ruská invaze na Ukrajinu (2022)
Rusko
Sálih Arúrí
Sýrie
Saúdská Arábie
Signál
Slovenska demokratska stranka
Slovensko
Slovinsko
SOS
Soubor:Apple-II.jpg
Soubor:Flag of Mars.svg
Soubor:George Gershwin 1937.jpg
Soubor:IceCube Neutrino Observatory in 2023 02.jpg
Soubor:Manel Estiarte (Diada de Sant Jordi 2009).jpg
Soubor:Persimmon and Three Yellow Tangerines.jpg
Soubor:Syrets metro station Kiev 2010 01.jpg
Soubor:Zvon 9801.jpg
Sovětský svaz
Speciální:Kategorie
Speciální:Nové stránky
Speciální:Statistika
Spojené arabské emiráty
Spojené státy americké
Steampunk
Strojový překlad
Světová ekonomika
Svjatošynsko-Brovarska (linka metra v Kyjevě)
Syrecko-Pečerska (linka metra v Kyjevě)
Türkân Akyolová
Třída T 47
Tchang Jin
Tiskař
Titanic
Tokio
Turecko
Ukrajinština
Ukrajina
Václav Štěpán (divadelní a literární historik)
Válka šimpanzů v Gombe
Válka Izraele s Hamásem (2023)
V-2
Vernon Wray
Vichistická Francie
Viktor Zvjahincev
Vláda Černé Hory
Vlasta Prachatická
Volby prezidenta Francie 2022
Vzdušný prostor
Wiki
Wikicitáty:Hlavní strana
Wikidata:Hlavní strana
Wikifunctions:Main Page
Wikiknihy:Hlavní strana
Wikimedia Česká republika
Wikipedie:Údržba
Wikipedie:Časté chyby
Wikipedie:Často kladené otázky
Wikipedie:Článek týdne
Wikipedie:Článek týdne/2022
Wikipedie:Článek týdne/2024
Wikipedie:Citování Wikipedie
Wikipedie:Dobré články
Wikipedie:Dobré články#Portály
Wikipedie:Kontakt
Wikipedie:Nejlepší články
Wikipedie:Obrázek týdne
Wikipedie:Obrázek týdne/2022
Wikipedie:Obrázek týdne/2024
Wikipedie:Ověřitelnost
Wikipedie:Požadované články
Wikipedie:Pod lípou
Wikipedie:Portál Wikipedie
Wikipedie:Potřebuji pomoc
Wikipedie:Průvodce
Wikipedie:Seznam jazyků Wikipedie
Wikipedie:Velvyslanectví
Wikipedie:Vybraná výročí dne/květen
Wikipedie:Vybraná výročí dne/leden
Wikipedie:WikiProjekt Kvalita/Články k rozšíření
Wikipedie:Zajímavosti
Wikipedie:Zajímavosti/2022
Wikipedie:Zajímavosti/2024
Wikipedie:Zdroje informací
Wikislovník:Hlavní strana
Wikiverzita:Hlavní strana
Wikizdroje:Hlavní strana
Wikizprávy:Hlavní strana
Wolfenstein 3D
Zdeněk Fiala
Zemětřesení
Zvon 9801




Text je dostupný za podmienok Creative Commons Attribution/Share-Alike License 3.0 Unported; prípadne za ďalších podmienok.
Podrobnejšie informácie nájdete na stránke Podmienky použitia.

Your browser doesn’t support the object tag.

www.astronomia.sk | www.biologia.sk | www.botanika.sk | www.dejiny.sk | www.economy.sk | www.elektrotechnika.sk | www.estetika.sk | www.farmakologia.sk | www.filozofia.sk | Fyzika | www.futurologia.sk | www.genetika.sk | www.chemia.sk | www.lingvistika.sk | www.politologia.sk | www.psychologia.sk | www.sexuologia.sk | www.sociologia.sk | www.veda.sk I www.zoologia.sk