Zpět na slovníček
Základy AI

Velký jazykový model (LLM).

Large Language Model

Typ neuronové sítě natrénované na obrovském množství textu, která dokáže generovat, překládat a analyzovat přirozený jazyk s pozoruhodnou přesností.

Velké jazykové modely představují jednu z nejvýznamnějších inovací v oblasti AI posledních let. Jedná se o neuronové sítě s miliardami parametrů, natrénované na rozsáhlých textových datech z internetu, knih a dalších zdrojů. Díky tomu rozumí struktuře jazyka a dokáží generovat koherentní a kontextově relevantní text.

LLM fungují na principu predikce dalšího tokenu – na základě dosavadního kontextu odhadují, jaké slovo (nebo jeho část) by mělo následovat. Přestože je tento princip jednoduchý, v kombinaci s obrovským množstvím tréninkových dat a parametrů vznikají modely schopné plnit složité úkoly: psaní článků, programování, analýza dokumentů nebo kreativní brainstorming.

Mezi nejznámější LLM patří modely GPT (na kterých stojí ChatGPT), Claude od Anthropic nebo Gemini od Google. Každý model má své silné stránky a je důležité vybrat ten správný pro konkrétní potřebu. Při práci s LLM je klíčové umět správně formulovat prompty a chápat jejich omezení, jako jsou halucinace nebo zastaralé znalosti.

Chcete se dozvědět více? Podívejte se na mé služby.

Související pojmy.