Co je Velký jazykový model (LLM)

Velké jazykové modely představují jednu z nejvýznamnějších inovací v oblasti AI posledních let. Jedná se o neuronové sítě s miliardami parametrů, natrénované na rozsáhlých textových datech z internetu, knih a dalších zdrojů. Díky tomu rozumí struktuře jazyka a dokáží generovat koherentní a kontextově relevantní text.

LLM fungují na principu predikce dalšího tokenu – na základě dosavadního kontextu odhadují, jaké slovo (nebo jeho část) by mělo následovat. Přestože je tento princip jednoduchý, v kombinaci s obrovským množstvím tréninkových dat a parametrů vznikají modely schopné plnit složité úkoly: psaní článků, programování, analýza dokumentů nebo kreativní brainstorming.

Mezi nejznámější LLM patří modely GPT (na kterých stojí ChatGPT), Claude od Anthropic nebo Gemini od Google. Každý model má své silné stránky a je důležité vybrat ten správný pro konkrétní potřebu. Při práci s LLM je klíčové umět správně formulovat prompty a chápat jejich omezení, jako jsou halucinace nebo zastaralé znalosti.

Velký jazykový model (LLM).

Související pojmy.

Neuronová síť

Token

ChatGPT

Claude

Halucinace AI