Co je AI Safety | Filip Oborník

AI safety (bezpečnost AI) je multidisciplinární obor zaměřený na to, aby AI systémy fungovaly tak, jak mají, a nezpůsobovaly neúmyslné škody. Zahrnuje technické aspekty (robustnost modelů, odolnost vůči manipulaci, spolehlivost výstupů) i společenské otázky (zaujatost, spravedlnost, transparentnost rozhodování).

V praxi AI safety řeší otázky jako: Jak zajistit, že AI chatbot neposkytne nebezpečné rady? Jak zabránit, aby AI systém diskriminoval určité skupiny lidí? Jak zajistit, že autonomní AI agent neprovede akci s nezvratnými následky? Tyto otázky jsou klíčové zejména při nasazování AI v citlivých oblastech jako zdravotnictví, finance nebo právo.

Pro firmy je AI safety důležitá nejen z etických důvodů, ale i z obchodních – incident s nespolehlivou nebo zaujatou AI může poškodit reputaci a vést k právním následkům. Zodpovědné nasazení AI zahrnuje testování na zaujatost, nastavení bezpečnostních mantinelů, lidský dohled nad kritickými rozhodnutími a průběžný monitoring.

AI Safety.

Související pojmy.

Umělá inteligence

AI Governance

Halucinace AI

Prompt injection