Zpět na blog
Zamyšlení34 min čtení

Open Claw: AI agent s plným přístupem k počítači — a jak ho neproměnit v katastrofu

Open Claw je open-source AI agent s plnou kontrolou nad počítačem. Obrovská síla i obrovské bezpečnostní riziko — popis, jak to mám postavené já.

Autor: Filip Oborník

AI agentMCPHeartbeatPrompt injection
Preferujete video? Pusťte si záznam stejného obsahu.

Tento článek vznikl s pomocí AI z transkriptu výše uvedeného videa. Pro maximální přesnost se podívejte na video, případně si rozbalte plný transkript níže.

Zobrazit celý transkript videa

Krásný den. Vítejte u dalšího dílu podcastu Coffee Break s Filipem. Doufám, že pijete taky něco dobrého. Já tady mám opět kávu.

A dneska trfnu si tvrdit, že mám extrémně zajímavý témat, kterým žiju jak poslední týdny, tak hlavně poslední víkend, který teďka byl, protože mě to neuvěřitelně zaujalo. Tím tématem je OpenClaw. Agent OpenClaw. A pokud jste o něm neslyšeli, možná jste slyšeli Moldbot.

A pokud ne Moldbot, tak možná Clodbot. A to jsou všechno stejný názvy, které tady ten projekt za pár týdnů vystřídal. A ve zkratce jedná se vlastně o AI Agenta, který je open source, takže se můžete úplně zadarmo stáhnout. A můžete ho spustit na jakémkoliv počítači, nebo na nějaký VPSC, nějakém serveru.

A ta obrovská výhoda tohodle agenta je, že on vlastně má k dispozici celý ten počítač a může si tam dělat, co chce, což přináší obrovský rizika, ke kterým se samozřejmě taky dostaneme. Nicméně, to je jako nesporná výhoda, že ten agent může ovládat počítač a tím pádem najednou dostává nástroje, o kterých se jiným agentům vlastně ani nesnilo. A za mě jako v tuhle tu chvíli je to Jeden z nejsilnějších, troufnu si možná říct, nejsilnější AI agent, kterýho můžete mít, ale jak se říká dobrý sluha, zlý pán a s velkou mocí přichází velká odpovědnost, tak i tady to platí možná tak desetinásobně. Zkrátka, tady ten agent dokáže obrovský věci.

Když začneme úplně na začátku, abych ho ještě víc přiblížil. Tady ten AI agent spočívá v tom, že vy si ho nainstalujete na svůj počítáč, nebo na právě tu WPS na ten server a dáte mu ho celý k dispozici. Vy si k němu připojíte tzv. channely, což je vlastně jako komunikací díční kanály a má předefinovaný se na všechny možný četovací platformy.

Telegram, Whatsapp, Discord, iMessages a přece spoustu dalších. Takže vy si ho napojíte na to, přes co vy klasicky komunikujete a můžete si s ním psát ty zprávy. To je za mě jako první obrovská výhoda, že je jako platform Agnostic, to znamená, že vy nemusíte si s ním psát jenom na Telegramu, nebo nemusíte mít nějakou webovou stránku s nějakým oknem, kde si s ním píšete, což taky můžete. ale zkrátka jako můžete si vybrat, že s tím botem můžete komunikovat přesně tam, kde vy ho vlastně jako potřebujete, kde máte třeba už tu klasickou vaši messaging činnost, kde prostě si posíláte ty zprávy, že nemusíte instalovat další nástroj.

Takže to je to napojení na toho bota. Druhá věc je, že on vlastně žije v tom počítači a aby vlastně mohl vykonávat nějaké úkoly, tak pochopitelně potřebuje napojení na nějaký AI model. No a ten AI model, tak buď to to může být nějaký přes API klíč, to znamená, že tam jednoduše dáte API klíč a on ho používá a zkrátka jste, nebo platíte jenom za to využití, což je ten korektní způsob, anebo ho můžete připojit přes subscription, to znamená předplatný, můžete využít předplatný od Codexu, to znamená od OpenAI, nebo právě třeba od Anthropica, spoustu dalších těch možností, je tam zase jako obrovská škála. Já to osobně používám teďka se svým plánem max od Anthropica, Jestli je to dobrý nápad, nevím.

Anthropic tohle úplně nemá rád a sám Peter, autor vlastně toho projektu, tak si v různých podcastech doporučoval používat spíš apiklid, že Anthropic je trošku vysazenej tady na to používání těch subscriptionviných nástrojích, ale já jsem si to rozhodl risknout, zatím to funguje, takže snad to bude jít i dál, protože Přece jenom nemuset platit za každý ty tokeny, ale mít to v rámci toho předplatnýho je pro mě ekstremně výhodný, protože ten agent dokáže sežrat dost tokenů. Takže to je připojení k tomu agentovi. Potom vlastně to, jakým způsobem si napojíte ten AI model. Takže vlastně ten Moldbot, nebo respektive OpenCLO, tak vlastně nezávisí na tom modelu.

Jenom ta agentic harness, podobně jak máte třeba OpenCode, tak vy zkrátka můžete používat různý modelek. Nebo třeba v Cursoru tak můžete používat model od různých společností. Tak tohle je vlastně jako podobný. No a pak jdem dál.

A vlastně ten, když si ho napojíte, tak si s ním povídáte. On má různý, řekněme jako konfigurační soubory, kdy vlastně on si u vás uloží do memory nějaký paměti, pak má soul, potom má ještě jako další konfigy, který vlastně jako dokáže využívat k tomu, aby vám odpovídal personalizovaně. Vy se můžete na všechno tohle podívat v tom počítače. openclaw a tam jsou všechny tyhle konfigurační soubory, že vy se můžete podívat, jak je předefinovaný.

Vy si typicky ho nekonfigurujete tak, že mu dáte ty soubory, ale jenom si s ním povídáte a on se vodle toho vlastně jako sám nastaví. To je za mě jako delší výhoda, že vy nemusíte znát ty konfigurační přístupy, ale on se sám dokáže vlastně takhle jako upravit, nastavit a nakonfigurat podle toho, podle tý vaší konverzace. Kromě toho, že má tyhle konfigurační soubory, tak on si ukládá záznamy z každého dne, co jste řešili, takže on je schopnej se referencovat na to, co jste řešili včera, předevšírem před hodinou. Zkrátka je schopnej sevracet v čase to, co jste vlastně dělali spolu.

Samozřejmě má to svoje limity, každá paměť, která je řešená jen tady těma souborama, ale funguje to poměrně pěkně, že se můžete odkazat a nechat ho tam vyhledávat. No a ta největší zbraň toho OpenCLO, a to říká i Peter, tak je vlastně v tom, že on, nebo obecně i agenti, jsou skvělí v používání takzvaného bashe. To je terminál, my už jsme si na terminál dělali různé videa, a to je vlastně jako zadávání příkazů do té příkazové řádky. A super je, že to jsou tak známé příkazy na nějaké prohledávání, filtrace, otevírání souborů, procházení toho repozitáře, že ty modely jsou na ně jako skvěle natrénované.

Tím pádem jsou v nich jako velice efektivní a tohodle využívá právě i OpenCLO, že je schopný jako velice rychle procházet tady ty soubory a hledat to, co vy potřebujete, na co se ptáte, nebo sezbírat ten nějaký relevantní kontext, který potřebuje. Takže to je jako další věc, že používá tady ten bash, používá terminál a vede si takovej ten denníček, co jsme spolu udělali. Vy můžete toho OpenCLO připojit k různým nástrojům a tady začíná ta jako obrovská síla, že stejně jako to máte s CLODem přes MCP, tak typicky OpenCLO jde spíš cestou právě toho basheť, toho tzv. CLI, kdy vlastně vy si připojujete tyto nástroje a nejlíp Wall CCL Live, protože s tím ty agenti umí jako skvěle pracovat a nejvíc efektivně a nečerpat tohle tokeny, ale samozřejmě můžete si tam připojit i MCPčka, můžete si tam připojit vlastně jako cokoliv a spočívá to v tom, že vy pak tomu agentovi vlastně nakonfigurujete ten přístup, takže já tam mám typicky přidanej Notion, mám tam přidanej kalendář, e-mail a další věci.

K tomu, jak to mám udělaný, se dostanem, protože teďka spoustě z vás určitě jako ježej vlasy na hlavě. Ježišmarja, on dal přístup tomu botovi úplně všude, dí� tak vysvětlim, jak to řeším, abych se tohohle jako zbavil, takže určitě počkejte na tu druhou část tohohle podcastu. Tak, a mám vlastně teda, tady jste jako napropojovaný, a tím pádem ten bot je schopnej vlastně se dívat do méjch souborů a pracovat s mýma datama. To je jako obrovská výhoda, pokud jste si tohle už nastavili třeba v cloudu nebo v cloud kódu, v chat GPT a tak dál, tak jako určitě víte, že to je jako jeden z největších efektivity boosterů, to, že napojíte ty nástroje a nejste vy takový to lidský USBčko, že kopírujete data z jednoho systému do druhýho, ale zkrátka, že ten chatbot, nebo v tomhle případě AI agent, tak je schopnej si sám vlastně ty data získat.

Takže máme napojení na ty nástroje, no a pak ta delší a za mě vlastně jako úplně největší výhoda, ta revolučnost toho OpenCLO a zároveň to největší riziko, tak je, že umí pracovat s vaším počítačem. A to umí i Cloud Code, jo. On umí vlastně jako pracovat se složkama, s houborama, ale OpenCLO v základu tak je Vlastně jako ta Agentic Harness postavená, takže za první se vás neptá na permíšny, je to prostě jolomot, a za druhý, tak on umí pracovat s tím bashem, ale jako mnohem pokročilý se, že on se nebojí si stáhnout nějakej program, nainstalovat a pracovat s ním, což je do jistý míry rizikový a zároveň ta otvírá obrovský možnosti, protože třeba Peter v podcastu popisuje, a já jsem to zkoušel sám, že vy mu pošlete hlasovku a on není nakonfigurovaný, že když přijde hlasovka z Telegramu, tak ji vem, přepíší do textu, zjistí o co jde, potom vygeneruj hlas a vrať to, ale ten agent tím, že vy mu dáte třeba svůj OpenAI klíč, tak on ví, aha, přišel mi soubor, který je hlasovka, tak já si ho asi přepíšu, pošlu to do OpenAI, dostanu Transcribe, řeknu aha, chápu, připravím odpověď, tu pošlu do WISPRu na OpenAI a dostanu tu hlasovku a tu pošlu tomu uživateli zpátky. To znamená, že ten agent je si sám schopný jako odvodit, co s tím má vlastně jako dělat.

A podobně, mně se to třeba stalo, když jsem vlastně jako dával YouTube videa jako reference toho, z čeho chci vycházet, tak on neměl předinstalovaný nějaký nástroje, jak si to viděl stáhnout, ale on si zkrátka stáhnul command line tool, který je etdlblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblblbl Obrovská výhoda. Dostanem se teďka k těm rizikům a pak se ještě dostanu k tomu, jak mám já udělaný ten setup, abych ty rizika co nejvíc mitigoval. Pochopitelně ty rizika lidem, který jste technický, tak jsou určitě jako jasný. Má přístup k vašim datům, to znamená, že si je může jako postahovat.

Výhoda je, že běží u vás lokálně, takže ty data zůstavají u vás. Samozřejmě používáte nějaký modely. Můžete používat i lokální modely, jo? 6.

Takže my ty data stejně posíláte, ale to si troufnu tvrdit, že děláme tak nějak jako všichni uspousty dat, že to prostě používáme třeba přes apku Cloud. Takže to je vlastně to samé, takže tam to riziko podle mě není o moc větší, než když používáte jako klasický, či GPD, nebo Cloud. Jde to riziko, za mě jako přichází také právě, že má plnou kontrolu nad tím počítačem. Znamená, že může cokoliv smazat, může cokoliv jako rozbít a zkrátka jako může tam cokoliv pokazit, protože nemá ty guardrails, nemá prostě tu ochranu, aby se vás třeba doptával, nebo že mu něco zakazujete.

A zároveň tak může instalovat programy z internetu. Vy jako zase můžete to určitě téma mechanizmama omezit, ale on je schopný instalovat si ty programy, který potřebuje. Takže jako teoreticky si může stáhnout nějakej malware, který by pak ohrozil ty vaše ty vaše data, co tam máte. Tak, to je za mě jako samozřejmě obrovský riziko.

Je nutné si říct, že ten agent nefunguje tak, že by jako sám proaktivně něco dělal, respektive on má různý mechanizmy, aby byl schopný něco sám proaktivně dělat. To jsem ještě zapomněl zmínit, že on má takzvaný heartbeat, což je vlastně pravidelný spuštění nějakého jako textovýho souboru se zadáním, takže vy si do toho hardbeatu můžete uložit, že jako hele, pokaždý z kontrolu myli, pokaždý udělej tohle a on jako pravidelně bouchá mu to jako srdíčko v filozofkách ten hardbeat a provádí tu akci jako periodicky. To frekvenci heartbeatu si myslím, že můžete nastavit. No a případně je ještě takový druhej mechanismus, který mu se říká takzvaný cronjob.

A to je jako velice známej pojem v tom IT světě. Cronjob spočívá v tom, že vy vlastně počítači řeknete, udělej mi tady tu akci přesně v tenhle čas, nebo jí dělej přesně ve 12 hodin každej den. Zkrátka je to mechanismus, jak nastavit opakující se úlohy. Takže vy můžete využívat ten cronjob, aby spouštil nějakou akci.

Já to třeba využívám na nastavování novinek do Discordu a tak dál, takže jako můžete využívat i ty koronjoby. No a kam jsem se tím chtěl dostat, nejenom že jsem na to zapomněl to zmínit, ale u té bezpečnosti, tak to riziko není ani tak v tom, že vy si píšete s tím botem a on něco dělá. Tam samozřejmě to rizikoje, protože vy nevidíte ten tool use, jo? V tom Telegramu vy vidíte prostě váš bod píše a nevidíte, co dělá na pozadí, takže teoreticky v tomhle bodě se taky může stáhnout nějaký prompt, nějaký prompt injection, který ho napadne a vlastně nechá ho udělat nějaký nebo stáhnout nějaký malware do počítače a jste trošku v high.

Ale zároveň u těchto hard beatů nebo těch kronů, těch periodických úloh, tak zase můžete ho nechávat čekovat a kontrolovat nějaké stránky. A v tu chvíli vy ani nemusíte mít nebo vědět o tom, že se něco děje, protože on vám o tom neřekne. On to dělá jako na pozadí. A tím pádem může tam něco stáhnout, nainstalovat, odesílat nějaké data.

a vy jste schopní kontrolovat nějakým Activity Logu, ale celá ta premisa je, že vy na to nekoukáte, že vám to běží a ten Activity Log je spíš postmortem, když se něco stane, tak vy si můžete dohledat ty kroky, co ten agent udělal. Takže tohle jsou za mě obrovské dvě rizika, které jídí s tím, který to skýtá a je potřeba je mít na paměti. Třetí obrovské riziko je ta samotná instalace, respektive jako lidi, který nejsou tolik zběhlí tady v tom, tak často to neudělají tak, že mají doma nějaký starý počítač, kde se jim válí a neinstalují si ho tam, ale často to instalují na takzvaný VPSky, což jsou servry. je jako extrémně důležitý ten server mít dobře zabezpečený, protože jakmile si vystavíte nějaký server, koupíte ho na Hetzneru, Hostingeru, někde, tak jako první věc, co, tak budou scanovat ty volné porty a krátké jako útočníci budou hledat cestičky, jak se do toho vašeho serveru dostat, jak ho napadnout.

a vy ho musíte mít jako dobře zabezpečený. Já se chystám udělat video, kdy vlastně použiju přístup, návod od mýho kamaráda, který se vlastně jako zabývá DevOpsem a je v tom jako extrémně zběhlej a připravil vlastně jednoduchý návod, jak si OpenCloro zběhnout na servoru, takže určitě brzo na YouTube vyjde i video na to. No a tohle je extrémně důležité, protože existují články a depozitáře, kde lidi sbírají takovéto otevřené servery a zkrátka existuje na internetu neuvěřitelné množství tady těch děr nebo děravých serverů s tím OpenCLO. Vy se tam prostě můžete napojit, můžete mu posílat nějaké příkazy a ty lidi tam mají připojené svoje osobní služby, svoje osobní data a je to obrovský problém.

Takže tohle je za mě třetí největší riziko. No a pak samozřejmě nějaká ztráta dat, že jako tam pustíte toho bota, on s tím může něco jako dělat, tak to je pochopitelně taky jako velkej problém, že ten bot může vám něco smazat, ale pokud používáte různý cloudový služby, tak oni mají dneska jako zálohy, mají history, mají nějaký changelog, takže jako tyhle věci jste potažmo schopný odhalit, byť toto riziko je docela velký. No a tak to jsme si tak jako prolítili. Rizika ono jich tam je víc, ale tohle jsou za mě ty nejzásadnější.

A jak to řeším já? Já jsem si OpenCLO rozběhnul na svým starým Macbooku, který normálně mám jako zaklapnutou obrazovku, mám ho připojený jako do televize, aby myslel, že má nějaký jako display a neusínal. To jsem mimochodem zjistil, že je jako obrovský problém přesvědčit Macbook, aby neusínal, když má zavřený display. Teď jsem si ještě pořizoval, říká se tomu dummy plug, to je vlastně jako do DisplayPortu, respektive já bavím jako USB-C adapter a pak DisplayPort, nebo ale dělají to i na HDMI, nebo i na C.

kdy je to virtuální displej. Ono to nikam nevede, ale ten MacBook si myslí, že tam je ten displej a posílá tam ty signálový data, takže vy se pak do toho MacBooku nebo do toho jakýkoliv počítače jste schopni připojit třeba přes Steam Viewer. A to je aplikace, která umožňuje ovládat vzdálenou plochu. Takže celá tato šaškárna je kvůli tomu, abych mohl mít zavřený výčko, aby ten MacBook doma vypadal hezky a nebyl jakto otevřený pořád někde na stole.

Normálně byste to mohli přeskočit, pokud vám nevadí jako otevřený display, nebo si třeba koupíte Mac Mini, nebo máte nějaký stolný počítač. To je ten setup. Proč to mám na Macu? Jsou kvůli tomu jako dva důvody.

Za první, nechci to mít vystrčené ven v internetu na nějaké veřejné IP adrese, což servry jsou. A jestli můžete si ho zabezpečit, můžete si jako na to nabacha, ale zkrátka mně vyhovuje to, že mám to doma, hardwarově, lokálně. Vím, že to je připojené do internetu, ale přes neveřejnou IP adresu. To znamená, že to ani nemůžou ty útočníci skinovat, ale jde to jako přes můj router.

takže je to jako schovaný za nějakou domácí adresou. Další výhodou, kterou jsem do nedávna netušil, a právě mě na to upozornil kamarád právě, že tím, že když to máte na serveru, tak ty veřejné IP adresy jsou často známé, že tam můžou být boti a tím pádem nějaké služby vás budou blokovat, kdežto když to máte doma za tou vlastně IP adresou toho vašeho poskytovatele, tak je to jako mnohem míně nápadný, že je to nějaký bot. Tady je zajímavá úvaha, přiznám se, že jsem ji jako neuvěřoval, ale je to myslím si, že taky jedna z výhov. Takže mám tady ten lokální setup, tam mi běží OpenCLO, mám ho připojený přes Telegram a Discord.

Ještě se jako sluší zmínit, že teda pro to provozování, tak tam mám Anthropic Subscription, normálně mám Maxplan, takže za mě to funguje jako skvěle. Uvidíme, kdy to Anthropic zatrhne, kor, když se teďka Peter domluvil s OpenAI na spolupráci, ale k tomu se dostaneme úplně na závěr, tak uvidíme, jak dlouho to vydrží. Nicméně vždycky můžete přepnout na OpenAI jako předplatný, nebo na API klíče. Takže jako vždycky těch cest, jako Peter to navrhnul, takže těch možností je tam jako neuvěřitelně moc, na co to můžete napojit.

GitHub předplatný a tak dále. Takže to je to, jak to běží. No a ten komunikační kanál, tak mám právě jako Telegram. Ten mám na takové rychlé zprávy, kde si prostě píšeme a řešíme nějaké úkoly.

A potom mám Discord. A to mi začalo fungovat teď naprosto skvěle. Jsem na začátku, takže ještě nechci úplně předbíhat. Já pak na to zase opět asi na YouTube udělám nějaké deep dive video, jak mám ten setup postavený.

a mám udělený Discord vlastní server, kde jsem jenom já, a tam mám různý kanály podle kontextu rozdělený a vždycky jsem mu řekl, hele, v tomhle kanále budeme řešit třeba jenom tohodle klienta, tady máš přístup do Notionu, tady máš nějaký dokumenty, tady máš další věci. Mám asi jako nakonfigurovaný, že v tomto kanálu se řeší tenhle kontext, takže já pak můžu psát do více kanálů paralelně. Oni to jsou vlastně jako nezávislý sessions. No a zároveň vždycky vím, že kontextově ten bot ví, co má dělat.

Takže když mu řeknu, hele, načti mi spoznámek, kde je deadline, tak on prostě ví, že se má podívat do tady toho Notionu, tady ty data pro tohohle klienta a vlastně to jako zjistí. To je za mě jako byl extrémní hack, protože v tom Telegramu v té jedné konverzaci vy mu po každým musíte vysvětlovat, co chcete, což je jako extrémně neefektivní. Tohle je za mě jako úplně skvělý s tím Discordem. Proč jsem šel do Discordu?

Přijde mi, že Discord je víc postavený jako zdarma a má ty kanály, kdežto Slack taky funguje dobře, ale tam hodně jako oklešťují ty funkce, máte tam omezenou ty historii. Zkrátka jako ten Discord mi přijde, že je víc friendly pro... pro zdarma plan a zároveň mám svoji Discord komunitu pro AI s rozumem a tam taky vlastně jsem pustil toho bota a jenom jsem ho omezil na to, aby mu nikdo nemohl psát, to je jako extrémně důležité, na to si musíte dát pozor, když toho bota pustíte někam na Discord tak by default tak on má jako povolení, aby ho kdokoliv označil, takže by se kdokoliv dostal k vašim datům a vy si musíte dát na tohle pozor a musíte mu vlastně jako zakázat ty kanály, aby ho nikdo nemohl označovat a on tam mohl jenom posílat. To je další jako extrémně důležitá věc.

Takže to je k tomu nastavení toho Discordu. Stejně tak na Telegramu i v těch personal messages na Discordu, tak vy tam můžete mít tzv. pairing mod. To znamená, že mu pošlete ten kód, co vám to poprvý vygeneruje a on si napáruje tu instanci a kdokoliv jiný.

Třeba na Telegramu, kde ten bot je veřejně dostupný, tak když si ho najde a napíše mu, on řekne, hele, dej správci tady ten kód a on tě připojí pak, až si spolu budeme povídat. a tohle je jako automatizovaná zpráva, to ani nestojí nic vás na tom subscription, takže takže tohle je vyřešený hezký, takže jenom na tohle je potřeba si dát bacha aby ty komunikační kanály byly zabezpečené. No a teďka k těm datům, aby nemohly nějaké věci se stát nebo utíct. Co se týče instalace těch programů, snažím se mu nedávat úplně instrukce, aby si to vyřešil sám a třeba mu dávám, aby mi dal report, co se instaluje a procházím to.

Tady jsem zatím nepřišel na nějaké hezčí řešení, Tady jsem prostě byl, boušel, ochotnej to riziko do jistý míry přijmout a bedlivě sleduju, co se na ten Mac instaluje, co tam je za programy a snažím se to kontrolovat, ale nenašel jsem zatím nějaký mechanizmus, jak to tomuhle úplně ubránit nějakému třeba jako prompt injection. Další věc je, že jak jsem to vyřešil s e-mailama, tak e-maily jsou vlastně informace, který přichází zvenku a kdokoliv mu může poslat e-mail a já jsem úplně nechtěl, aby ten bot vlastně automaticky reagoval na ty e-maily, protože tam je přece vlastně jako to riziko t-prompt injection, že někdo mi pošle e-mail a pokusí se toho bota napadnout. Takže já jsem mu vytvořil vlastní e-mailovou schránku a já mu ty e-maily přeposílám a vždycky mu tam napíšu, co chci, aby s ním jako udělal, anebo mu jenom přeposílám pro nějaký kontext, ale zkrátka já jsem ten, kdo ty e-maily zpracovává. Není to nejoptimálnější cesta?

Je mi to úplně jako jasný, že to není tak efektivní, jak kdyby on měl přísluh celý tým. jako mailový schránce, na druhou stranu přeposlat e-mail je akce jako na jedno kliknutí, možná na dvě a ta bezpečnost se tím za mě jako výrazně zvyšuje, protože by to byl vlastně jako nezabezpečený kanál, kdy s ním může někdo jako komunikovat a něco mu zadat a to já jsem prostě jako nechtěl. Samozřejmě vy mu nemusíte po každý říct reaguj na ty e-maily, co přijdou, vy mu je tam můžete mít jenom jako Jak to říct, jenom jako přístup a až na vyžádání on si k ním dostane. Ale zkrátka, jako nechtěl jsem, aby měl přístup k historii všech mojich e-mailů, protože přece jenom někde tam jsou třeba citlivý data.

A já jsem jako nechtěl, aby se k ním dostal. Podobně to mám řešený v Notionu. Mám vlastně pro toho bota přidělený jenom péže, kde vím, že nejsou extrémně citlivý údaje. Ano, jsou tam data, který bych asi nechtěl, aby jako utekly.

To je pravda. ale není tam něco extrémně důležitýho. Jsou to data, které, když utečou, tak si řeknu, to je nepříjemný, ale není to něco, co by vyloženě mi uškodilo. Takže kontrola přístupu, nepouštím ho zkrátka všude do toho Notionu.

Někde, kde mám nějaké smlouvy nebo něco podobného, tak tam přístup nemá, aby to nevidělo. Zase si tím ubírám určitou možnosti, určitou flexibilitu, ale zase ten trade-off, z hlediska té bezpečnosti, za mě je jako extrémně důležité. No a delší věc, to jsem ještě zapomněl zmínit, u toho Maca, tak za mě je jako extrémně dobrý to, že když to máte někde na servuru a někdo by převzal kontrolu nad vaším účtem, tak než se dopíšete té podpoře, než něco jako vyřešíte, tak to může trvat jako dlouho. Tady u toho Maca, když se něco pokazí a budu vědět, že je tam nějaký útok, tak já můžu vytrhnout ten kabel do internetu a jsem jako vyřešený.

Jo, samozřejmě jasně nezabrhaňte tomu, když o tom nevíte, ale je to taková ta hardwareová pojistka. Prostě vy vytrhnete kabel do internetu a v tu chvíli je jako konec. Cokoliv se dělo, tak prostě jako končí a to je za mě jako další obrovská výhoda. Prostě máte kontrolu nad tím devicem, ty data v něm jsou jako vaše a kdykoliv to můžete od toho internetu odpojit, u toho servru je to prostě jako složitější, když vám ho někdo napadne, teď se tam nemůžete dostat, musíte napsat na tu podporu a teď jako třeba neréaguje nebo jí to trvá Jasně můžete říct, nejsem doma, než bych se dostal domů, jasně jako spousta možností tam jako je, není to prostě řešení na všechno, ale přijde mi to vlastně hezky něco takovýhle humý.

Takže to je vlastně to moje řešení ty bezpečnosti. No a jak řeším, nebo jaký mám use case, na co to se teďka používám, tak nutno říct, že já si s tím hraju poslední asi tři nebo čtyři dny, takže jsem fakt takovou pravdu na začátku. Zkouším to, hraju si s tím. Udělal jsem tam vlastně jako tři use cases, řekněme zatím, že mám vlastně jako periodické čekování novinek na AI a dal jsem mu nějaký prompt, kdy jsem mu řekl, co mě zajímá, co mě naopak nezajímá, takže mám takový jako great filter, kdy ten bot každou půl hodinu jde jako na nějaký weby plus počumucha jako po internetu a pošle mi nějaký zajímavý články.

To jste si možná mohli všimnout v Discordu AI News. Dám pardon, AI novinky. Takže tam chodí teďka od homunculuse správy. Takže tak jsem si pojmenoval svého bota homunculus.

To je jako... Už dřív v alchimii, tak bylo asi nějak umělý lidský stvoření. Samozřejmě jsem strávil zase hodinu vymyšlením názvu pro svýho bota. Dejte mi vědět, když tak, ne jak se vám líbí název, nebo to můžete jako taky, ale spíš to, jak vám vyhovují teďka ty novinky.

Protože chodí častějíc. přijdou mi zajímavější, dovlákem někdy posílám i nějaký jako větší detail, vždyť ono to funguje tak, že ten bot mi to posílá do mýho Discordu, já si ty novinky čtu, dělám ještě delší filtr jako nad tím, případně s ním jako diskutuju ten titulek, ten popisek, aby dával smysl, protože jako nechci se dostat do bodu, kdy vám tam sypuju jenom jako novinky generovaný AI a nejsou jako kontrolovaný mnou a přidávaný nějakej pohled, nějaký vysvětlení, to prostě jako nechci, takže proto tam jsem pořád já, zároveň já vím, že si to chci číst, takže funguje to tak, že to přijde do mýho osobního Discordu, jako do serveru, do kanálu AI News, já si to tam čtu, ve vlákně s tím botem jsem schopnej vyiterovat ten titulek, nebo třeba rozepsat nějaký detaily, protože mě to samotnýho zajímá, a to vám pak vlastně nechám toho bota řeknout, super, pošli to. A on to vezme a pošle to do AI Novinky v AI Srozumem. A tam to vlastně jako vidíte.

Takže dejte mi vědět, jestli vám toto vyhovuje. Za mě to je jako super, protože tam jsou zajímavější novinky, jsem tam schopný efektivně něco posílat. A nemusím to dělat ručně. To je taky jako super.

A zároveň to není úplná automatizace, kdy se jako random vytvoří nějaký titulek, popisek a vlastně to tam dá automaticky a není to úplně kurátorovaný, což jsem prostě zatím nechtěl. Takže to je ten news case na novinky. Ono funguje jako skvělé, zapříklad já jsem výsobraz a zadruží i vy. No a delší use case je právě to napojení na data mejch třeba jako klientů.

Zase jako nejsou tam úplně ty nejcitlivější data, ale nějaký obecní data tam jsou. A mám udělaný Discord kanály podle toho klienta. A vlastně já jsem schopnej si o tom klientovi tam psát s tím OpenCLO. Jsem schopnej mu zadávat nějaký úkoly, tvořit v Notionu nějakou dokumentaci.

A vlastně jako on to vytvoří, zadá do Notionu, já se pak do Notionu můžu podívat. a jako pracuju s tímhletím stylem. Přijde mi to jako super, jo, třeba prostě udělám si transcription, tak ho tam prostě hodím, řeknu, hele, udělej mi do Notionu poznámky, udělej nějaký schrnutí a jdu pryč, prostě nechám ho pracovat, můžu jít do jiného kanálu a tam můžu zase jako vytvořit novou session, no to je jako nová konverzace, nezávislá na tý první a můžu něco jako dělat zase a a pracovat na něčem jiném a on si to tam prostě hodinky chroupe a potom jako vyřešeno. Takže jako za mě super, super tady z toho a další věci jsou prostě nějaký normální věci, že si s tím na Telegramu píšu, řeším nějaký věci, brainstormingy.

Co je super, tak můžete zadávat jako úkly, aby si změnil nějakou konfiguraci sám sebe. To je za mě taky jako super vlastnost toho OpenCloud, že vy vlastně jako konfigurujete věci tím, že si s ním povídáte. Pochopitelně je fajn si to otestovat nebo to zkontrolovat, protože může dělat chyby. cz atd.

A nechám ho tam vlastně tvořit ten kód, takže mu vždycky třeba v Discordu nebo někde zadám nějaký úkol, nebo třeba ho pak napojím na GitHub issues a když ho přiřadím, tak on to zapracuje a otevře mi takzvaný pull request, kde já to budu schopný zkontrolovat. A zase ten cíl je, vlastně, mít tam cloud kóda a on umí ovládat cloud kóda. Takže jako vlastně nechat ho vždycky tu zapracovat cloud kódem, otestovat a poslat mi pull request. A ta idea je, že já prostě mu to můžu zadávat z telefonu a pak jenom přijít a zkontrolovat si to a potívat se na to.

Takže za mě zase jako obrovský benefit. Zase oddělený GitHub účet. Nechci, aby se za prvý vydával za mě a za druhý měl přísu ke všemu, k čemu mám přístup já, ale zase chci řídit ten přístup nějak jako rozumně. Takže tohle je jako další step a poslední step tak je, že využívám ho na různý researche tím, že on si může instalovat ty programy.

On fakt nemá problém, když mu hodíte tady odkaz na YouTube video a budete chtít nějaký třeba vystřihnout zajímavý scény. Mu to dáte a on je schopný to video projít, udělat screenshoty. a zkrátka poradí si skoro se všim. Když tam nemá ten nástroj na to, tak se zeptá, jestli to je za vás dobrý nápad, jestli je tady tou cestou, a zkrátka je schopný to vytvořit.

Takže teď ho potřebuji ještě dopušovat, aby jsem využil nejvíc tu sílu toho lokálu, toho, že má přístup k tomu počítači. už teďka obrovská výhoda tím, že je schopnej vlastně mi popropojovat různý služby a mám to ze svejch komunikačních kanálů, můžu se stavět jak chci, nejsem prostě závislý na appce třeba Cloud, nebo Cloud Code, který zase termináloval, nemá hezkou mobilní appku. Jo, zkrátka, jako vždycky jsem narážel na nějaké limity, že jako Cloud Code je super, ale je jenom ztermináloval, ještě na mobilu nic moc, appka Cloud je jako super, ale nemůžu tím ovládat počítač, ale mám zase přístup jako z telefonu, dobrý, a tady to za mě krásně vlastně jako pospojovává všechno dohromady a hlavně vám dává tu flexibilitu. Kod je open source, můžete se podívat, můžete si s ním pohrát a jako pokud chcete, tak prostě reverse inžinírovat, jak je to postavený.

To je asi pro tady ten díl všechno. Já bych o tom dokázal mluvit delší hodiny, ale doufám, že jste získali nějakou představu o tom, co OpenCLoud je, jak ho můžete používat, v čem je ta jeho nesporná výhoda, jaký jsou rizika, na co si musíte dát bacha. a jak ho třeba používám já jako inspiraci. Vzmíním ještě jednou, je to fakt experimentální projekt, hodně rychle se vyvíjí.

vyvíjí ho jeden člověk, Peter Steinberger, teďka uzavřel dohodu s OpenAI, takže ten projekt by měl zůstat nezávislej, ten bude jako součást nějaký foundation a nebude do něj OpenAI zasávat, až ho bude sponsorovat, tak uvidíme za prvý, jak se bude rozvíjet ten projekt jako takový, jestli na něj Peter bude mít dostatek času, ale je open source, takže věřím, že to jako půjde, a druhá věc je, s čím zajímavým přijde OpenAI, protože jestli budou mířit podobným směrem, Bude to zajímavý. Na druhou stranu, myslím si, že OpenAI musí být víc zodpovědný než Peter sám, protože Peter vyhodil experimentální projekt, který uměl vládat celý počítač a jako hej, na vlastní riziko, já jsem přesně jeden člověk, já si hraju, dělám to prostě ze zábavy, tak jako co? Ale OpenAI už musí mít nějakou trošku větší odpovědnost. Takže jsem strašně zvědavý na tu dynamiku tý spolupráce, co nám to vlastně přinese.

Za mě je škoda, že se Peter nedomluvil s Anthropicem, protože přece jenom já ty Anthropic modely mám trošku radši, ale chápu, měli trošku taškařice i s tím jménem, vlastně Anthropic ho donutil to změnit, takže uvidíme. Jsem zvědavej, jak to OpenAI tady to posune a jestli to pomůže, protože Codex začíná být také jako velice dobrý nástroj. Mohli bychom tady polemizovat tak velice dlouho, ale jsem zkrátka zvědavej ten budoucí vývoj. Zatím tolik bylo inspirace jak OpenCLO, já chystám teďka videa, jak si nainstal OpenCLO na server a potom nějaký větší popis toho mýho setupu, jak to mám, ale tam si budete muset počkat, protože nejdřív z toho chci vytěžit maximum a pak až se s váma podělím o to, jak to vlastně používám.

I. s Rozumem, doufám, že jste si užili svoji kávu nebo cokoliv, co pijete, že jste se inspirovali. I. I.

s Rozumem, kde nově přichází novinky právě od mýho homunculus bota. a zároveň tam vedem diskuze na různý téma právě, co řešíme tady v tom podcastu, takže budu rád, když se tam připojíte a necháte mi komentář, co si o tady tom myslíte. A můžete samozřejmě komentář nechat na Spotify i na YouTube, takže kdekoliv, kde posloucháte, budu rád za jakýkoliv názor diskuzy, protože mi to přijde extrémně zajímavý téma. Díky moc, že jste se dívali nebo že jste poslouchali a budu se na vás těšit opět příště.

Mějte se moc krásně, čau.

Open Claw (dřív MoldBot, ještě dřív ClawdBot — projekt za pár týdnů vystřídal několik jmen, Anthropic donutil autora to přejmenovat) je open-source AI agent, který si zdarma stáhnete a spustíte na jakémkoli počítači nebo na VPS (virtuálním serveru pronajatém v cloudu). Jeho velká výhoda: má k dispozici celý počítač a může si na něm dělat, co chce. To přináší nástroje, o kterých se jiným agentům ani nesnilo — a zároveň obrovská rizika. Troufnu si říct, že je to teď možná nejsilnější AI agent, jakého si můžete rozběhnout. Dobrý sluha, zlý pán: s velkou mocí přichází velká odpovědnost, a tady to platí možná desetinásobně.

Jak to funguje

Nainstalujete ho na svůj počítač (nebo VPS) a dáte mu ho celý k dispozici. Připojíte si k němu channely — komunikační kanály — má je předefinované na Telegram, WhatsApp, Discord, iMessage a spoustu dalších. To je platform-agnostic přístup: komunikujete s ním přesně tam, kde už komunikujete běžně, nemusíte instalovat další nástroj. Pak ho napojíte na AI model — buď přes API klíč (korektní cesta, platíte za využití), nebo přes subscription (Codex od OpenAI, Anthropic, spousta dalších). Sám Peter Steinberger, autor projektu, doporučuje API klíč — Anthropic není fanouškem toho, aby na předplatném běžel takhle samostatný agent. Já jedu na Max planu od Anthropicu, zatím to funguje, uvidíme jak dlouho.

Agent si žije v počítači, má konfigurační soubory, paměť, „soul". Vy si ho ale typicky nekonfigurujete editací souborů — povídáte si s ním a on se podle konverzace sám nastaví. Drží si denní záznamy o tom, co jste řešili, takže se umí odkázat na včerejšek. Jeho hlavní zbraň je práce s bashem — terminálem. Modely jsou na shellové příkazy skvěle natrénované, takže agent umí rychle procházet soubory, filtrovat, hledat kontext. CLI nástroje preferuje před MCP servery — jsou token-efektivnější. A pracuje s počítačem víc do hloubky než třeba Claude Code: nebojí se stáhnout program, nainstalovat ho a pracovat s ním. Pošlete mu hlasovku z Telegramu a on si sám odvodí, že ji má přepsat (přes váš OpenAI klíč), připravit odpověď a poslat zpátky jako hlas. Když mu dáte odkaz na YouTube video, stáhne si yt-dlp, video projde, udělá screenshoty.

Tři hlavní rizika

Plná kontrola nad počítačem. Může cokoli smazat, rozbít, nainstalovat — nemá guardrails, neptá se na permissions. Teoreticky si stáhne malware. Data sice zůstávají u vás lokálně (modelu je posíláte, ale to děláme i přes apku Claude), takže to riziko není o moc větší než u běžného ChatGPT nebo Claude. Větší problém je ta plná kontrola nad strojem.

Proaktivní akce na pozadí. Agent má heartbeat (pravidelně se opakující prompt — „pokaždé zkontroluj tohle") a cron job (časovaná úloha). Když si píšete s botem v Telegramu, vidíte „bot píše", ale nevidíte, co dělá na pozadí — teoreticky tam může přijít prompt injection, tedy podvržená instrukce schovaná v datech, která agentovi přikáže stáhnout malware. U heartbeatu a cronu je to horší: necháte ho hlídat stránky a vůbec nevíte, že se něco děje. Activity log je spíš postmortem než ochrana.

Nezabezpečený VPS. Lidé, kteří nejsou tolik zběhlí, často Open Claw neinstalují na starý počítač doma, ale na server. Jakmile vystavíte server na veřejnou IP, útočníci hned skenují volné porty. Existují repozitáře, kde lidé sbírají otevřené servery — na internetu je neuvěřitelné množství děravých instancí Open Claw, kde mají lidé připojené osobní data a kdokoli jim může posílat příkazy.

Jak to mám postavené já

Open Claw mám na starém MacBooku, zaklapnutém, připojeném do televize, aby si myslel, že má displej a neusínal (mimochodem překvapivě těžké — pořídil jsem si i dummy DisplayPort plug, virtuální displej). Připojuji se přes TeamViewer. Celá ta šaškárna je kvůli tomu, aby MacBook doma vypadal hezky se zavřeným víkem — klidně to přeskočte, kupte si Mac Mini.

Proč Mac, ne server. Nechci to mít vystrčené na veřejné IP. Doma je to za routerem, na neveřejné IP — útočníci to nemůžou skenovat. Kamarád, který dělá DevOps, mě navíc upozornil, že veřejné IP serverů jsou často známé, takže vás některé služby blokují jako bota; domácí IP je méně nápadná. A největší výhoda: hardwarová pojistka. Když se něco pokazí, vytrhnu kabel do internetu a je konec. U serveru musíte čekat na podporu — a než se přihlásíte, útok běží dál.

Komunikační kanály. Telegram na rychlé brainstormy. Discord na hloubkovou práci — mám vlastní server jen pro sebe, kanály rozdělené podle kontextu („v tomhle kanále řešíme jen tohohle klienta, tady máš přístup do Notionu, tady dokumenty"). Můžu psát do víc kanálů paralelně, jsou to nezávislé sessions, a vždycky vím, že bot kontextově ví, co dělat. To byl pro mě extrémní hack — v jedné Telegram konverzaci mu po každém musíte vysvětlovat, co chcete. Pozor: když pustíte bota na Discord, ve výchozím nastavení ho může kdokoli označit a dostat se k vašim datům — musíte mu zakázat kanály, aby ho nikdo nemohl označovat. A pairing mód řeší to, že kdokoli cizí mu napíše: dostane jen automatickou hlášku „dej správci tento kód".

Data. U instalace programů mu nedávám volnou ruku — chci report, co se instaluje, a procházím to. Lepší řešení jsem zatím nenašel, to riziko do jisté míry přijímám. E-maily jsou informace zvenku, kdokoli mu může poslat e-mail — proto má vlastní mailovou schránku a já mu relevantní zprávy přeposílám s instrukcí. Nechci, aby měl přístup k historii všech mých e-mailů, někde tam jsou citlivá data. V Notionu mu dávám jen vybrané stránky bez extrémně citlivých údajů — smlouvy nevidí. Trade-off za bezpečnost, ale stojí to za to.

Na co to používám

Tři use cases zatím (hraji si s tím pár dní): periodické procházení AI novinek — bot „Homunculus" každou půlhodinu projde weby a pošle mi do Discordu zajímavé články přes můj „great filter"; já si je čtu, ve vlákně s botem iteruji titulek a popisek (nechci sypat čistě AI generovaný obsah bez mého pohledu) a pak řeknu „pošli to" do komunitního kanálu AI novinky. Druhý: klientské poznámky v Notionu — hodím mu transcript, řeknu „udělej poznámky a shrnutí", jdu pryč, přepnu do jiného kanálu, dělám něco jiného. Třetí: research s instalací nástrojů. Plánuji mu založit vlastní GitHub účet (oddělený — nechci, aby se vydával za mě a měl přístup ke všemu), napojit na issues a nechat ho otevírat pull requesty přes Claude Code, abych zadával úkoly z telefonu a jen kontroloval.

Co dál

Je to opravdu experimentální projekt, vyvíjí ho jeden člověk a teď uzavřel spolupráci s OpenAI — projekt zůstane open-source pod foundation, OpenAI ho bude sponzorovat. Jsem zvědavý na dynamiku té spolupráce. OpenAI musí být zodpovědnější než Peter — ten vypustil experimentální projekt ovládající celý počítač s „na vlastní riziko", protože je jeden člověk a hraje si. OpenAI už musí mít trochu větší odpovědnost. Škoda, že se Peter nedomluvil s Anthropicem — modely od Anthropicu mám raději — ale chápu, byly taškařice i s tím jménem. K detailům se vrátím v navazujícím YouTube videu, jak Open Claw bezpečně rozjet na VPS.


Vychází z Open Claw: Moje zkušenost s AI agentem, který ovládne celý počítač na YouTube kanálu AI s rozumem.