Seznam.cz opět boduje na poli produktů vyvíjených vyloženě pro české prostředí. Na vlastním LLM SeLLMa postavil prvního veřejně dostupného českého chatbota Seznam Asistent. A to v momentu, kdy globální hráči nemají plně lokalizované řešení pro český trh. Při investici přes 100 000 000 CZK do SeLLMa. Pravdu říct, tohle není jen další chatbot postavený na další z nespočetných AI. V rukou Seznamu se může AI stát unikátní kvalitou, která nakopne všechny jeho aktivity. Jak?

Strategický kontext na poli AI
Pokoušet se o přímé srovnání výkonu Seznam Asistenta s globálními AI jako ChatGPT nebo Gemini je v tento moment irelevantní – modely se vyvíjejí týden co týden. Mnohem podstatnější je strategický princip, který tento krok představuje pro Seznam: přechod od prostých digitálních služeb vyhledávače a speciálizovaných portálů k integrovanému prostředí využívajícímu strojové učení a AI ke konverzačním odpovědím a komplexním operacím.
Seznam Asistent nesoutěží v absolutním výkonu, ale brání si svůj ekosystém. Cílem je udržet uživatele na svých službách tím, že jim nabídne bleskovou syntézu operabilních informací. A právě to fundamentálně mění pravidla hry pro všechny, kdo tvoří obsah.
Pozice Seznam.cz
Ostatně Seznam je ojedinělou rybkou internetu. Jeho vyhledávač Seznam.cz je jedním z mála národních vyhledávačů, který je schopen konkurovat všudypřítomnému Googlu a ukousnost slušný podíl vyhledávání na národní úrovni. Nezmiňuji to jen tak – je to dobrý základ pro pochopení toho, jaký potenciál mají AI prvky implementované do služeb Seznamu.
Co je Seznam Asistent?
Seznam Asistent je konverzační nástroj poháněný vlastním jazykovým modelem SeLLMa, aktuálně běžící v beta testování na asistent.seznam.cz. LLM SeLLMa při složitějších dotazech zatím doplňují modely OpenAI běžící na evropských datacentrech Microsoft Azure – dlouhodobým cílem je však provozovat Aistenta výhradně na interních jazykových modelech a ve vlastních datových centrech
, nastiňuje Seznam. Beta není dostupná všem, ale jen vybraným a registrovaným uživatelům Seznam.cz.
Aktuální limity užívání
| Typ účtu | Denní limit dotazů | Týdenní limit dotazů |
|---|---|---|
| Standardní účet | 40 dotazů | 100 dotazů |
| Seznam bez reklam | 400 dotazů | 400 dotazů |
Limit na jednu konverzaci
V rámci testování je limitován i rozsah každé jedné konverzace. Seznam uvádí, že je možné položit maximálně 10 dotazů v jedné konverzaci. Po vyčerpání limitu je potřeba začít novou konverzaci, aby byla zachována co nejvyšší kvalita odpovědí. Tento limit plánujeme postupně navyšovat.
Zdroje dat
Seznam Asistent není omezen vlastním datasetem. Využívá RAG architekturu (Retrieval-Augmented Generation) a pro každou odpověď si dynamicky sáhá:
- do vyhledávacího indexu Seznam.cz
- do zpravodajského indexu
- do strukturovaných dat vlastních služeb (Mapy.com, Firmy.cz, Počasí.cz)
- do dalších interních zdrojů (SeznamZpravy.cz, Novinky.cz ad.)
Jak pracuje?
- Uživatel zadá dotaz
- asistent přeloží do vyhledávacích dotazů, které jsou směřovány na indexy a zdroje
- provede rychlou rešerši TOP výsledků hledání a extrahuje z nich textový obsah a informace
- obsah předá jazykovému modelu SeLLMa (zatím i GPT) a ten z něj vygeneruje souvislou odpověď
- fakta jsou ozdrojována pomocí číselného poznámkového aparátu, který umožňuje okamžité ověření
Co víme o Šelmě?
- není postavená od nuly (způsobem full retraining), ale pomocí continued pretraining a fine-tuning postavená na open-source Llama 3.1 70B a Mistral AI
- obecnější text o seznámáckých LLMs zmiňuje ještě
techniky RetroMAE (Masked Autoencoder for Retrospective Learning), unsupervised fine-tuning a multilingual-distillation
- obecnější text o seznámáckých LLMs zmiňuje ještě
- je dostupná ve verzích 7B a 70B parametrů (dle koment Diany Hlaváčové, která má na starost SeznamAI) – naběhnout za 1-2 min/4-5 minut
- pro trénování a inferenci využívá stovky Nvidia H100 a čistě pro infenci Nvidia L4
- nasazení běží přes KServe (orchestrační framework Kubernetes) s load balancingem a autoscalingem (viz Marek Šimůnek, tech lead týmu LLM)
- LLM proxy: Seznam provozuje centrální proxy, která může dotazy směrovat na různé modely a komerční API
- tým SeznamAI má cca 50 lidí – většina pracuje právě na SeLLMa
Co se dá o Šelmě tipnout? Odvozeno z Llama 3.1 70B
- kontextové okno: 128.000 tokenů (kontext okno Seznam Asistenta může být omezeno produkčním nastavením)
- znalostní cutoff: 12/2023
- architektura: dense transformer, Grouped-Query Attention, 80 vrstev, 8192 hidden dim, 64 heads
- jazyková podpora: CZ, EN + dalších 7 jazyků (DE, FR, IT, PT, ES, HI, TH)
- continued training a fine-tuning se mj. soustředil na češtinu => podpora češtiny bude lepší než u Llama 3.1 70B, globální multijzazyčný výkon může být jiný
- učební dataset nejspíš tvořily i Novinky, Seznam Zprávy, Firmy, veřejný web, logy dotazů
- pro cílení na české preference nejspíš využito RLHF

Jaké jsou další emanace SeznamAI?
Seznam Asistent není první implementací AI ve službách Seznamu. SeLLMa mj. dělá:
- shrnutí
- článků uvedených na hlavní straně Seznam.cz
- trendujících témat (zobrazovaných pod oknem vyhledávání či na search.seznam.cz)
- nejčastějších témat diskuzí (Seznamem označováných jako Top narativy) na Novinky.cz a SeznamZpravy.cz
- překlady názvů zahraničních článků do češtiny
- generování předmětů emailů na službách Seznam Email
- inicializace chatbota se už probojovala pod vyhledávácí pole (zcela po vzoru Režim AI na Google.com)
umělé moderátory na vlnách rádií Expres FM a Classic Praha a čtení audioverze článků
(O-Seznam.cz)- a další
To není ale tak podstatné, jako to, co se od Seznam Asistent/SeLLMa/SeznamAI očekává. Počítá se s tím, že se probojuje na oborové weby a další služby Seznamu.
Klíčové přednosti SeznamAI
- doslova nativní orientace na český trh, český internet a českou češtinu
- SeLLMa je doučená na českém korpusu, českých datech a českých zdrojích Seznamu, proto rozumí jazyku, reálilím i kontextu mnohem lépe než globální LLMs
- Seznam Asistenta nečerpá jen z globálního webu, ale primárně z indexů a obsahových služeb Seznamu
- uživatel tedy dostává nikoliv lokalizované odpovědi anglofonní bubliny, ale odpovědi nativně české
- aktuálnost a ozdrojované informace
- díky RAG a živým indexům asistent nemusí halucinovat z tréninkového datasetu, místo toho provádí rychlou rešerši aktuálních, živých dat
- reaguje na aktuální události, zcela nové informace (články) a trendy fakticky v reálném čase
- odpovědi doplňuje o citace konkrétních zdrojů, které lze snadno ověřit
- datová politika a ochrana soukromí v evropském střihu
- od začátku navržen s ohledem na GDPR
- data se zpracovávají v rámci EU – cílem je čiště vlastní infrastruktura
- dotazy se uchovávají max. 6 měsíců, pak jsou anonymizovány
- uživatele explicitně varuje před vkládáním citlivých údajů
- a to se rovná bezproblémové compliance při nasazení
- (data z Asistenta mohou být použity k personalizaci reklamy na základě souhlasu)
- vlastní AI
- Seznam není přeprodejce globální API
- trénuje a provozuje na vlastním hardware
- vyvíjí vlastní LLM, může ho ovlivňovat, ladit a rozvíjet dle specificky lokálních potřeb
Jaký je potenciál AI v rukou Seznamu?
Seznam nemusí vyvíjen nejdokonalejší LLM. Seznam nemusi dbát na veškeré uživatelské prvky rozhraní chatbota. A nemusí podávat špičkové výkony v multimediálních vstupech a výstupech. Potenciál Seznamu tkví v jeho již existujích službách. A jejich seznam není krátký:
Služby a portály
- Vyhledávání (Seznam.cz)
- Email.cz
- Email Profi
- Mapy.com (dříve Mapy.cz)
- Firmy.cz
- Zboží.cz
- Sbazar.cz
- Sauto.cz
- Sreality.cz
- Sklik.cz
- Porovnej24.cz
- Volnámísta.cz
- Počasí.cz
- Sdovolena.seznam.cz
- Horoskopy.cz
- Slovník.cz
- TV Program (tv.seznam.cz)
- Obrázky
- Hry.cz
- Garáž.cz
- Proženy.cz
- Super.cz
- Novinky.cz
- Sport.cz
Mediální a obsahové služby
- Seznam Zprávy
- Televize Seznam
- Stream.cz
- Podcasty.cz
- Médium (dříve Seznam Médium)
- Expres FM
- Classic Praha
Ostatní služby
- Prohlížeč Seznam.cz (webový prohlížeč)
- Služby firem
- Homepage Seznam.cz
Představte si, že by Seznam dokázal všechny tyto aktivity propojit se SeznamAI. Služby nemusí být zdrojem konkrétních informací a velkých dat, mohou se také stát nástroji ovladanými AI agenty. Naprostým ideálem by byla všemocný AI agent, který by dokázal čerpat info a pracovat se všemi těmito službami, a vykonával komplexní úkoly. Dnes to ještě zní jako vzdálená vize, ale každý zítřek je jiný než dnešek.
Ach, ty eponymní názvy (v očích copywritera)
Branding Seznamu vypadá, jako by mermomocí usiloval o hegemonii všude kam vleze – po vzoru Kofoly, která se stala synonymem pro všechny colové nápoje, které nehrají ligu Coca-Cola x Pepsi Cola. A tak do mnoha názvů cpe vlastní jméno (Seznam Asistent, Seznam Prohlížeč, Seznam Zprávy), případně se snaží zcela ovládnout obecná označení daného produktu (znovu poslouží příklad Seznam Zprávy, Email.cz, Mapy.com, Lidé.cz).
Pravdu říct, ale takto uživatel jen stěží najde osobní vztah k těmto výtvorům. Co kdyby se sakra Seznam Asistent jmenoval prostě Šelma? Z čeho je to odvozené, je každému na druhý pohled jasné – a každý si raději pokecá se Šelmičkou než s nějakým asistentem. A že je vlastní jméno dokonce úspěšnější i ve snaze o onu označovací hegemonii v rámci brandingu, opět dokládá příklad s Kofolou.
Ale to jsou jen takové úvahy vyplývající ze základních principů copywritingu a komunikační strategie.
Optimalizovat na SeznamAI? Nikoliv nemožné (s úsměvem SEO specialisty)
Každý nástroj se dá ovlivnit. Stačí vědět jak pracuje, na kterých zdrojích si pochutnává, jaký vyhledávač používá, jak daný vyhledávač pracuje atd. Jinými slovy: i výstupy SeznamAI (stejně jako všech AIs a všech vyhledávačů) se dají ovlivnit.
Jak se dostat do SeznamAI?
Nejkratší cestou do povědomí v SeznamAI je optimalizace na vyhledávací index Seznam.cz. SeznamAI využívá TOP výsledky vyhledávání. A proto se šikne:
- jasná struktura a informační hiearchie webu s jasným H1 a logicky rozvržením podnapisů
- pečlivě implementovaná strukturovaná data (zvláště FAQ)
- praktická orientace obsahu postaveného na ozdrojovaných faktech
- konzistentní data na Firmy.cz a Mapy.com a přítomnost v dalších službách
- výskyt ve zpravodajských zdrojích spadajících pod Seznam
- inteligentě pojmuté off-page SEO
Ona tato “nová” optimalizace pro AI je jen důkladně dotaženým komplexním SEO, které stojí na synergii technicky čistého webu, důvěryhodného obsahu a silné externí autoriy (off-page SEO), jak jsou popsány v hlavní nabídce optimalizačních služeb.
Pokud naopak nechcete, aby SeznamAI pracovala s webem, pak budete muset zablokovat přímo crawler SeznamBot. SeznamAI využívá crawler vyhledávače, nemá vlastní crawler, a tím pádem neskýtá granulární opt-out pouze pro AI. Ovšem pokud zablokujete SeznamBot, ztratíte viditelnost ve vyhledávači Seznam.cz
SEO specialista a copywriter Daniel Beránek: expert na výkonově orientované SEO, Local Business SEO, datový a technický copywriting a budování brandu.
Odborné know-how a zkušenosti:
komunikace a psychologie: Mgr. psychologie, Mgr. žurnalistiky a komunikačních studií, novinářská praxe
SEO, weby, síťařina: vlastní praxe od 2013, každodenní práce s WP aj. CMS, webdesign, technická optimalizace vč. výběru webserverů, úprav .htaccess, výběru hostingu a CDN aj.
IT security: několik let přispívání pro SOOM.cz: portálu o IT security a hackingu + zaměření i na IT security v další novinářské praxi
e-commerce: příprava měsíčníku Novinky e-commerce pro eshop developera Shopsys, vlastní copywriting a SEO pro eshopy
retail: vybudování, provoz, osobní prodej a všechny ostatní aktivity v rámci maloobchodních prodejen pro bratra, vlastní retail: opakovaná účast na vánočních trzích – viz. Vánoční trhy: marže a umění prodat tisíckrát jinak