dnes je 17.5.2026

Input:

AI sa učí pracovať s videom v reálnom čase: prichádza generácia „živých multimodálnych modelov“

9.4.2026, Zdroj: Verlag Dashöfer

Vo svete umelej inteligencie sa v posledných dňoch potvrdzuje jeden z najzásadnejších technologických posunov posledných rokov: umelá inteligencia sa prestáva obmedzovať na text a obrázky a začína rozumieť videu v reálnom čase. Tento trend predstavuje prelom porovnateľný s nástupom jazykových modelov v roku 2023. Najnovšie oznámenia a testovania systémov spoločností Google (Gemini 1.5 Pro multimodal live), OpenAI (realtime multimodal interaction), NVIDIA (Omniverse ACE), Runway (Gen-4) a Meta (multimodal video reasoning) ukazujú, že AI už dokáže sledovať obraz, analyzovať prostredie, reagovať na situáciu a okamžite komunikovať s používateľom.

Pre malé a stredné podniky na Slovensku ide o technologický skok, ktorý zásadne mení možnosti automatizácie služieb, podpory zákazníkov, školení zamestnancov aj riadenia výrobných procesov.

Ešte donedávna generatívna AI

Dasi - digitálny asistent
Dasi