Vo svete umelej inteligencie sa v posledných dňoch potvrdzuje jeden z najzásadnejších technologických posunov posledných rokov: umelá inteligencia sa prestáva obmedzovať na text a obrázky a začína rozumieť videu v reálnom čase. Tento trend predstavuje prelom porovnateľný s nástupom jazykových modelov v roku 2023. Najnovšie oznámenia a testovania systémov spoločností Google (Gemini 1.5 Pro multimodal live), OpenAI (realtime multimodal interaction), NVIDIA (Omniverse ACE), Runway (Gen-4) a Meta (multimodal video reasoning) ukazujú, že AI už dokáže sledovať obraz, analyzovať prostredie, reagovať na situáciu a okamžite komunikovať s používateľom.
Pre malé a stredné podniky na Slovensku ide o technologický skok, ktorý zásadne mení možnosti automatizácie služieb, podpory zákazníkov, školení zamestnancov aj riadenia výrobných procesov.
Ešte donedávna generatívna AI…