ReALM – obsah
Čo je ReALM?
ReALM znamená “Reference Resolution As Language Modeling,” prelomové riešenie vyvinuté výskumníkmi spoločnosti Apple. Je to teda nový jazykový model (Large Language Model, LLM), ktorý považuje problém rozpoznávania referencií za úlohu v oblasti jazykového modelovania.
ReALM efektívne konvertuje rôzne typy kontextu na textovú reprezentáciu, ktorú následne spracováva ako súčasť jazykovej úlohy. To môže zahŕňať:
- konverzácie – ako sú textové správy, hlasové príkazy asistentovi alebo e-maily,
- prvky na obrazovke – napríklad fotografie, kalendár, widget počasia alebo aplikácie a procesy bežiace na pozadí.
Čo robí ReALM odlišným od iných modelov rozpoznávania referencií? Po prvé, prístup – namiesto spoliehania sa na spracovanie obrázkov, ReALM funguje v textovej doméne. To ho robí oveľa ľahším a efektívnejším, čo by malo umožniť jeho beh priamo na mobilných zariadeniach pri zachovaní súkromia používateľov.
V čom je ReALM lepší ako GPT-4?
Výskumný tím spoločnosti Apple porovnal ReALM s najvýkonnejšími jazykovými modelmi na trhu dnes – GPT-3.5 a GPT-4 od OpenAI. Výsledky boli pôsobivé. V úlohách rozpoznávania referencií dosiahla najmenšia varianta ReALM presnosť porovnateľnú s GPT-4! Väčšie modely ReALM dokonca prekonali GPT-4 v rozpoznávaní referencií na položky zobrazené na obrazovke (http://arxiv.org/abs/2403.20329).
Čo vysvetľuje túto výhodu? Po prvé, ReALM je skvelý pri doménovo špecifických dotazoch, ako sú tie týkajúce sa inteligentných domácich spotrebičov. To je preto, že ReALM demonštruje hlbšie pochopenie kontextu doladením modelu pre doménovo špecifické dáta.
Čo je viac, na rozdiel od GPT-4, ktorý sa primárne trénuje na obrázkoch skutočných objektov, ReALM vyniká v rozpoznávaní textových prvkov a komponentov používateľských rozhraní aplikácií. A práve pochopenie rozhrania je kľúčové pre plynulú interakciu hlasových asistentov s aplikáciami, ktoré dnes používame.

Zdroj: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)
Je toto začiatok éry skutočne inteligentných asistentov?
Skutočne, integrácia ReALM so Siri by mohla otvoriť úplne novú kapitolu v interakcii človeka s počítačom. S ReALM bude Siri schopná rozumieť príkazom, ktoré obsahujú odkazy na položky zobrazené na obrazovke smartfónu, ako aj na procesy a aplikácie bežiace na pozadí. Ale kedy bude táto možnosť dostupná pre používateľov? To je zatiaľ neznáme.
Zostáva nám len špekulovať na základe technických schopností modelu. Ako by mohla fungovať Siri poháňaná ReALM? Napríklad, ak prezeráte webovú stránku s obchodnými inzerátmi a vidíte spoločnosť, o ktorú máte záujem, môžete jednoducho povedať Siri: “Zavolaj tejto spoločnosti,” a asistent – využívajúci ReALM na analýzu kontextu – nájde telefónne číslo spoločnosti, ktorú špecifikujete, a iniciuje hovor. Nemusíte ani presne vysvetľovať, ktorú spoločnosť máte na mysli.
A to je len začiatok možností ReALM. Príkazy ako „Prehraj posledný playlist“ by umožnili intuitívnu kontrolu multimediálnych aplikácií a zariadení inteligentného domu. ReALM by mohol tiež umožniť Siri rozumieť kontextu konverzácií a histórii príkazov, aby asistent reagoval adekvátne na predchádzajúce požiadavky používateľa. To je krok smerom k inteligentným agentom, ktorý nás približuje nie k umelej inteligencii rozumejúcej našim požiadavkám, ale k takej, ktorá bude vedieť realizovať príkazy.
A toto je len začiatok toho, čo ReALM dokáže. Príkazy ako “prehrávaj posledný playlist” by umožnili intuitívnu kontrolu multimediálnych aplikácií a zariadení inteligentného domu. ReALM by mohol tiež umožniť Siri rozumieť kontextu konverzácií a histórii príkazov, aby asistent reagoval adekvátne na predchádzajúce požiadavky používateľa. To je krok smerom k inteligentným agentom, ktorý nás približuje nie k umelej inteligencii, ktorá rozumie našim požiadavkám, ale k takej, ktorá vie, ako vykonávať príkazy.
Žiaľ, používatelia zariadení Android budú musieť čakať. V súčasnosti nie sú žiadne informácie o plánoch spoločnosti Google pridať schopnosti Gemini do Google Assistant. Aplikácia Google Gemini pre zariadenia Android bola vyvinutá (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), ale zatiaľ nie je dostupná mimo Spojených štátov.

Zdroj: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)
Zhrnutie
ReALM je inovatívny prístup spoločnosti Apple k riešeniu problému rozpoznávania kontextu hlasovými asistentmi. Namiesto spoliehania sa na spracovanie obrázkov tento jazykový model konvertuje rôzne typy kontextu na textovú reprezentáciu, ktorú následne spracováva v jazykovej úlohe. Tento prístup zabezpečuje nielen vysokú presnosť rozpoznávania, ale aj schopnosť fungovať na mobilnom zariadení pri zachovaní súkromia používateľov.
Poskytnutie prístupu Siri k ReALM môže poskytnúť prirodzenejšie a kontextuálne hlasové interakcie, čo je dôležitý krok smerom k skutočne inteligentným asistentom. S ReALM bude Siri schopná okamžite reagovať na príkazy týkajúce sa položiek na obrazovke, aplikácií a procesov na pozadí. Jedna vec je istá – zlepšenie kontextového povedomia asistentov je kľúčom k vytvoreniu skutočne inteligentných a prirodzených hlasových interakcií, a ReALM je bezpochyby dôležitým krokom týmto smerom.

Ak sa vám náš obsah páči, pridajte sa k našej komunite usilovných včiel na Facebooku, Twitteri, LinkedIn, Instagrame, YouTube, Pintereste, TikToku.
Robert Whitney
Odborník na JavaScript a inštruktor, ktorý školí IT oddelenia. Jeho hlavným cieľom je zvýšiť produktivitu tímu tým, že učí ostatných, ako efektívne spolupracovať pri programovaní.
AI in business:
- 6 úžasných pluginov ChatGTP, ktoré vám uľahčia život
- Navigovanie nových obchodných príležitostí s ChatGPT-4
- 3 úžasní AI spisovatelia, ktorých musíte dnes vyskúšať
- Syntetickí herci. Top 3 generátory videa s AI
- Aké sú slabé stránky mojej podnikateľskej myšlienky? Brainstormingová relácia s ChatGPT
- Používanie ChatGPT v podnikaní
- Nové služby a produkty fungujúce s AI
- Automatizované príspevky na sociálnych médiách
- Plánovanie príspevkov na sociálnych sieťach. Ako môže AI pomôcť?
- Úloha AI v rozhodovaní v podnikaní
- Obchodný NLP dnes a zajtra
- AI-asistované textové chatboty
- Aplikácie AI v podnikaní - prehľad
- Hrozby a príležitosti AI v podnikaní (časť 2)
- Hrozby a príležitosti AI v podnikaní (časť 1)
- Aká je budúcnosť AI podľa McKinsey Global Institute?
- Umelá inteligencia v podnikaní - Úvod
- Čo je NLP, alebo spracovanie prirodzeného jazyka v podnikaní
- Google Prekladač vs DeepL. 5 aplikácií strojového prekladu pre podnikanie
- Automatizované spracovanie dokumentov
- Prevádzka a obchodné aplikácie hlasových botov
- Technológia virtuálnych asistentov, alebo ako komunikovať s AI?
- Čo je obchodná inteligencia?
- Ako môže umelá inteligencia pomôcť s BPM?
- Kreatívna AI dneška a zajtrajška
- Umelá inteligencia v správe obsahu
- Preskúmanie sily AI pri tvorbe hudby
- 3 užitočné nástroje na grafický dizajn s umelou inteligenciou. Generatívna AI v podnikaní
- AI a sociálne médiá – čo o nás hovoria?
- Nahradí umelá inteligencia obchodných analytikov?
- Nástroje AI pre manažéra
- Budúci trh práce a nadchádzajúce profesie
- RPA a API v digitálnej spoločnosti
- Nové interakcie. Ako mení umelá inteligencia spôsob, akým ovládame zariadenia?
- Multimodálna AI a jej aplikácie v podnikaní
- Umelá inteligencia a životné prostredie. 3 riešenia AI, ktoré vám pomôžu vybudovať udržateľný podnik
- Detektory obsahu AI. Stoja za to?
- ChatGPT vs Bard vs Bing. Ktorý AI chatbot vedie preteky?
- Je chatbot AI konkurentom vyhľadávania Google?
- Efektívne ChatGPT výzvy pre HR a nábor
- Inžinierstvo promptov. Čo robí inžinier promptov?
- AI a čo ešte? Hlavné technologické trendy pre podnikanie v roku 2024
- AI a obchodná etika. Prečo by ste mali investovať do etických riešení
- Meta AI. Čo by ste mali vedieť o funkciách podporovaných AI na Facebooku a Instagrame?
- Regulácia AI. Čo potrebujete vedieť ako podnikateľ?
- 5 nových využití AI v podnikaní
- AI produkty a projekty - čím sa líšia od ostatných?
- AI ako expert vo vašom tíme
- AI tím vs. rozdelenie rolí
- Ako si vybrať kariérne pole v oblasti AI?
- AI v HR: Ako automatizácia náboru ovplyvňuje HR a rozvoj tímu
- Automatizácia procesov s pomocou AI. Kde začať?
- 6 najzaujímavejších nástrojov AI v roku 2023
- Aká je analýza zrelosti AI spoločnosti?
- AI pre B2B personalizáciu
- Prípadové použitia ChatGPT. 18 príkladov, ako zlepšiť svoje podnikanie s ChatGPT v roku 2024
- Generátor mockupov AI. Top 4 nástroje
- Mikro učenie. Rýchly spôsob, ako získať nové zručnosti
- Najzaujímavejšie implementácie AI vo firmách v roku 2024
- Aké výzvy prináša projekt AI?
- Top 8 nástrojov AI pre podnikanie v roku 2024
- AI v CRM. Čo mení AI v nástrojoch CRM?
- UE AI zákon. Ako Európa reguluje používanie umelej inteligencie
- Top 7 AI tvorcov webových stránok
- Nástroje bez kódovania a inovácia AI
- Koľko zvyšuje používanie AI produktivitu vášho tímu?
- Ako používať ChatGTP na prieskum trhu?
- Ako rozšíriť dosah vašej AI marketingovej kampane?
- AI v doprave a logistike
- Aké obchodné problémy môže umelá inteligencia vyriešiť?
- Ako prispôsobiť riešenie AI obchodnému problému?
- Umelá inteligencia v médiách
- AI v bankovníctve a financiách. Stripe, Monzo a Grab
- AI v cestovnom ruchu
- Ako umelá inteligencia podporuje vznik nových technológií
- AI v e-commerce. Prehľad globálnych lídrov
- Top 4 nástroje na vytváranie obrázkov pomocou AI
- Top 5 nástrojov AI na analýzu dát
- Revolúcia AI v sociálnych médiách
- Je vždy výhodné pridať umelú inteligenciu do procesu vývoja produktu?
- 6 najväčších obchodných nešťastí spôsobených AI
- AI stratégia vo vašej spoločnosti - ako ju vybudovať?
- Najlepšie kurzy AI – 6 úžasných odporúčaní
- Optimalizácia sledovania sociálnych médií pomocou nástrojov AI
- IoT + AI, alebo ako znížiť náklady na energiu vo firme
- AI v logistike. 5 najlepších nástrojov
- GPT Store – prehľad najzaujímavejších GPT pre podnikanie
- LLM, GPT, RAG... Čo znamenajú skratky AI?
- AI roboty – budúcnosť alebo prítomnosť podnikania?
- Aké sú náklady na implementáciu AI vo firme?
- Čo robia špecialisti na umelú inteligenciu?
- Ako môže AI pomôcť v kariére freelancera?
- Automatizácia práce a zvyšovanie produktivity. Príručka k AI pre freelancerov
- AI pre startupy – najlepšie nástroje
- Vytváranie webovej stránky s AI
- Jedenásť laboratórií a čo ešte? Najperspektívnejšie startupy v oblasti AI
- OpenAI, Midjourney, Anthropic, Hugging Face. Kto je kto vo svete AI?
- Syntetické dáta a ich význam pre rozvoj vášho podnikania
- Najlepšie vyhľadávače AI. Kde hľadať nástroje AI?
- Video AI. Najnovšie generátory videí s umelou inteligenciou
- AI pre manažérov. Ako môže AI uľahčiť vašu prácu
- Čo je nové v Google Gemini? Všetko, čo potrebujete vedieť
- AI v Poľsku. Firmy, stretnutia a konferencie
- AI kalendár. Ako optimalizovať svoj čas vo firme?
- AI a budúcnosť práce. Ako pripraviť svoj podnik na zmenu?
- AI klonovanie hlasu pre podniky. Ako vytvoriť personalizované hlasové správy s AI?
- "Všetci sme vývojári." Ako môžu občianski vývojári pomôcť vašej spoločnosti?
- Overenie faktov a halucinácie AI
- AI v nábore – vypracovanie náborových materiálov krok za krokom
- Sora. Ako zmenia realistické videá od OpenAI podnikanie?
- Midjourney v6. Inovácie v generovaní obrázkov pomocou AI
- AI v MSP. Ako môžu MSP súťažiť s gigantmi pomocou AI?
- Ako mení umelá inteligencia marketing influencerov?
- Je AI naozaj hrozbou pre vývojárov? Devin a Microsoft AutoDev
- Najlepšie AI chatboty pre e-commerce. Platformy
- AI chatboty pre e-commerce. Prípadové štúdie
- Ako zostať informovaný o tom, čo sa deje vo svete AI?
- Ovládanie AI. Ako urobiť prvé kroky na aplikáciu AI vo vašom podnikaní?
- Perplexity, Bing Copilot alebo You.com? Porovnanie AI vyhľadávačov
- AI experti v Poľsku
- ReALM. Prelomový jazykový model od Apple?
- Google Genie — generatívny AI model, ktorý vytvára plne interaktívne svety z obrázkov
- Automatizácia alebo augmentácia? Dva prístupy k AI v spoločnosti
- LLMOps, alebo ako efektívne spravovať jazykové modely v organizácii
- Generovanie videa pomocou AI. Nové obzory vo výrobe video obsahu pre podniky
- Najlepšie nástroje na prepisovanie AI. Ako premeniť dlhé nahrávky na stručné zhrnutia?
- Analýza sentimentu pomocou AI. Ako pomáha poháňať zmenu v podnikaní?
- Úloha AI v moderovaní obsahu