Čo je ReALM?

ReALM znamená “Reference Resolution As Language Modeling,” prelomové riešenie vyvinuté výskumníkmi spoločnosti Apple. Je to teda nový jazykový model (Large Language Model, LLM), ktorý považuje problém rozpoznávania referencií za úlohu v oblasti jazykového modelovania.

ReALM efektívne konvertuje rôzne typy kontextu na textovú reprezentáciu, ktorú následne spracováva ako súčasť jazykovej úlohy. To môže zahŕňať:

  • konverzácie – ako sú textové správy, hlasové príkazy asistentovi alebo e-maily,
  • prvky na obrazovke – napríklad fotografie, kalendár, widget počasia alebo aplikácie a procesy bežiace na pozadí.

Čo robí ReALM odlišným od iných modelov rozpoznávania referencií? Po prvé, prístup – namiesto spoliehania sa na spracovanie obrázkov, ReALM funguje v textovej doméne. To ho robí oveľa ľahším a efektívnejším, čo by malo umožniť jeho beh priamo na mobilných zariadeniach pri zachovaní súkromia používateľov.

V čom je ReALM lepší ako GPT-4?

Výskumný tím spoločnosti Apple porovnal ReALM s najvýkonnejšími jazykovými modelmi na trhu dnes – GPT-3.5 a GPT-4 od OpenAI. Výsledky boli pôsobivé. V úlohách rozpoznávania referencií dosiahla najmenšia varianta ReALM presnosť porovnateľnú s GPT-4! Väčšie modely ReALM dokonca prekonali GPT-4 v rozpoznávaní referencií na položky zobrazené na obrazovke (http://arxiv.org/abs/2403.20329).

Čo vysvetľuje túto výhodu? Po prvé, ReALM je skvelý pri doménovo špecifických dotazoch, ako sú tie týkajúce sa inteligentných domácich spotrebičov. To je preto, že ReALM demonštruje hlbšie pochopenie kontextu doladením modelu pre doménovo špecifické dáta.

Čo je viac, na rozdiel od GPT-4, ktorý sa primárne trénuje na obrázkoch skutočných objektov, ReALM vyniká v rozpoznávaní textových prvkov a komponentov používateľských rozhraní aplikácií. A práve pochopenie rozhrania je kľúčové pre plynulú interakciu hlasových asistentov s aplikáciami, ktoré dnes používame.

ReALM

Zdroj: DALL·E 3, prompt: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Je toto začiatok éry skutočne inteligentných asistentov?

Skutočne, integrácia ReALM so Siri by mohla otvoriť úplne novú kapitolu v interakcii človeka s počítačom. S ReALM bude Siri schopná rozumieť príkazom, ktoré obsahujú odkazy na položky zobrazené na obrazovke smartfónu, ako aj na procesy a aplikácie bežiace na pozadí. Ale kedy bude táto možnosť dostupná pre používateľov? To je zatiaľ neznáme.

Zostáva nám len špekulovať na základe technických schopností modelu. Ako by mohla fungovať Siri poháňaná ReALM? Napríklad, ak prezeráte webovú stránku s obchodnými inzerátmi a vidíte spoločnosť, o ktorú máte záujem, môžete jednoducho povedať Siri: “Zavolaj tejto spoločnosti,” a asistent – využívajúci ReALM na analýzu kontextu – nájde telefónne číslo spoločnosti, ktorú špecifikujete, a iniciuje hovor. Nemusíte ani presne vysvetľovať, ktorú spoločnosť máte na mysli.

A to je len začiatok možností ReALM. Príkazy ako „Prehraj posledný playlist“ by umožnili intuitívnu kontrolu multimediálnych aplikácií a zariadení inteligentného domu. ReALM by mohol tiež umožniť Siri rozumieť kontextu konverzácií a histórii príkazov, aby asistent reagoval adekvátne na predchádzajúce požiadavky používateľa. To je krok smerom k inteligentným agentom, ktorý nás približuje nie k umelej inteligencii rozumejúcej našim požiadavkám, ale k takej, ktorá bude vedieť realizovať príkazy.

A toto je len začiatok toho, čo ReALM dokáže. Príkazy ako “prehrávaj posledný playlist” by umožnili intuitívnu kontrolu multimediálnych aplikácií a zariadení inteligentného domu. ReALM by mohol tiež umožniť Siri rozumieť kontextu konverzácií a histórii príkazov, aby asistent reagoval adekvátne na predchádzajúce požiadavky používateľa. To je krok smerom k inteligentným agentom, ktorý nás približuje nie k umelej inteligencii, ktorá rozumie našim požiadavkám, ale k takej, ktorá vie, ako vykonávať príkazy.

Žiaľ, používatelia zariadení Android budú musieť čakať. V súčasnosti nie sú žiadne informácie o plánoch spoločnosti Google pridať schopnosti Gemini do Google Assistant. Aplikácia Google Gemini pre zariadenia Android bola vyvinutá (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US), ale zatiaľ nie je dostupná mimo Spojených štátov.

ReALM

Zdroj: Google Play (https://play.google.com/store/apps/details?id=com.google.android.apps.bard&hl=en_US)

Zhrnutie

ReALM je inovatívny prístup spoločnosti Apple k riešeniu problému rozpoznávania kontextu hlasovými asistentmi. Namiesto spoliehania sa na spracovanie obrázkov tento jazykový model konvertuje rôzne typy kontextu na textovú reprezentáciu, ktorú následne spracováva v jazykovej úlohe. Tento prístup zabezpečuje nielen vysokú presnosť rozpoznávania, ale aj schopnosť fungovať na mobilnom zariadení pri zachovaní súkromia používateľov.

Poskytnutie prístupu Siri k ReALM môže poskytnúť prirodzenejšie a kontextuálne hlasové interakcie, čo je dôležitý krok smerom k skutočne inteligentným asistentom. S ReALM bude Siri schopná okamžite reagovať na príkazy týkajúce sa položiek na obrazovke, aplikácií a procesov na pozadí. Jedna vec je istá – zlepšenie kontextového povedomia asistentov je kľúčom k vytvoreniu skutočne inteligentných a prirodzených hlasových interakcií, a ReALM je bezpochyby dôležitým krokom týmto smerom.

ReALM

Ak sa vám náš obsah páči, pridajte sa k našej komunite usilovných včiel na Facebooku, Twitteri, LinkedIn, Instagrame, YouTube, Pintereste, TikToku.

Robert Whitney

Odborník na JavaScript a inštruktor, ktorý školí IT oddelenia. Jeho hlavným cieľom je zvýšiť produktivitu tímu tým, že učí ostatných, ako efektívne spolupracovať pri programovaní.

View all posts →

AI in business:

  1. 6 úžasných pluginov ChatGTP, ktoré vám uľahčia život
  2. Navigovanie nových obchodných príležitostí s ChatGPT-4
  3. 3 úžasní AI spisovatelia, ktorých musíte dnes vyskúšať
  4. Syntetickí herci. Top 3 generátory videa s AI
  5. Aké sú slabé stránky mojej podnikateľskej myšlienky? Brainstormingová relácia s ChatGPT
  6. Používanie ChatGPT v podnikaní
  7. Nové služby a produkty fungujúce s AI
  8. Automatizované príspevky na sociálnych médiách
  9. Plánovanie príspevkov na sociálnych sieťach. Ako môže AI pomôcť?
  10. Úloha AI v rozhodovaní v podnikaní
  11. Obchodný NLP dnes a zajtra
  12. AI-asistované textové chatboty
  13. Aplikácie AI v podnikaní - prehľad
  14. Hrozby a príležitosti AI v podnikaní (časť 2)
  15. Hrozby a príležitosti AI v podnikaní (časť 1)
  16. Aká je budúcnosť AI podľa McKinsey Global Institute?
  17. Umelá inteligencia v podnikaní - Úvod
  18. Čo je NLP, alebo spracovanie prirodzeného jazyka v podnikaní
  19. Google Prekladač vs DeepL. 5 aplikácií strojového prekladu pre podnikanie
  20. Automatizované spracovanie dokumentov
  21. Prevádzka a obchodné aplikácie hlasových botov
  22. Technológia virtuálnych asistentov, alebo ako komunikovať s AI?
  23. Čo je obchodná inteligencia?
  24. Ako môže umelá inteligencia pomôcť s BPM?
  25. Kreatívna AI dneška a zajtrajška
  26. Umelá inteligencia v správe obsahu
  27. Preskúmanie sily AI pri tvorbe hudby
  28. 3 užitočné nástroje na grafický dizajn s umelou inteligenciou. Generatívna AI v podnikaní
  29. AI a sociálne médiá – čo o nás hovoria?
  30. Nahradí umelá inteligencia obchodných analytikov?
  31. Nástroje AI pre manažéra
  32. Budúci trh práce a nadchádzajúce profesie
  33. RPA a API v digitálnej spoločnosti
  34. Nové interakcie. Ako mení umelá inteligencia spôsob, akým ovládame zariadenia?
  35. Multimodálna AI a jej aplikácie v podnikaní
  36. Umelá inteligencia a životné prostredie. 3 riešenia AI, ktoré vám pomôžu vybudovať udržateľný podnik
  37. Detektory obsahu AI. Stoja za to?
  38. ChatGPT vs Bard vs Bing. Ktorý AI chatbot vedie preteky?
  39. Je chatbot AI konkurentom vyhľadávania Google?
  40. Efektívne ChatGPT výzvy pre HR a nábor
  41. Inžinierstvo promptov. Čo robí inžinier promptov?
  42. AI a čo ešte? Hlavné technologické trendy pre podnikanie v roku 2024
  43. AI a obchodná etika. Prečo by ste mali investovať do etických riešení
  44. Meta AI. Čo by ste mali vedieť o funkciách podporovaných AI na Facebooku a Instagrame?
  45. Regulácia AI. Čo potrebujete vedieť ako podnikateľ?
  46. 5 nových využití AI v podnikaní
  47. AI produkty a projekty - čím sa líšia od ostatných?
  48. AI ako expert vo vašom tíme
  49. AI tím vs. rozdelenie rolí
  50. Ako si vybrať kariérne pole v oblasti AI?
  51. AI v HR: Ako automatizácia náboru ovplyvňuje HR a rozvoj tímu
  52. Automatizácia procesov s pomocou AI. Kde začať?
  53. 6 najzaujímavejších nástrojov AI v roku 2023
  54. Aká je analýza zrelosti AI spoločnosti?
  55. AI pre B2B personalizáciu
  56. Prípadové použitia ChatGPT. 18 príkladov, ako zlepšiť svoje podnikanie s ChatGPT v roku 2024
  57. Generátor mockupov AI. Top 4 nástroje
  58. Mikro učenie. Rýchly spôsob, ako získať nové zručnosti
  59. Najzaujímavejšie implementácie AI vo firmách v roku 2024
  60. Aké výzvy prináša projekt AI?
  61. Top 8 nástrojov AI pre podnikanie v roku 2024
  62. AI v CRM. Čo mení AI v nástrojoch CRM?
  63. UE AI zákon. Ako Európa reguluje používanie umelej inteligencie
  64. Top 7 AI tvorcov webových stránok
  65. Nástroje bez kódovania a inovácia AI
  66. Koľko zvyšuje používanie AI produktivitu vášho tímu?
  67. Ako používať ChatGTP na prieskum trhu?
  68. Ako rozšíriť dosah vašej AI marketingovej kampane?
  69. AI v doprave a logistike
  70. Aké obchodné problémy môže umelá inteligencia vyriešiť?
  71. Ako prispôsobiť riešenie AI obchodnému problému?
  72. Umelá inteligencia v médiách
  73. AI v bankovníctve a financiách. Stripe, Monzo a Grab
  74. AI v cestovnom ruchu
  75. Ako umelá inteligencia podporuje vznik nových technológií
  76. AI v e-commerce. Prehľad globálnych lídrov
  77. Top 4 nástroje na vytváranie obrázkov pomocou AI
  78. Top 5 nástrojov AI na analýzu dát
  79. Revolúcia AI v sociálnych médiách
  80. Je vždy výhodné pridať umelú inteligenciu do procesu vývoja produktu?
  81. 6 najväčších obchodných nešťastí spôsobených AI
  82. AI stratégia vo vašej spoločnosti - ako ju vybudovať?
  83. Najlepšie kurzy AI – 6 úžasných odporúčaní
  84. Optimalizácia sledovania sociálnych médií pomocou nástrojov AI
  85. IoT + AI, alebo ako znížiť náklady na energiu vo firme
  86. AI v logistike. 5 najlepších nástrojov
  87. GPT Store – prehľad najzaujímavejších GPT pre podnikanie
  88. LLM, GPT, RAG... Čo znamenajú skratky AI?
  89. AI roboty – budúcnosť alebo prítomnosť podnikania?
  90. Aké sú náklady na implementáciu AI vo firme?
  91. Čo robia špecialisti na umelú inteligenciu?
  92. Ako môže AI pomôcť v kariére freelancera?
  93. Automatizácia práce a zvyšovanie produktivity. Príručka k AI pre freelancerov
  94. AI pre startupy – najlepšie nástroje
  95. Vytváranie webovej stránky s AI
  96. Jedenásť laboratórií a čo ešte? Najperspektívnejšie startupy v oblasti AI
  97. OpenAI, Midjourney, Anthropic, Hugging Face. Kto je kto vo svete AI?
  98. Syntetické dáta a ich význam pre rozvoj vášho podnikania
  99. Najlepšie vyhľadávače AI. Kde hľadať nástroje AI?
  100. Video AI. Najnovšie generátory videí s umelou inteligenciou
  101. AI pre manažérov. Ako môže AI uľahčiť vašu prácu
  102. Čo je nové v Google Gemini? Všetko, čo potrebujete vedieť
  103. AI v Poľsku. Firmy, stretnutia a konferencie
  104. AI kalendár. Ako optimalizovať svoj čas vo firme?
  105. AI a budúcnosť práce. Ako pripraviť svoj podnik na zmenu?
  106. AI klonovanie hlasu pre podniky. Ako vytvoriť personalizované hlasové správy s AI?
  107. "Všetci sme vývojári." Ako môžu občianski vývojári pomôcť vašej spoločnosti?
  108. Overenie faktov a halucinácie AI
  109. AI v nábore – vypracovanie náborových materiálov krok za krokom
  110. Sora. Ako zmenia realistické videá od OpenAI podnikanie?
  111. Midjourney v6. Inovácie v generovaní obrázkov pomocou AI
  112. AI v MSP. Ako môžu MSP súťažiť s gigantmi pomocou AI?
  113. Ako mení umelá inteligencia marketing influencerov?
  114. Je AI naozaj hrozbou pre vývojárov? Devin a Microsoft AutoDev
  115. Najlepšie AI chatboty pre e-commerce. Platformy
  116. AI chatboty pre e-commerce. Prípadové štúdie
  117. Ako zostať informovaný o tom, čo sa deje vo svete AI?
  118. Ovládanie AI. Ako urobiť prvé kroky na aplikáciu AI vo vašom podnikaní?
  119. Perplexity, Bing Copilot alebo You.com? Porovnanie AI vyhľadávačov
  120. AI experti v Poľsku
  121. ReALM. Prelomový jazykový model od Apple?
  122. Google Genie — generatívny AI model, ktorý vytvára plne interaktívne svety z obrázkov
  123. Automatizácia alebo augmentácia? Dva prístupy k AI v spoločnosti
  124. LLMOps, alebo ako efektívne spravovať jazykové modely v organizácii
  125. Generovanie videa pomocou AI. Nové obzory vo výrobe video obsahu pre podniky
  126. Najlepšie nástroje na prepisovanie AI. Ako premeniť dlhé nahrávky na stručné zhrnutia?
  127. Analýza sentimentu pomocou AI. Ako pomáha poháňať zmenu v podnikaní?
  128. Úloha AI v moderovaní obsahu