Autor: Markus Auer | 8 min. čítania

 

Odkedy ChatGPT koncom roka 2022 prevrátil svet výskumu umelej inteligencie naruby, každý deň sa objavujú desiatky nových a údajne výkonných modelov umelej inteligencie. Keď čínske výskumné laboratórium DeepSeek 20. januára predstavilo svoj najnovší model R1, spočiatku nespôsobil veľký rozruch.

Skutočnosť, že spoločnosť tvrdila, že R1 bude mať rovnaký výkon ako o1 od OpenAI (v súčasnosti najlepší komerčne dostupný model), ale zároveň bude o 97 % lacnejší, vyvolala medzi odborníkmi spočiatku skepsu. V priebehu niekoľkých dní skepsa ustúpila úžasu a potom panike. Zdalo sa, že R1 splnil to, čo sľuboval - a je zadarmo. To znamená, že mnohé predpoklady súčasného boomu umelej inteligencie treba zásadne spochybniť.

Poznámka: Spoločnosti uvedené v tomto článku boli vybrané ako príklady a nepredstavujú investičné odporúčanie.

 

Predpoklad 1: lepšie modely sú drahšie

Veľké jazykové modely (skrátene LLM) sú predikčné modely založené na neurónových sieťach, ktorých hlavnou úlohou je poskytnúť najpravdepodobnejšie nasledujúce slovné komponenty (tzv. tokeny) pre daný vstup. Ak teda zadám modelu vstup „Keď svieti slnko“, pravdepodobné výstupy budú „je“, „obloha“ a „modrá“ plus tzv. koncový token <end>, ktorý modelu hovorí, že by nemal nasledovať žiadny ďalší výstup. To, ako a v akom poradí sa budú výstupy generovať, určujú tzv. parametre modelu, ktoré musia byť „natrénované“ pri vytváraní modelu.

Zjednodušene povedané, parameter by mohol znieť: „Ak je predchádzajúci token <to>, potom ďalší token je <je> s pravdepodobnosťou 78 %“. Keďže však ľudský jazyk ponúka takmer nekonečné množstvo možných kombinácií slov a interpretačných jednotiek, ani milión takýchto pravidiel „ak - potom“ nestačí na vytvorenie čitateľnej a súvislej vety.

Užitočné modely vychádzajú z hustoty parametrov približne jednej miliardy. Zhruba povedané, čím viac parametrov model má, tým lepšie funguje. Model so 7 miliardami parametrov, ako je Meta Llama 3.3 (malý), sa dá ľahko nainštalovať na štandardný notebook a poskytuje dobré odpovede na bežné otázky (napríklad znalosť Wikipédie). Na druhej strane výkonnostného spektra sú modely ako OpenAI GPT4o s odhadovanou hustotou parametrov viac ako bilión. Tento model dokáže bez problémov odpovedať na otázky týkajúce sa špecifických oblastí vedomostí, ako je medicína alebo strojárstvo, alebo písať smutné básne v arménčine.

V zásade platí, že čím viac parametrov má mať cieľový model, tým viac výpočtových operácií je potrebné vykonať pri trénovaní týchto modelov. Základná jednotka pre aritmetické operácie sa nazýva FLOPS (skratka pre operácie s pohyblivou rádovou čiarkou za sekundu). Výpočtová úloha 1+1 zodpovedá jednej FLOP. Hoci v našom príklade je GPT4o 170-krát výkonnejší ako malý model Llama, pri trénovaní potreboval 230-krát viac výpočtových prostriedkov. Stručne povedané, výpočtové náklady rastú strmšie ako schopnosti modelu - aspoň sme si to mysleli do minulého týždňa.

 

DeepSeek vyvíja tlak na predchádzajúce modely AI

Pri toľkých udalostiach sa nesmie zabudnúť na jednu vec: Uplynulo len niečo vyše dvoch rokov od vyškolenia GPT3, prvého modelu, s ktorým sa mnohí z nás zoznámili koncom roka 2022 a ktorý bol vycvičený za 10 miliónov USD, Pre porovnanie len nedávno prebehlo oznámenie prezidenta Trumpa o 500 miliardách USD na ďalší vývoj modelov AI.

Počas tohto obdobia veľké technologické spoločnosti, súkromní investori a investori rizikového kapitálu investovali do sektora AI závratné sumy. Predpokladá sa, že do roku 2024 sa celkovo investovalo viac ako 300 miliárd USD. V tomto prostredí sa objavila správa, že čínsky výskumný tím DeepSeek vycvičil model s nákladmi len niečo vyše 5 miliónov USD, ktorý môže konkurovať špičkovým modelom amerických technologických gigantov, ktorí investovali stonásobne vyššie sumy.

Zdroj: Statista, DocsBot

S cieľom obmedziť konkurencieschopnosť čínskeho výskumu umelej inteligencie už Bidenova vláda zaviedla zákaz vývozu najnovšej generácie čipov spoločnosti Nvidia. Samozrejme, dá sa predpokladať, že tieto obmedzenia sa čiastočne obchádzali prostredníctvom dovozu z tretích krajín, podobne ako v prípade sankcií voči Rusku. Faktom však je, že tieto obmedzenia podnietili čínskych výskumníkov, aby hľadali metódy šetrenia zdrojov na prekonanie tohto hendikepu.

Výsledkom tohto úsilia sú modely DeepSeek V3, R1 a Janus, ktoré každý predstavuje iný prípad použitia. Nanešťastie pre americké technologické giganty čínski výskumníci svoje metódy nielen zverejnili, ale svoje modely aj verejne sprístupnili. Jednoducho povedané, každý používateľ s dostatočným výpočtovým výkonom ich teraz môže použiť na vytvorenie vlastného ChatGPT.

 

Potrebný výpočtový výkon by mohol klesnúť

Uvidíme, ako na tento vývoj bezprostredne zareaguje konkurencia v USA. Zo strednodobého až dlhodobého hľadiska je však nepredstaviteľné, že by tieto prevratné metodické inovácie neprijali aj iné výskumné tímy. V dôsledku toho sa pravdepodobne zníži potrebný výpočtový výkon v celom odvetví. Vynára sa otázka, prečo sa modely jednoducho nezväčšia, keď sa teraz zdroje môžu využívať efektívnejšie.

Auto, ktoré potrebuje len 3 l/100 km, prejde oveľa ďalej ako auto so spotrebou 10 l/100 km, alebo nie? Nanešťastie pre celý polovodičový priemysel sa v posledných mesiacoch čoraz častejšie objavujú dôkazy, že výkonnosť najlepších modelov LLM dosiahla strop a že ani s rastúcim počtom parametrov nie je možné dosiahnuť výrazne lepší výkon.

 

Predpoklad 2: Open source je druhá liga

V oblasti distribúcie softvéru sa robí základný rozdiel medzi uzavretým a otvoreným zdrojovým kódom (closed and open source). Uzavretý zdrojový kód je čierna skrinka pre používateľa, ku ktorej má kľúč len výrobca softvéru, a preto môže veľmi presne kontrolovať, kto a na aký účel softvér používa. Softvér s otvoreným zdrojovým kódom je otvorená kniha a je voľne dostupný. Každý používateľ ho môže používať na súkromné alebo komerčné účely bez obmedzení.

Tieto dva varianty existujú aj pre modely umelej inteligencie, pričom uzavretý variant bol ešte pred týždňom považovaný za prémiovú verziu. Hoci materská spoločnosť Facebooku Meta dáva svoje modely k dispozícii všetkým, v bežných porovnávacích testoch vždy zaostávajú za komerčnými modelmi o niekoľko krokov. Doteraz musel každý, kto chcel alebo potreboval najlepší výkon, otvoriť peňaženku. Spoločnosť DeepSeek tomu urobila koniec. Jej open source modely hrajú prvú ligu a sú stále dostupné pre každého.

 

Ako by to mohlo ovplyvniť výrobcov čipov?

To zo dňa na deň ukončilo činnosť nespočetného množstva začínajúcich firiem s umelou inteligenciou, ktoré si, samozrejme, primárne musia vytvárať vlastné modely s uzavretou distribúciou, aby boli schopné v určitom momente generovať príjmy pre svojich investorov. Jedným z dôsledkov toho je, že mnohé rizikové investície v tejto oblasti budú musieť byť v strednodobom horizonte odpísané. Keďže fondy súkromného kapitálu si vo všeobecnosti môžu dopriať väčšiu flexibilitu, pokiaľ ide o odpisovanie a vykazovanie, negatívne dôsledky tohto vývoja pocítia investori až o niekoľko rokov.

Na druhej strane existujú obavy, že slabnúce alebo meniace sa začínajúce podniky budú vo veľkom predávať grafické čipy, ktoré v uplynulých rokoch draho nakúpili za peniaze investorov. Tento prebytok na sekundárnom trhu by mohol spôsobiť oslabenie dopytu na primárnom trhu. Čip Nvidia H100 z roku 2022 stál pri uvedení na trh 30 000 USD, a teda 500 USD/TFLOP. Cena čipu B100 ohláseného na rok 2025 je uvedená na úrovni 40 000 USD, a teda stojí 300 USD/TFLOP. Ak by cena použitých čipov H100 klesla pod hranicu 18 000 USD a bolo by ich dostupné značné množstvo, jednotková ekonomika (predaj a náklady na základe jednej jednotky, napr. výrobku alebo služby) by pravdepodobne začala vyvíjať silný tlak na predaj spoločnosti Nvidia.

Protiargumentom by mohlo byť, že efektívna architektúra s otvoreným zdrojovým kódom znamená, že mnohé spoločnosti by sa mohli rozhodnúť hostiť svoje vlastné LLM, zatiaľ čo v minulosti by sa uchýlili ku cloudovým riešeniam hyperscalerov Amazon, Microsoft a Google. Napríklad pre spoločnosť ako Erste Group by nebolo reálne zabezpečiť vlastný výpočtový klaster pre LLM. Na umiestnenie Llama 3.3 Large by bolo potrebných približne 200 čipov A100. Okrem obstarávacích nákladov vo výške 6 miliónov USD by sa nahromadili náklady na energiu a infraštruktúru, čo by ukončilo akúkoľvek diskusiu o vlastnom hostingu. DeepSeek R1 by bol nielen lepším modelom, ale vystačil by si aj s 5-10 čipmi A100. Pri obstarávacích nákladoch 200 000 USD by niektoré stredne veľké spoločnosti mohli byť v pokušení začať projekt, aby si samy vyskúšali novú technológiu a zároveň si zachovali kontrolu nad používanými údajmi.

Z pohľadu spoločnosti Nvidia by bol tento krok len vítaný, pretože by sa závislosť od niekoľkých veľkých zákazníkov s príslušnou vyjednávacou silou rozložila na mnoho menších a menej vyjednávajúcich zákazníkov.

 

Predpoklad 3: Modely umelej inteligencie sú softvérovým produktom

Až donedávna bol obchodný prípad väčšiny začínajúcich podnikov s umelou inteligenciou pravdepodobne takýto: „Za peniaze investorov vycvičíme model a potom zarobíme peniaze od spotrebiteľov prostredníctvom modelu predplatného a od spoločností prostredníctvom modelu API“. Vychádzalo to z predpokladu, že model AI je produkt podobný softvéru, ako je Office alebo Photoshop, a že ak je vlastný model dostatočne dobrý, dokáže si udržať zákazníkov. Samozrejme, že americkí technologickí giganti okusovali z boku a požadovali svoje platby za nákladovo efektívny hosting modelov API. Spoločnosť DeepSeek skoncovala aj s týmito predpokladmi. V priebehu niekoľkých dní nespočetné množstvo zákazníkov OpenAI zrušilo svoje predplatné a prešlo na bezplatnú alternatívu z Číny. Lojalita zákazníkov, čo to je?

Poznámka: Prognózy nie sú spoľahlivým ukazovateľom budúcej výkonnosti.

Toto rozčarovanie je pre OpenAI, tvorcov ChatGPT a priekopníkov boomu AI, dvojnásobne bolestivé. Na jednej strane je spoločnosť na ceste k IPO, kde by chcela získať viac ako 100 mld. Nad týmito zámermi teraz visí veľmi veľký otáznik. Na druhej strane spoločnosť zamerala celú svoju stratégiu rastu na podnikanie v oblasti B2C. Veľká časť jej obratu vo výške približne 4 miliardy USD v roku 2024 pochádzala z predplatného. Do roku 2029 sa očakávalo, že len táto oblasť podnikania vzrastie na viac ako 50 miliárd USD. Okrem toho sa spoločnosť OpenAI nedávno pustila do novej cenovej schémy. Najnovší model, o3, bude k dispozícii len používateľom Pro, ktorí sú ochotní platiť 200 USD mesačne. To by malo konečne stabilizovať ziskovosť spoločnosti, ktorá podľa odhadov stále dosahuje stratu jeden dolár na každé dva doláre tržieb

Príchod DeepSeek je preto potrebné považovať za existenčnú hrozbu pre OpenAI. Zatiaľ nie je jasné, do akej miery to bude mať negatívny dopad na hlavného investora OpenAI, spoločnosť Microsoft. V každom prípade bude musieť spoločnosť prehodnotiť svoje rozhodnutie integrovať modely OpenAI výlučne do produktového radu Microsoft Copilot.

Poznámka: Prognózy nie sú spoľahlivým ukazovateľom budúcej výkonnosti.

Rozhodujúcu úlohu by mohla zohrávať regulácia

Zo všetkého najviac kritizované nariadenia by sa mohli stať pozitívnym faktorom pre existujúce spoločnosti s uzavretým zdrojovým kódom. Zákon EÚ o umelej inteligencii a podobné nariadenia vyžadujú ďalekosiahle a komplexné audity modelov umelej inteligencie, aby sa mohli komerčne využívať. Relatívne malé výskumné laboratórium, ako je DeepSeek, ktoré aj tak dáva svoj produkt voľne k dispozícii, bude ťažké presvedčiť, aby so svojimi právnikmi vyplnilo stránky formulárov a poslalo ich do Bruselu alebo Sacramenta.

Americkí technologickí giganti majú v tejto oblasti jasnú výhodu a môže byť len otázkou času, kedy sa ozvú hlasy požadujúce väčšiu reguláciu modelov s otvoreným zdrojovým kódom. V niektorých prípadoch sa to už aj tak deje s odkazom na autocenzúru R1, akonáhle je konfrontovaná s otázkami týkajúcimi sa čínskej vnútornej politiky alebo histórie. Či bude pre bežného používateľa dôležité, aby jeho asistent s umelou inteligenciou pravdivo informoval o masakre na Námestí nebeského pokoja, keď píše e-mail svojmu šéfovi, je iná otázka.

Zdá sa, že modely umelej inteligencie budú v budúcnosti vnímané ako zameniteľný zdroj, a nie ako produkt ako taký. Možno si predstaviť podobnú dynamiku trhu ako v prípade kedysi veľmi uznávaných, neskôr rýchlo štandardizovaných a racionalizovaných solárnych panelov. Na jednej strane to nahráva spoločnostiam Apple a Amazon, ktoré boli v posledných rokoch obviňované z nečinnosti v sektore AI. Spoločnosť Apple si stanovila za cieľ čo najlepšie integrovať modely AI do svojich produktov bez toho, aby sa nechala vtiahnuť do boja o zdroje. Pri spätnom pohľade to bola presne tá správna stratégia. Vďaka AWS Bedrock vytvorila spoločnosť Amazon de facto priemyselný štandard pre cloudový hosting modelov AI, čím sa stala nezávislou od úspechu jedného poskytovateľa modelov.

 

Investori budú skúmať, kto má prospech zo zavádzania umelej inteligencie

Najväčšia neistota je v súčasnosti v sektore polovodičov, samozrejme, predovšetkým v prípade zázračného dieťaťa Nvidia. Ako bolo opísané vyššie, v súčasnosti existuje oveľa viac argumentov pre pokles dopytu po grafických procesoroch. V relevantných kruhoch sa v súčasnosti veľa hovorí o Jevonovom paradoxe, ktorý zhruba hovorí, že akonáhle sa softvérová služba zlacní, dopyt po nej neúmerne vzrastie a v konečnom dôsledku dokonca spôsobí rast trhu. Na druhej strane však stále neexistuje „aplikácia zabijak umelej inteligencie“. Stručne povedané, ak by LLM a podobné modely zo dňa na deň zmizli, pravdepodobne by si to všimol len obmedzený počet ľudí mimo výskumu AI.

Pre drvivú väčšinu používateľov sú prípady použitia AI obmedzené na písanie domácich úloh a generovanie vtipných hlbokých obrázkov, ak túto technológiu vôbec používajú. Pre investorov bude preto o to dôležitejšie overiť si, ktoré spoločnosti môžu zo zavádzania umelej inteligencie profitovať a nie sú v nevyhnutných pretekoch ku dnu.

 

Originálny zdroj informácie: https://blog.en.erste-am.com/deepseek-the-sputnik-moment-for-ai/

Slovník technických pojmov nájdete na tomto odkaze: www.erste-am.sk/investicny_slovnik

Príručku investora do podielových fondov nájdete na tomto odkaze: www.erste-am.sk/prirucka-investora

Mesačný komentár finančných trhov nájdete na tomto odkaze: www.erste-am.sk/mesacny-komentar

Upozornenie: Tento dokument je marketingový materiál. Všetky údaje pochádzajú od spoločnosti Erste Asset Management GmbH, pokiaľ nie je uvedené inak. Naše komunikačné jazyky sú nemčina a angličtina. Prospekt pre UCITS (vrátane všetkých zmien a doplnení) sa zverejňuje v súlade s ustanoveniami InvFG 2011 v aktuálne platnom znení. Informácie pre investorov podľa § 21 AIFMG sú pripravené pre alternatívne investičné fondy (AIF) spravované spoločnosťou Erste Asset Management GmbH v súlade s ustanoveniami AIFMG v spojení s InvFG 2011. Prospekt fondu, Informácie pre investorov podľa § 21 AIFMG a Dokument s kľúčovými informáciami sú k dispozícii v aktuálnom znení na internetovej stránke www.erste-am.com v sekcii povinné publikácie alebo ich možno získať v aktuálnom znení bezplatne v sídle správcovskej spoločnosti a v sídle depozitárskej banky. Presný dátum posledného zverejnenia prospektu fondu, jazyky, v ktorých je k dispozícii dokument s kľúčovými informáciami, a všetky ďalšie miesta, kde je možné dokumenty získať, sú k dispozícii na webovom sídle www.erste-am.com. Súhrn práv investorov je k dispozícii v nemčine a angličtine na webovej stránke www.erste-am.com/investor-rights, ako aj v sídle správcovskej spoločnosti. Správcovská spoločnosť môže rozhodnúť o zrušení opatrení, ktoré prijala v súvislosti s distribúciou podielových listov v zahraničí, s prihliadnutím na regulačné požiadavky. Naše analýzy a závery majú všeobecný charakter a nezohľadňujú individuálne potreby investorov z hľadiska príjmov, zdanenia a ochoty podstupovať riziko. Minulá výkonnosť nie je spoľahlivým ukazovateľom budúcej výkonnosti fondu. Upozorňujeme, že investície do cenných papierov so sebou okrem tu uvedených príležitostí prinášajú aj riziká. Hodnota akcií a ich výnosy môžu rásť a klesať. Pozitívny alebo negatívny vplyv na hodnotu investície môžu mať aj zmeny výmenných kurzov. Z tohto dôvodu môžete pri spätnom odkúpení akcií získať nižšiu sumu, ako bola vaša pôvodne investovaná suma. Osobám, ktoré majú záujem o kúpu podielov v investičných fondoch, odporúčame, aby si pred prijatím investičného rozhodnutia prečítali aktuálny(-é) prospekt(-y) fondu a Informácie pre investorov podľa § 21 AIFMG, najmä upozornenia na riziká, ktoré obsahujú. Ak je menou fondu iná mena ako domáca mena investora, zmeny príslušného výmenného kurzu môžu mať pozitívny alebo negatívny vplyv na hodnotu jeho investície a výšku nákladov vynaložených vo fonde - prepočítané na jeho domácu menu. Informácie o obmedzeniach predaja podielov fondu americkým občanom nájdete v príslušných informáciách v prospekte fondu a v Informáciách pre investorov podľa § 21 AIFMG. Tlačové chyby a omyly vyhradené.