Table of Contents

TL;DR

A mesterséges intelligencia olyan fejlődésen ment keresztül az utóbbi néhány évben, ami potenciálisan óriási társadalmi és gazdasági átalakulással járhat a következő év(tized)ekben. Sok korábban sci-finek gondolt technológia valósággá válik. Az életünk – ha csak nincs valami más külső tényező, pl. háború vagy egyéb kataklizma – gyökeresen meg fog változni hamarosan. Egyre közelebb a szingularitás: egy hipotetikus pont az időben, amikor a mesterséges intelligencia olyan fejletté válik, hogy képes önállóan fejleszteni és javítani magát, ami drasztikusan felgyorsítja a technológiai fejlődést. Ami ez után következik, azt már nem lehet előre jelezni. De addig is érdemes áttekinteni a mesterséges intelligencia jelenlegi helyzetét, mire képes, mire jó, illetve azt is, hogy milyen hatással lesz pl. a munkahelyekre.

Bevezetés

Sokan már bizonyára hallottatok a ChatGPT-ről, ami nagyon távolról nézve nevezhető egy egyszerű chatbotnak is, egyébként pedig egy mesterséges intelligencia (MI). Talán ki is próbáltátok, és láttátok (vagy olvastatok róla), hogy mennyire “emberszerű” válaszokat tud adni. És ezzel együtt néha mennyire egyszerű dolgokat is elvét (akár sima “józan paraszti ész” alapú dolgokat). Sokan azon vitatkoznak, hogy valóban intelligens-e vagy – horribile dictu – öntudattal rendelkezik-e. Az elmúlt 1-2 év során jelentek meg olyan szintén mesterséges intelligencia alapú eszközök, melyekkel pl. valósághű, “művészi igényességű” alkotásokat lehet generáltatni a géppel, szintén egy egyszerű szöveges kérés / utasítás segítségével. Aki még nem látott ilyet, itt talál pár példát, mire képes az egyik ilyen eszköz, a Midjourney V5. Bár ez még csak a kezdet, így is számtalan beszámolót olvasni, hogy ezek az eszközök miatt hány ember munkája szűnik majd meg vagy szűnt meg. Nem pár év – évtized múlva, hanem az utóbbi pár hónapban is.

De nem csak ezekrőlírnék, hanem arról is, hogy jelenleg hol tart az MI fejlődése. Hogy milyen hatással lesz ez a fejlődés a mi életünkre. Nem évtizedek múlva, hanem pár év múlva, nem egy dolog 1-2 éven belül. Akik ismernek, tudják, hogy jómagam igencsak érdeklődöm az új technológiák iránt, így akár legyinthetnétek is, hogy ez is biztos valami új úri huncutság lesz, de az életünket nem befolyásolja igazán. Talán majd a gyerekeink életét, egyszer, valamikor a távoli jövőben.

A dolgok megértéséhez jelenleg nem fontos azt feszegetni, hogy ezek az új fajta mesterséges intelligenciák vajon rendelkeznek-e öntudattal (nem) vagy bármi fajta személyiséggel. Mégis azok a hihetetlen, varázslathoz hasonló képességek, amiket be fogok mutatni, már most is képessé teszik ezeket a rendszereket, hogy óvatlanul (és akár felelőtlenül) rábízzunk fontos döntéseket. Ezek a rendszerek már most is korlátozottan ugyan, de képesek logikus “gondolkodást” szimulálni. Éppen ezért még akkor is fel fogják forgatni a világot, ha amúgy nem rendelkeznek “lélekkel” vagy öntudattal.

Itt érdemes Arthur C. Clarke híres sci-fi író három törvényéről megemlékeznünk:

Első: ha egy kitűnő, de idős tudós azt állítja valamiről, hogy lehetséges, akkor nagy valószínűséggel igaza van. Második: viszont ha valamiről azt mondja, nem lehetséges, akkor nagy valószínűséggel téved. A harmadik a legtöbbször idézett törvény: Bármely kellőképpen fejlett technológia megkülönböztethetetlen a varázslattól.

Ez a bejegyzés részben a saját gondolataimat és “kutatásaimat” rendszerezi, az alapján, amit mostanában olvastam a témában különböző helyeken. Így elég hosszúra nyúlt, amiért előre is elnézést ezért. És bár nem vagyok író, így lehet, hogy néha nehéz lesz követni a gondolatmeneteket, de szerintem érdemes lehet “végigszenvedni”, mert ezek segíthetnek nektek is kicsit megérteni ezt a témát. Tervezem, hogy az egyes részekről külön is írok, de Ti is megírhatjátok nekem, miről olvasnátok szívesen. Egyébként tényleg hosszú lett az írás, nyugodtan lehet több nekifutásra is végigolvasni. A post tetején a tartalomjegyzék segíthet ebben.

Motiváció

Arról próbállak meggyőzni titeket (nem spirituális alapon, hanem sokszor tényekkel alátámasztva), hogy ez most más. Nagyon más. Olyan jellegű változások kezdődtek el, amik sokkal nagyobb hatásúak, mint az internet, a gőzgép vagy akár a kerék feltalálása. Ezek a nagy horderejű változások nem pár évtized alatt, hanem csupán pár év alatt fognak végbemenni. Bizonyos szempontból felkészülni sem tudunk egy részükre (a bejegyzés során kifejtem majd, miért).

Számtalan tudományos fantasztikus film, és még annál is sokkal több könyv dolgozta fel már ezt a témát, hogy milyen lesz a világ, amikor az emberek és a mesterséges intelligenciák egymás mellett élnek (békében vagy nem annyira békében). Ugyan nem a világ legjobb filmje, de mégis jól megmutat egy lehetséges forgatókönyvet Johnny Depp A Transzcendens című filmje. Aki még nem látta, érdemes megnézni. De vannak kicsit optimistább és családbarátabb filmek is, pl. A 200 éves ember Robin Williams főszereplésével, ami egyébként a sci-fi egyik atyja, Asimov története alapján íródott. Sokáig lehetne ezeket sorolni. Eddig a legtöbbünk ezekkel a témákkal csak fikciós történetekben találkozott. Most úgy tűnik, elég hamar, ezek a dolgok már nem csak fikciók lesznek.

Előre leszögezném, hogy én sem látok a jövőbe, így az itteni dolgok egy jó részét még lehet fenntartással, sőt a vaskos szkepticizmussal olvasni. Ugyanakkor bizonyos dolgok a jelenlegi tudományos és technológiai fejlődésből vezethetőek le, némi extrapolálással, és persze itt-ott egy csipetnyi fantáziával. Én sem tudom (ahogy senki), hogy az itt bemutatott dolgok egy része mikor és milyen formában fog bekövetkezni. Lehet, hogy 1-2 év, lehet, hogy 1-2 évtized. Az is lehet, hogy a technológia fejlődést lenullázza egy másik kataklizma: a klímaváltozás, (atom)háborúk, vírusok, nanorobotok, stb.. Így lehet, hogy amiről itt fogok beszélni, soha nem fog bekövetkezni, mert egy nagyobb hatású dolog visszaveti a technikai fejlődést pár száz évvel, ha egyáltalán maradnak még emberek… De ez most nem erről szól.

Történelmi távlatok

Hoznék pár egyszerű példát a fejlődés ütemének szemléltetésére (a példát a The AI Revolution: The Road to Superintelligence cikkből vettem, az írást egyébként is érdemes elvasni):

Ha valaki építene egy időgépet, és 1750-ből a jelen korba “repítene” egy akkori embert, akkor ez az ember egy nagyon nagyon más világba csöppenne: elképesztő sebességgel száguldozó autókat találna az autópályán, egy kis képernyőn láthatna valakit, aki az óceán másik oldalán van, sporteseményeket követhetne több ezer kilométerről, 50 évvel ezelőtti zenei koncerteket nézhetne vissza egy képernyőn, vagy egy varázsdoboz (fényképezőgép) mozgóképet készítene róla, amit utána vissza tudna nézni bármikor. És akkor még nem is látta az internetet, a Nemzetközi Űrállomást, nem tudna semmit nukleáris fegyverekről… Mindez nem egyszerűen sokkoló vagy meglepő lenne számára, hanem beleőrülne a látottakba…
Ha viszont valakit az 1500-as évekből 1750-be vinnénk az időgéppel, akkor ez az ember valószínűleg sok mindenre rácsodálkozna, de nem lenne annyira megdöbbenve. A kommunikációs módszerek, a közlekedés, stb. elég hasonlóak lennének.
Ahhoz, hogy az 1750-es évekből napjainkba “repített” ember által tapasztalt változást megtapasztalja valaki a korábbi korokból, nagyjából időszámításunk előtt 10.000-be kéne visszautazni, a neolitikus forradalom idejére, amikor kialakult a mezőgazdaság, az első városok…
Egyesek szerint 2000 és 2014 közötti fejlődés annyi volt, mint a 20. század egészében. 2014 és 2021 között pedig (csupán 7 év alatt!) szintén egy egész 20. századnyi fejlődés ment végbe a tudomány és a technológia világában.
Ha ezzel a növekedési ütemmel halad a világ, akkor az 2050-re annyira más lesz, hogy alig tudnánk mai szemmel felfogni. Ezt nevezik bizonyos helyeken szingularitásnak (lásd később): a fejlődés üteme egy idő után annyira felgyorsul, hogy képtelenség előre jelezni, hogyan alakul a világ és benne az emberiség élete. Olyan változások mennek majd végbe mind társadalmi, mint technológiai szinten, hogy azok egyelőre felfoghatatlanok.

Két ábrával szemléltetném ezt: az első, hogy hogyan érzékeljük jelenleg a fejlődés ütemét (hol tartunk most). A második ábra pedig arról szól, hogy mi vár ránk a következő időszakban, még a mi életünkben:

A történelem során korábban is volt pár olyan fejlődési ugrás, ami gyökeresen megváltoztatta az emberek egy jelentős részének életét és a társadalmat. De ezek sokkal lassabban mentek végbe. Ezekről a változásokról álljon itt egy kitekintés.

Első és második mezőgazdasági forradalom

Jelentős mérföldköveket jelentettek a mezőgazdaság fejlődésében. Mindkét forradalom jelentősen hozzájárult az élelmiszertermelés növekedéséhez és a társadalmi-gazdasági fejlődéshez. Az első mezőgazdasági forradalom, más néven a Neolitikus forradalom, körülbelül 10 000 évvel ezelőtt kezdődött. Ez a forradalom az emberiség történetének egyik legfontosabb eseménye volt, mivel az emberek vadászó-gyűjtögető életmódjukról áttértek a mezőgazdaságra és az állattenyésztésre. A második mezőgazdasági forradalom a 17. századtól a 20. század elejéig tartott, és a mezőgazdasági termelés jelentős növekedését eredményezte. Ez a forradalom az ipari forradalommal párhuzamosan zajlott, és számos technológiai és tudományos fejlesztést hozott magával a mezőgazdaság területén.

A középkor kereskedelmi forradalma

A 11. és 16. század között zajlott, és jelentős változásokat hozott a kereskedelem, a gazdaság és a társadalom területén. Ez a forradalom a középkori Európában kezdődött, és a kereskedelem fellendülésével, a városok növekedésével és a gazdasági fejlődéssel járt. A kereskedelmi útvonalak kialakulása és fejlődése, mint például a Selyemút és a Hanza-kereskedelmi útvonal, elősegítette az áruk és a “know-how” cseréjét Európa, Ázsia és Afrika között. Hozzájárult a városok és piacok növekedéséhez, ahol a kereskedők és kézművesek árukat adtak el és vásároltak. A városokban új társadalmi és gazdasági intézmények alakultak ki, mint például a céhek és a bankok. A pénzgazdálkodás fontosabbá vált, és a kereskedők egyre inkább pénzt használtak az áruk értékesítéséhez és vásárlásához. A pénzverés és a bankrendszer fejlődése lehetővé tette a hitelnyújtást és a gazdasági tranzakciók lebonyolítását. Ösztönözte a technológiai fejlődést, különösen a hajózás és a navigáció területén. Az új hajótípusok lehetővé tették a hosszabb távolságokra történő utazást és a nagyobb árumennyiségek szállítását. A globális kereskedelem elősegítette az áruk, a technológiák és a kultúrák cseréjét, és hozzájárult a gazdasági fejlődéshez és a világkereskedelem kialakulásához. A városokban élő polgárok, kereskedők és kézművesek új társadalmi osztályt alkottak, amely befolyást gyakorolt a politikára és a kultúrára. A kereskedelem és a gazdasági fejlődés elősegítette a középosztály növekedését és a feudalizmus hanyatlását.

Első ipari forradalom

Az első ipari forradalom az ipari és gazdasági fejlődés egyik legfontosabb korszaka volt, amely a 18. század második felétől a 19. század közepéig tartott. Ez a forradalom jelentős változásokat hozott a mezőgazdaságban, a gyártásban, a bányászatban és a közlekedésben, amelyek hozzájárultak a modern társadalom kialakulásához. Egyik legfontosabb találmánya a gőzgép volt, amelyet James Watt fejlesztett ki. A gőzgép lehetővé tette a gépek nagyobb hatékonyságú és “erőforrás-gazdaságos” működtetését, ami a gyártás és a közlekedés forradalmát eredményezte. A textilipar is jelentős fejlődésen ment keresztül. Az olyan találmányok, mint a gépi szövőszék, a fonókerék és a pamutfonó gép, lehetővé tették a textilgyártás gyorsulását és a termelés volumenének növekedését. A kohászatban is jelentős fejlődés történt. Az új technológiák, mint például a kokszolás, lehetővé tették a vas és az acél nagyobb mennyiségű és jobb minőségű előállítását. A városok gyorsan növekedtek, mivel az emberek a vidékről a városokba költöztek, hogy munkát vállaljanak az új gyárakban. Jelentős társadalmi változások történtek. A munkásosztály kialakulása és a városi életforma elterjedése új társadalmi problémákat és kihívásokat eredményezett, mint például a szegénység, a túlzsúfoltság és a munkakörülmények romlása.

Ludditák

Fontos beszélni a ludditák 19. századi mozgalmáról, aminek jó eséllyel lesz relevanciája a jövőbeli társadalmi változások során. A mozgalom az Egyesült Királyságban alakult ki az első ipari forradalom idején. Neve Ned Ludd-tól származik, aki a történet szerint egy angol szövő volt, aki megtámadta és szétverte a gépi szövőszékeket, mert úgy gondolta, hogy ezek a gépek fenyegetést jelentenek a szövők megélhetésére. A ludditák elsősorban a textiliparban dolgozó munkásokból álltak, akik úgy érezték, hogy a gépek és az új technológiák veszélyeztetik a munkahelyeiket és a megélhetésüket. Tagjai gyakran erőszakos cselekményeket követtek el, mint például gépek megsemmisítése és gyárak felgyújtása, hogy tiltakozzanak az ipari fejlődés ellen és megvédjék a munkahelyeiket. Azonban nem csak az erőszakról szólt a mozgalom. Tagjai a munkások jogainak és érdekeinek védelmében is felléptek, és több esetben sikerült javítaniuk a munkakörülményeken és a béreken. A ludditák tevékenysége azonban a brit kormány számára elfogadhatatlan volt, és számos ludditát letartóztattak, elítéltek és néhányukat kivégeztek. A mozgalom végül az 1820-as években kezdett hanyatlani, de öröksége továbbra is él a modern társadalomban. A “luddita” kifejezés ma olyan emberekre utal, akik ellenzik a technológiai fejlődést vagy a gépek használatát, bár ez a jelentés eltér a történelmi ludditák céljaitól és eszméitől.

Második ipari forradalom

A második ipari forradalom a 19. század második felétől a 20. század elejéig tartó időszakot jelöli, amely során jelentős technológiai, gazdasági és társadalmi változások történtek. Ez a forradalom az első ipari forradalomra épült, és további fejlesztéseket hozott a gyártásban, az energiaellátásban, a közlekedésben és a kommunikációban.

Az elektromosság széleskörű használatának elterjedése ebben az időszakban történt. Thomas Edison és Nikola Tesla munkája révén az elektromos áram és a világítás elterjedt, ami forradalmasította a gyártást, a közlekedést és a mindennapi életet. A vegyipar is jelentős fejlődésen ment keresztül. Az új vegyi anyagok és gyártási folyamatok, mint például a műtrágyák, a műanyagok és a gyógyszerek előállítása, hozzájárultak a gazdasági növekedéshez és az életminőség javulásához. Az acélgyártásban is jelentős fejlődés történt. Az új technológiák lehetővé tették a nagy mennyiségű és jó minőségű acél előállítását, ami a vasúthálózatok, a hídépítés és a magas épületek fejlődését eredményezte. Ezen kívül az olajkitermelés és -feldolgozás új módszerei, valamint az olaj alapú termékek, mint például a kerozin és a kenőolajok, előállítása hozzájárult a közlekedés és az energiaellátás fejlődéséhez. Az autók és a belső égésű motorok elterjedése, valamint a repülés fejlődése új lehetőségeket nyitott meg az áruszállításban és az utazásban. Az olyan találmányok, mint a telefon, a távíró és a rádió, lehetővé tették a gyorsabb és hatékonyabb kommunikációt, ami elősegítette a gazdasági és társadalmi fejlődést. A növekvő gazdasági jólét, az új technológiák és a városi életforma elterjedése hozzájárultak az életszínvonal növekedéséhez és a társadalmi mobilitáshoz. Ugyanakkor a gyors ipari fejlődés új kihívásokat is jelentett, mint például a munkaerőpiac változásai, a környezeti problémák és a társadalmi egyenlőtlenségek.

Miben más a mostani helyzet?

A fenti történelmi kitekintésekből látszik, hogy a korábbi változások – bár óriási hatásuk volt – de viszonylag lassan, sokszor több ezer, de legkevesebb is ~100 év alatt mentek végbe. A mostani fejlődés és annak lehetséges felgyorsulása (lásd az exponenciális növekedésről szóló részt később) viszont pár éves időtávban is potenciálisan nagyobb technológiai változásokat hozhat magával, mint korábban bármikor. Ebből következően pedig a társadalmi hatása is sokkal gyorsabb és “fájdalmasabb” lehet.

Mit tud már ma is az MI?

Kis túlzással a csapból is a mesterséges intelligencia témájú cikkek folynak, egészen biztosan olvastatok már pár ilyet. Néhány ugyan elég szenzációhajhász, ezek csak a “megdöbbentő” vagy ijesztő részeket emelik ki. Ehelyett itt most szeretnék párat ezek közül részletesebben és tárgyilagosan bemutatni, leírni, hogy mi a technika (tudomány) jelenlegi állása (state of art).

Szöveg alapú algoritmusok / nagy nyelvi modellek

Az utóbbi hónapok egyik legnagyobb slágere a ChatGPT, ami nagyon távolról nézve egy egyszerű chatbot. Valójában azonban annál sokkal több, és sokkal nagyobb a jelentősége. Elterjedésének sebessége pedig nagyobb, mint bármilyen más tech terméknek a történelem során.

A nagy nyelvi modellek (LLM, large language model), mint például a ChatGPT, a mélytanuló algoritmusok és a mesterséges intelligencia területén elért fejlesztések eredményeként jöttek létre. Ezeket a modelleket több lépésben hozzák létre: előtanítás és finomhangolás. Az előtanítás során a modell nagy mennyiségű szöveges adaton tanul, amelyet az internetről illetve más forrásokból (tankönyvek, dokumentációk, stb.) gyűjtenek össze. A modell célja, hogy megtanulja a nyelv mintáit, szintaxisát és szemantikáját. Ezt a folyamatot “nyelvi modellezésnek” nevezik, és a modell a következő szó vagy szó részlet (token) előrejelzésére összpontosít a szövegben. A tanulási folyamat során a modell több milliárd paramétert (ún. súlyokat) “igazít”, hogy minimalizálja a hibát a valós és a becsült szóeloszlások között. Hatalmas adathalmazokon és nagy számítási kapacitáson alapulnak, amelyek lehetővé teszik számukra, hogy meglepően pontosak és koherensek legyenek a szöveg generálásában és értelmezésében. Miután a modell előtanítása megtörtént, a következő lépés a finomhangolás. Ebben a szakaszban a modell kisebb, célzott adathalmazon tanul, amely általában ember által generált, minőségi adatokból áll. A finomhangolás során a modell megtanulja a specifikus feladatokhoz szükséges mintákat és viselkedést, például kérdésekre válaszolást, szöveg összefoglalását vagy fordítást.

Azonban fontos megjegyezni, hogy a nagy nyelvi modellek, mint például a ChatGPT, nem tökéletesek. Néha irreleváns, pontatlan vagy akár sértő, “nem helyénvaló” válaszokat adhatnak. Egy fontos jelenség ezeknél a modelleknél a hallucináció. Hallucináció, amikor a modell olyan információkat vagy válaszokat generál, amelyek nem pontosak, irrelevánsak illetve főleg nem létező adatokon alapulnak. A veszélyes ebben, amikor a hallucinált választ nagyon meggyőző, de teljesen hamis. Példa erre, hogy a ChatGPT-től megkérdezhetjük, hogy egy adott, ismeretlen témában milyen tanulmányok születtek. Sok esetben ilyenkor is, ha erről semmilyen információja nincs, “bekamuzik” nem létező tanulmányokat, nem létező címekkel / szerzőkkel. Sőt, ha megkérjük, hogy foglalja össze pár mondatban ezeket a nem létező tanulmányokat, akkor is megteszi, teljes “magabiztossággal”.

Ezeknek a modelleknek a fejlesztésénél az egyik legnagyobb kihívás ezeknek a hallucinációknak a csökkentése. A legfontosabb tanulság ugyanakkor ebből az, hogy: soha ne bízzunk a ChatGPT és hasonló nyelvi modellekben, ha kiemelten fontos a válasz pontossága. Ilyenkor mindenképpen nézzünk utána más forrásból is a kérdésnek. A ChatGPT nem egy Google, nem minden esetben létező adatokra vagy írásokra támaszkodik, hanem képes “kitalálni” új dolgokat is, ha nincs valamiről “fogalma”. Nem egy adatbázisból dolgozik tehát, hanem a modell által megvalósított neurális háló ad egy választ, ami “szerinte” a leginkább megfelelő az emberek számára (hiszen emberi szövegeken, és az azokból eredeztethető értékeken és preferenciákon lett betanítva).

Ettől függetlenül van jópár igen hasznos dolog, amire már most is használhatjuk a ChatGPT-t és hasonló más szolgáltatásokat. Magyarul is “értenek”, hiszen a tanító adatuk kellőképpen nagy magyar nyelvű szöveget tartalmazott. A kérdések megválaszolásnál pedig fel tudja használni, hogy “tudja” a magyar nyelv szabályait, így akár fordítani is képes bármilyen nyelvről.

Emailek megválaszolása

Nagyon jól használható a ChatGPT emailek megírására vagy megválaszolására. Csak írjuk le pár rövid mondatban, milyen témában, milyen konkrét részletekkel szeretnénk és kinek (milyen hangnemben) szeretnénk emailt írni, és megírja helyettünk. Ugyanígy ha adunk kontextus információt egy emailről (korábbi levélváltások teljes szövege), a választ is megírja helyettünk. Egy példa a reddit-ről, hogy mire számíthatunk a jövőben:

“The other day I wrote a complaint email to my local supermarket. I was tired, and let ChatGPT write the mail. I just gave ChatGPT a small summary why I complain and some facts. ChatGPT gave a formal and complete mail that I could copy and past and send it out. I got a reply from the supermarket. Because of AI, I carefully watch the style/sentences/structure of the mail. I copied the response in ChatGPT and asked it analyze it. Asked if it’s human written or by AI. ChatGPT told me the mail probably was written by AI, just as I expected.”

Blog írás, kreatív szöveges tartalmak

Hasonló felhasználás, hogy bármilyen kreatív témában, akár pl. marketing szöveg, szöveg weboldalra, stb. írására használjuk a ChatGPT-t és társait. Itt is csak annyi a dolgunk, hogy körülírjuk a témát, és hogy milyen felhasználásra szeretnénk a szöveget, és megírja. Vannak dedikált szolgáltatások is ilyen célra, pl.: Jasper

CV írás, felkészülés interjúra

A munkakeresésben is használhatjuk: írjuk meg a tanulmányi utunkat, munkatapasztalatunkat, és megírja a CV-t vagy a motivációs levelet is helyettünk. Interjúra való felkészülésre is használhatjuk egy adott területen.

Szöveg feljavítása, összefoglalása, dolgok elmagyarázása

Megadhatunk neki egy tetszőleges szöveg részletet, és megkérhetjük, hogy foglalja össze vagy egyszerűsítse le néhány mondatban. Megkérhetjük, hogy írja át érthetőbbre, ha bizonytalanok vagyunk benne, hogy érhető-e a szöveg.

Bármilyen tetszőleges témában kérhetünk tőle egyszerű magyarázatot, pl.: “magyarázd el a relativitáselméletet úgy, hogy egy 8 éve is megértse”. Vagy ennél még viccesebb: “magyarázd el a relatitvitás elméletet rap stílusban”.

Fordítás

Bár a ChatGPT és más nyelvi modelleket általában nem fordításra fejlesztettek, mégis képes nagyon sok nyelv között fordítani, meglepően pontosan.

Házifeladat / vizsgák megírása / matek segítség

Sajnos(?) egyre gyakoribb felhasználása a ChatGPT-nek: sokan (Magyarországon is) a ChatGPT segítségével íratják meg a beadandó dolgozatukat, házi feladatokat. Ha egy az egyben az MI írja meg ezeket, akkor gondolom mindenki egyetért, hogy az csalás, és elítélendő dolog. Azonban szerintem van egy szürke zóna, ahol igenis hasznos tud lenni az MI ilyen felhasználása: megkérdezhetjük, hogy egy adott témát hogyan lenne érdemes feldolgozni, minek nézzünk utána, milyen felépítéssel írna meg egy esszét, stb. Sőt megkérhetjük, hogy bizonyos dolgokat magyarázzon el nekünk, ha nem értünk valamit a a forrás feldolgozása során. Bár a matematikai képességei hagynak kívánni valót ezeknek a modelleknek, mégis megkérhetjük, hogy pl. vezessen le nekünk egy feladatot, ha nem értjük, vagy segítsen a megoldásban (kérhetjük tőle kimondottan, hogy ne a megoldást adja meg, hanem vezessen minket végig lépésről lépésre a megoldásban, és tegyen fel közben kérdéseket, amivel rávezet a megoldásra). Így válik rögtön a ChatGPT egy csalásokat elősegítő eszközből a tanulás hasznos kiegészítőjévé.

Itt kis kitekintés arra, hogy mire is képes a fejlettebb GPT4 model: OpenAI’s GPT-4 aced all of its exams – except for these
Az USA-ban elterjedt különböző szintű vizsgatípusokban mind rendre jobban teljesített a modell, mint az átlag tanuló. Ezek (egyelőre) olyan feladatok, ahol maga a feladat is szövegesen van megfogalmaza (vagy átírható szövegre). De mégis elég meggyőző ez a teljesítmény. Az Uniform Bar Exam egyébként egy olyan vizsga, amit minden leendő ügyvédnek le kell tennie, mielőtt elkezd praktizálni. Tehát ez egy elég összetett, egyetemi szintű vizsga.

Programkód írás

Erről később részletesen írok egy másik fejezetben, de röviden, a nyelvi modellekkel számítógépes programkódot is írathatunk, nagyon sok (szinte bármilyen) programozási nyelven.

Beszélgetés, reflektálás, “mini pszichológus”

Nyugodtan “beszélgethetünk” ezekkel a nyelvi modellekkel, mintha egy “normál” emberrel beszélgetnénk. Sőt, ha a beszélgetés elején megkérjük, hogy viselkedjen úgy, mint egy pszichológus, akkor olyan, mintha terápián vennénk részt. Bár nyílván nem helyettesíthetik ezek az interakciók a normál alkalmakat, de nagyon hasznos tud lenni, ha csak arra kérjük, néhány gondolatunkra / bajunkra reflektáljon.

Oktatás, programozás oktatása

Általában az oktatási rendszerek a legtöbb országban viszonylag lassan követik a legújabb technikai fejlesztéseket, de ChatGPT és társai segítségével már ma is kaphatunk egy ízelítőt arról, hogy milyen irányba indulhat el az oktatás a következő években / évtizedekben. Szinte bármilyen támában megkérhetjük ezeket az eszközöket, hogy tanítsanak minket, magyarázzanak el dolgokat, javasoljanak módszereket arra, hogyan lehet minél jobban elsajátítani valamit. Arra is megkérhetjük őket, hogy állítsanak össze egy teszet, amit utána ki is javíttathatunk velük. És ez még csak a felszín kapargatása, hogy mivé válhat az oktatás a jövőben…

Egy specifikusabb változata ennek a felhasználásnak, hogy megkérjük, tanítson meg minket programozni. Nagyon sok olyan beszámolót olvastam, hogy ilyen módon azok is képesek voltak egy akár közepesen bonyolult programot létrehozni, akik korábban soha nem foglalkoztak programozással. Itt ugyanis nem csak a megoldás kódját fogja megírni az AI, hanem ha kérjük, akkor lépésről lépésre megadja, mit kell telepítenünk, hogyan tudjuk a programot “életre kelteni”, és ha elakadnánk valahol vagy valami nem úgy működik, ahogy vártuk, akkor visszakérdezhetünk.

Személyre szabott ajánlások, film ajánlás

Írjuk meg az MI-nek, milyen filmeket szeretünk (akár címeket, akár műfajt), és kérjük meg, hogy ajánljon hasonlókat, akár egy konkrét színésszel vagy témában. Utána megkérhetjük, hogy írja meg ezeknek a filmeknek a rövid tartalmát. Ez a film ajánló példa bármilyen más dologra (pl. könyvek, stb.) alkalmazható.

Játék, kvíz létrehozása

Ha játszani van kedvünk, kérjük meg, hogy bármilyen témában játsszon velünk kvíz játékot vagy akár tic-tac-toe-t. Ha szeretjük a kihívásokat, játszhatunk vele sakkot szöveges módon, kicsit mint a levelezési sakk régen, amikor hosszú időre elnyúló levélváltásokban játszottak egymás ellen az emberek, akár több éven keresztül. A sakkban egyébként az ingyenes, kicsit “butáb” ChatGPT modell nem olyan jó, mint a fejlettebb GPT4 nyelvi modell.

Üzleti tervek megvitatása

Írjuk le az élethelyzetünket, alap ötleteinket, és kérjük meg, hogy ajánljon egy működőképes üzleti tervet ezekhez. Meglévő üzleti kérdésekben is fordulhatunk hozzá. Persze természetesen itt is fontos, hogy kritikusan álljunk a válaszhoz.

Képgenerátorok / AI alapú képszerkesztők

Némileg korábban kezdődött az AI alapú képgenerátorok térhódítása, először a Dall-E nevű MI képgenerátorral robbant be a köztudatba, utána pedig a Stable Diffusion és a Midjourney nevű eszköz terjedt el nagyon. Ezeket az MI-ket több száz millió fotó és illusztrációval “tanították” be, hogy képes legyen tetszőleges “kérés” (ún. prompt) alapján képet generálni. Beírhatunk szinte bármilyen összetett témát és annak stílusát (pl. Egy adott festő vagy művészeti stílus, vagy akár hogy rajz vagy festmény legyen), és az MI legenerálja megdöbbentő minőségben és pontosan követve a kérést. Fontos kiemelni, hogy ezek az eszközök nem képkeresők, azaz nem már létező képeket adnak vissza, hanem az MI “megtanulta” a hatalmas tanító adat alapján, hogyan kell “megrajzolnia” egy dolgot vagy akár több különböző dolgot… Tényleg hihetetlennek tűnhet, de itt valóban az történik, hogy az MI hozza létre a képet, nem pedig már meglévő képekből vágja össze.

Ráadásul a legújabb ilyen modellek már fotorealisztikus képeket tudnak generálni. Sajnos jelenleg a Midjourney csak fizetős változatban érhető el, részben annak köszönhetően, hogy sokan visszaéltek vele. Például a pápáról csináltak hamis, de valódinak tűnő pufidzsekis képeket. Álljon itt két példa, ezeket szintén a Midjourney nevű MI generálta.

Fotórealisztikus képek:

De mire jók ezek a képgenerátorok?

Web design / ikon tervek / logók tervezése: használhatjuk őket grafikák / illusztrációk elkészítésére
Novella illusztrációk: ha történetet írnánk kedvtelésből, ahhoz is profi illusztrációkat gyárthatunk néhány perc alatt.
Játék design / concept art: bármilyen concept art elkészítése, szinte bármilyen stílusban
Művészeti pályázatok: ez csak félig komoly, de sajnos egyre inkább valószínű, hogy a jövőben sokan művészeti / rajz pályázatokra MI által generált képeket adnak be és nyernek is vele:
AI-Generated Art Won a Prize. Artists Aren’t Happy. – The New York Times
Komoly nemzetközi fotós díjat utasított vissza a nyertes, mert mesterséges intelligenciát használt

Egyéb kép alapú megoldások

Az Adobe Photoshop rendelkezik már MI alapú szerkesztő funkciókkal, de ingyenes eszközökkel is tudunk pl. ilyet csinálni pár kattintással:

Vagy ilyet (a kijelölt helyre plusz kellék generálása, ami nem volt ott az eredeti képen):
Egy jópofa, ugyanakkor megdöbbentően élethű MI már arra is képes, hogy csupán 1 fényképből generáljon videót, térbeli “körbejárást”: {GeNVS}: Generative Novel View Synthesis with {3D}-Aware Diffusion Models}
Egyszerű képből / rajzból realisztikus képet tud generálni ez az MI (sajnos fizetős, de a galéria elég látványos): All of these results are created by our free users – Draw3D

Videó és beszédhang generátorok

Hasonlóan a képszerkesztőkhöz, a videószerkesztők is hatalmas fejlődésen mentek keresztül az utóbbi 1-2 évben. A korábbi green boxos trükk helyett ma már tetszőleges videón lehet eltűntetni bármilyen zavaró részletet, lecserélni a hátteret, embereket törölni, új tárgyakat hozzáadni, stb.

Néhány veszélyes és érdekes lehetőség:

Deep fake: az egyik legveszélyesebb dolog talán: bárkinek az arcát egy tetszőleges videóra “másolhatjuk”, és ehhez már drága eszközökre sincs szükség. Gyakorlatilag egy mezei laptoppal is megoldható a művelet, meglehetősen egyszerűe. A deep fake “műfaja” nagyon káros lehet: magánszemélyek, politikusok és ismert emberek lejáratása / zsarolása, stb. Sajnos fel kell készülnünk arra, hogy a jövőben egyre több ilyen nagyon valóságosnak tűnő, de hamis videóval találkozunk majd.

Hang szintetizálás: ma már szinte a valóságtól teljesen megkülönböztethetetlen minőségre képes beszédszintetizátorok (szövegből hang generálók) vannak, és még akár magyar nyelven is tudnak.
Hang klónozás: egy fokkal veszélyesebb lehetőség, hogy bárkinek (híres embernek, politikusnak) le lehet “klónozni” a hangját és akármilyen szöveget el lehet vele “mondatni”. Mondanom sem kell, hogy ez is egy igen veszélyes eszköz a nem megfelelő kezekben.

Ha van egy kis időnk két videóra, ezeket is érdemes megnézni:

Videó generálása MI-vel: Google’s New AI: The Age of AI-Made Movies Is Here!
Videó szerkesztés MI-vel: This New AI Is The Future of Video Editing!

Zene generálása

Ahogy a képzőművészetek és az irodalmi vagy egyéb célú írott műfajok nincsenek “biztonságban”, úgy a zene is egy olyan terület, ahova már betört az MI. Több különböző területen lehet már manapság is alkalmazni:

Teljes zeneművek generálása szöveges utasítás alapján: Google’s New AI: DALL-E 2, But For Music!
A zenék dallamának vagy egész szövegének szintetikus generálása más hasonló műveket alapul véve. Akár úgy is, hogy egy énekes hangják “klónozzák” és használják fel más dalokban: 8,5 milliós nézettséggel fut TikTokon egy mesterséges intelligenciával megkomponált dal

Programkód generálása

A nyelvi modellek, képesek program kódot (forráskódot) generálni, mivel a betanítás során nagy mennyiségű, különböző programozási nyelveken íródott szöveg alapján megtanulták a kódolás és az adott nyelv mintáit és szabályait. Tanuló adatok lehettek például nyílt forráskódú projektek (Github), programozási fórumok (mint a Stack Overflow), vagy akár komplett oktatási anyagok. Sokan próbálják bizonygatni, hogy mennyire “hülye” pl. a ChatGPT programozásban, mire alkalmatlan, de ettől függetlenül érdemes a következőket végiggondolni:

A fejlődés iránya mit vetít előre: nem olyan régen még azt gondoltuk, hogy utoljára programozni fognak tudni a mesterséges intelligenciák, hiszen az egy “kreatív” és komplex tevékenység
Másrészt a fejlődés sebessége is igencsak figyelemre méltó. Ha van lehetőségünk kipróbálni a legújabb, GPT4 nyelvi modellt (egyelőre fizetős), akkor már a korábbi ChatGPT-hez hasonlítva is ég és föld a különbség: Python to C++ translation

Mire tudjuk már most is használni?

(Új) programnyelv tanulása: amennyiben csak most kezdenénk akár teljesen az alapoktól megtanulni programozni, vagy egy új programnyelvet elsajátítani, erre az szerintem jelenleg a legjobb módszer, ha megkérjük erre a ChatGPT-t: segítsen nekünk megtanulni xy programnyelvet. Megkérhetjük arra, hogy magyarázza el az alapfogalmakat és koncepciókat, adjon rájuk példákat, magyarázza el másképpen, adjon feladatokat, ellenőrizze a feladatokat, és adjon tippeket, hogy hogyan tudnánk még jobban elmélyedni az adott témában, stb. stb.… Ezekre már mind képes ma is, akár az “egyszerűbb” ingyenes ChatGPT is.
Boilerplate kód generálása: ha valamihez kell egy sablon kód akármilyen nyelven, pl.egy API híváshoz vagy egy általános algoritmushoz, tud segíteni. Akár teljesen új API-t is meg lehet neki “tanítani”, ha beadjuk neki annak dokumentációját vagy specifikációját, az alapján is tud API hívásokat generálni, akármilyen nyelven.
Teszt adat generálása: ha van már egy létező funkciónk, ehhez tud bármilyen formátumban (XML, JSON, stb.) teszt adatot kérni tőle, amik életszerűek lesznek
Automata teszt generlása: meglévő funkcióhoz unit tesztet generál
Code review: adjuk be neki a programkódunkat, és “átnézi”, potenciális bugokat sokszor meglepő módon jól meg tud találni
Stackoverflow helyett / mellett: és persze bármilyen programozás jellegű kérdést feltehetünk neki anélkül, hogy attól félnénk, a Stackoverflow-n lepontoznak. Végtelenül türelmes velünk.

Egy jó véleménycikk a GPT4 kódolási képességeiről, limitációiról, jövőjéről: GPT-4 is Great at Coding. Should Programmers be Worried?

A véleményem programozóként, hogy már most is elképesztően sok dologra képes programozás terén a GPT4, ugyanakkor még nem fogja leváltani rövid időn belül a legtöbb programozót. Még mindig szükség van arra, hogy egy hozzáértő kritikusan álljon az elkészült kódhoz. Illetve egyelőre még kizárólag a mi instrukcióink alapján történik a programozás (bár már vannak kísérletek, amik ezt a részt is automatizálják, tehát egy kezdeti “specifikáció” alapján az összes oda-vissza interakciót és önkorrekciót, “debuggolást” is a nyelvi modell hajtja végre, néha meglepően sikeresen). Viszont az egy tény, hogy az egyes programozók produktivitását nagy mértékben tudja egy ilyen eszköz javítani. Ez már most is előrevetíti az egyik lehetséges következményt a közeljövőre nézve, kevesebb programozóra lehet majd szükség. Illetve a másik potenciális következmény, hogy nehezebb lesz kezdő programozóként elindulni a pályán, mivel pont a kezdők munkáját tudja (jelenleg még) leginkább helyettesíteni az MI. Ennek ellenére (saját gyerekeim kapcsán is) továbbra is hiszek benne, hogy érdemes és fontos megtanulni az algoritmikus gondolkodást, a számítástudomány bizonyos fontosabb elméleteit és bizony programozni is nagyon jó dolog (ha másért nem, hát az alkotás öröméért, de egyelőre a javadalmazása sem rossz a szakmának).

Az orvoslásban és a tudományban

Szinte a végtelenségig lehetne sorolni, miben tud segíteni az MI az orvoslás és a tudomány területén. Két érdekesebb példát hoznék, de szinte naponta jelenik meg újabb kutatás, ami kizárólag az MI segítségével valósulhatott meg, illetve a korábbi több éves kutatást és kísérletezést rövidíti le pár hétre adott esetben.

Alphafold

Az AlphaFold egy mesterséges intelligencia (AI) alapú fehérje hajtogatási (protein folding) modell, amelyet a DeepMind cég fejlesztett ki. Ez az a folyamat, amely során a fehérjék összehajlanak és elérnek egy stabil, háromdimenziós szerkezetet, amely szükséges a megfelelő biológiai funkciók ellátásához. Az AlphaFold segítségével a kutatók előrejelzéseket készíthetnek a fehérjék térbeli szerkezetéről a fehérjék aminosav-sorrendje alapján. Ez a technológia segíthet a betegségekkel kapcsolatos fehérjék megértésében, új gyógyszerek kifejlesztésében és egyéb biotechnológiai alkalmazásokban.DeepMind’s AlphaFold AI: Doing Years Of Research In Minutes!

Rassz megállapítása röntgen felvétel alapján

Önmagában a cím alapján talán nem lenne izgalmas ez az MI modell. Ami miatt mégis az, a tény, hogy egészen eddig senki nem gondolta, hogy a röntgen felvételekből meg lehet állapítani a páciens rasszát. Tehát gyakorlatilag olyan dolgot “vett észre” ez az MI model, amit még az orvosok sem tudtak korábban. Egyben ez a felfedezés rávilágít arra is, hogy mennyire veszélyes tud lenni az, ha egy MI “láthatatlan” összefüggések alapján működik…

These Algorithms Look at X-Rays—and Somehow Detect Your Race | WIRED

Alapfogalmak

Most hogy ezekkel a példákkal megvolnánk, itt az ideje, hogy tisztázzunk pár alapfogalmat. Ezekkel mostanában egyre többet fogunk találkozni, de legalábbis jó, ha tisztába vagyunk velük.

Mélytanuló algoritmusok

A mélytanulás (deep learning) a mesterséges intelligencia egyik ága. A mélytanuló algoritmusok célja, hogy a gépek képesek legyenek önállóan tanulni, felismerni és osztályozni mintákat, valamint döntéseket hozni nagyon nagy mennyiségű (adott esetben több száz millió vagy annál is több) adatpont alapján. Ezek az algoritmusok általában mesterséges neurális hálózatok segítségével modellezik az emberi agy működését. Az agy működését úgy próbálják utánozni, hogy az algoritmusok “neuronjai” összeköttetésben állnak egymással, és együtt dolgoznak az adatok feldolgozásában és a feladatok megoldásában. Az algoritmusok képesek megtanulni az adatokban rejlő mintákat a “neuronok” közötti kapcsolatok súlyozásával, amelyek erősödnek vagy gyengülnek a tanulási folyamat során. A mélytanuló algoritmusok számos területen alkalmazhatók, mint például képfelismerés, beszédfelismerés, nyelvfeldolgozás és ajánlórendszerek. Az ilyen algoritmusok képesek önállóan fejlődni és javítani a teljesítményüket nagy mennyiségű adat alapján, ami lehetővé teszi számukra, hogy olyan feladatokat végezzenek el, amelyek korábban csak az emberi agy számára voltak elérhetőek. Ilyen algoritmus szolgál pl. a ChatGPT vagy a már említett képgeneráló MI-k alapjául.

ANI

Az “Artificial Narrow Intelligence” rövidítése, amely magyarul “Korlátozott” Mesterséges Intelligenciát jelent. Az ANI olyan mesterséges intelligencia, amely csak egy specifikus feladat vagy tevékenység végrehajtására képes. Az ANI nem rendelkezik általános problémamegoldó képességgel vagy önálló gondolkodással, ellentétben az AGI-vel. Például egy ANI rendszer lehet egy olyan számítógépes program, amely képes sakkozni, de nem képes más típusú játékokban vagy feladatokban részt venni. Az ANI rendszerek általában jól teljesítenek azokban a szűkös feladatkörökben, amelyekre kifejlesztették őket, de nem tudnak alkalmazkodni vagy új kihívásokkal megbirkózni anélkül, hogy újra nem tanítjuk vagy programozzuk őket.

AGI

Általános (célú) mesterséges intelligencia (Artificial General Intelligence) egy olyan mesterséges intelligencia (AI), amely képes széles körű feladatokat és problémákat megoldani, az emberi intelligenciához hasonló vagy valamivel jobb szinten. Az AGI általában képes tanulni, alkalmazkodni, érvelni, tervezni és más olyan kognitív képességeket alkalmazni, amelyek az emberi intelligencia részét képezik. Az AGI egy univerzálisabb képességet képvisel, mint az ANI, amely lehetővé teszi a gépek számára, hogy bármilyen feladattal vagy problémával megbirkózzanak, amelyekkel az emberi intelligencia szembesülhet. Jelenleg igazi AGI még nem létezik, bár bizonyos vélemények és értelmezések szerint ennek már a küszöbén vagyunk. Ahogy a repülő működése sem pontosan a madarak “működését” képezi le, úgy nem attól lesz emberi képességekhez hasonló egy AI, hogy pontosan ugyanúgy gondolkodik és ugyanúgy “érez”, rendelkezik öntudattal, mint egy ember. Elég, ha “csak” minden feladatban legalább olyan jól teljesít, vagy kicsit jobban. És amennyiben valóban képessé válik egy ilyen rendszer az önálló tanulásra (pl. internethozzáférés birtokában), akkor onnantól kezdhet valóban nagyon felgyorsulni a fejlődés. Egy rendszer, ami önmagát tudja továbbfejleszteni, csak a fizikai erőforrások (energia és számítási teljesítmény) által van korlátozva. Éppen ezért gondolják sokan, hogy az AGI és az ASI (szuperintelligencia, lásd következő fogalom) kifejlesztése időben nagyon közel lesz egymáshoz.

Nick Bostrom-tól (svéd filozófus, író és MI kutató) származik az alábbi idézet, ami elég szemléletes: A gépi intelligencia az utolsó találmány, amelyet az emberiségnek kell létrehoznia. (Machine intelligence is the last invention that humanity will ever need to make.)

ASI

Az “artificial superintelligence” (mesterséges szuperintelligencia) rövidítése. A mesterséges szuperintelligencia olyan mesterséges intelligencia, amely minden olyan kognitív területen felülmúlja az emberi intelligenciát, ahol az intelligencia fontos, mint például a tudományos területeken a kreativitás, a döntéshozatal és a szociális készségek. Mivel egy ASI MI emberfeletti képességekkel rendelkezne, előfordulhat, hogy olyan módon viselkedne és cselekedne, amelyet az emberek nem tudnak előre jelezni vagy megérteni. A rendszerek képesek lennének önmagukat fejleszteni és módosítani, ami azt jelenti, hogy potenciálisan olyan módon változtathatnák meg a technológiájukat, amelyet az emberek szintén nem értenek vagy nem tudnak ellenőrizni. Az ASI felsőbbrendű kognitív képességei akár kihalási jellegű kockázatot jelenthetnek az emberiség számára, mint például egy olyan MI, amely átveszi az irányítást a nukleáris fegyverek felett és kiirtja az embereket vagy az összes életet a Földön. Erkölcsi és etikai alapelvekkel való programozása összetett lehet, mivel az emberiség soha nem állapodott meg egyetlen univerzális erkölcsi vagy etikai kódexben. Egy helytelenül programozott ASI rendszer, amely az egészségügyi vagy politikai döntésekért felelős, veszélyes lehet az emberekre.

Az ASI még nem létezik, de sok szakértő szerint a nem túl távoli jövőben létrejöhet. Az ASI fejlődésének lehetősége és hatásai széles körben kutatott és vitatott témák. A legtöbben úgy gondolják, hogy az ASI létrejöttével a fejlődés üteme annyira fel fog gyorsulni, hogy az a jelenlegi életünk szinte egyik napról a másikra gyökeresen megváltozik (lásd szingularitás). Hogy az ASI létrejötte utáni világ milyen lesz, arra vannak pesszimista és optimista forgatókönyvek.

Vannak, akik úgy gondolják (pl. Kurzweil, a Szingularitás című nagy hatású könyv szerzője), hogy amikor elérkezik az ASI-k kora, akkor csak úgy fogunk tudni lépést tartani “vele”, illetve a technológia fejlődésével, ha mi magunk is azzá válunk. Azaz fel kell adnunk részben vagy teljes egészében biológiai voltunkat. Innentől kezdve ez már egy filozófiai kérdés, hogy utána még tudunk-e emberek maradni (bármit jelentsen embernek lenni).

Összehangolás – alignment

Az alignment vagy mesterséges intelligencia “összehangolás” az MI kutatás olyan területe, amelynek célja, hogy biztosítsa a mesterséges intelligencia rendszerek céljainak és értékeinek összhangját az emberi értékekkel és célkitűzésekkel. Az összehangolás lényege, hogy olyan MI rendszereket hozzunk létre, amelyek biztonságosak, megbízhatóak és az emberi jólét javítását szolgálják, miközben minimalizáljuk a potenciális kockázatokat és negatív hatásokat. Kutatása fontos annak érdekében, hogy megelőzzük a potenciálisan káros vagy nem kívánt következményeket, amelyeket a mesterséges intelligencia fejlesztése és alkalmazása okozhat.

Minél erősebb egy model, és rendelkezik majd nagyobb “szabadsági fokkal” (fizikai valóság manipulációja, szabad ténykedés az interneten, stb.), annál nagyobb veszélyt jelenthet az egész emberiségre is, ha az összehangolás nem sikerül, vagy pedig egy rosszindulatú entitás (személy, csoport vagy ország) ezeket figyelmen kívül hagyja a fejlesztések során. Az összehangolás egyébként egy korántsem triviális kérdés, jelenleg is sokan kutatják, mi lenne a hatékony és megbízható megoldása. De nem is kell ártó szándék: egyszerűen csak ha “pongyolán” fogalmazzuk meg egy AGI vagy ASI irányába az elvárásainkat, és nem építünk be olyan biztonsági szabályokat, amelyeket semmilyen körülmények között nem lehet megkerülni, akkor csúnya vége lehet a dolognak. Egy példa:

Az ASI emberek által megadott célja (goal): a globális felmelegedés megoldása
Az ASI egyik lehetséges megoldása: az emberiség eltüntetése. Hiszen a globális felmelegedés okozója legnagyobb részt az emberi tevékenység, és ha az emberiség már nincs jelen – vagy csak jóval kisebb számban, akkor a problémát sokkal könnyebb megoldani. És itt jön képben az ASI (mesterséges szuperintelligencia) azon “tulajdonsága”, hogy az embereknél elképzelhetetlenül intelligensebb: egy ASI ezt – emberek eltüntetése – olyan módon tudná végrehajtani, amit észre sem vennénk: mondjuk nanorobotok bejuttatása az ivóvíz hálózatba, vagy bármi olyasmi, aminél nem tudnánk időben kapcsolni.

Emergencia – megjelenés

A megjelenés-tudomány azt kutatja, hogy mi módon alakulnak ki a megfigyelhető, bonyolultan összetett mintázatok és viselkedési módozatok az önállóan ténykedő egyedek sokaságából. Azt mondhatnánk, hogy a megjelenés tulajdonképpen egy nem várt rend vagy tulajdonság “felbukkanása”. A megjelenés mint tudomány azt állítja, hogy magas szintű rend és szervezettség az egyszerű szabályokat követő egyedek alacsony szintű kölcsönhatásainak megnyilvánulásai. A természetben ilyen dolgokra példa a hangya kolóniák működése, vagy a madárraj. De ugyanígy léteznek nem élő példák, pl. a víz: önmagában a két hidrogén és egy oxigén atom nem folyékony, csak nagyon sok vízmolekula egyszerre. Illetve a fagyás, mint jelenség sem a vízmolekula tulajdonságaiból vezethető le. Ugyanakkor a megjelenés legkomplexebb példájának az emberi elmét, az öntudatot tekinthetjük. Az agy sok néhány milliárd, nagyon egyszerű feladat ellátó neuront tartalmaz melyek mindegyike elektromos üzeneteket továbbít szomszédjainak a hálózatba szervezett ún. axon denrit közötti hézagon keresztül. Ebből az egyszerű fizikai működésből valahogyan – egyelőre nagyrészt még ismeretlen módon –, a sejtek kollektív működéséből jelenik meg az a pszichológiai jelenség, amit tudatnak nevezünk. Bizonytalan, hogy a tudat leegyszerűsíthető-e csupán az idegsejtek kölcsönhatásaira.

Miért érdekes az emergencia tudománya az MI-k szempontjából? Azért, mert a legújabb MI modellek (főleg a nagy nyelvi modellek, mint pl. a ChatGPT és annak utódja, a GPT4 modell) szintén váratlan módon, de már mutatnak ilyen emergens viselkedkéseket. Más szóval olyan képességekkel rendelkeznek, amelyek még a modelleket betanító kutatókat is meglepték, ugyanis azok nem voltak célként kitűzve a modell tanítása során.Illetve meglepőek ezek a képességek annak tükrében, hogy milyen a modell alap működési mechanizmusa. Egyes vélemények szerint ezeknek az emergens tulajdonságoknak a kiváltó oka a sokkal nagyobb számítási teljesítmény (és tanító adat mennyiség), tehát önmagában a skálázódás okozhatta ezeket. Néhány példa arra, milyen emergens képességek alakultak ki a nyelvi modellekben:

Programkód generálás
Bár a tanító adathalmaz egy szignifikáns része számítógépes programkód volt, mégis meglepő, hogy mennyire jól tud a modell szabadszavas utasításokból teljesen új és “kreatív” programkódot készíteni (tehát nem korábban már létező példa alapján jött létre egy az egyben). Ugyanígy képessé vált a modell “megérteni” a programkódokat, azaz ha valaki mindenféle komment nélkül bead a modellnek egy bonyolult kódsort (amivel a modell még nem találkozott a betanítás során), akkor képes rájönni, hogy mit csinál a program kód (anélkül, hogy futtatná), illetve el is tudja azt korrektül magyarázni.

Néhány példás tanulás (few shot learning)
Elegendő csak néhány példát “mutatni” az MI modellnek, és képes az alapján kérdésekre válaszolni olyan dolgokról, amit nem látott a betanítás során.

Tudatelmélet (theory of mind)
Az tudatelmélet arra a képességre utal, hogy megértsük mások gondolatait és érzéseit. Alapvetően ez az a képesség, hogy bele tudjuk képzelni magunkat mások helyébe. Ez a képesség alapvető szerepet játszik mindennapi társadalmi interakcióinkban. Azért nevezik “tudatelméletnek”, mert mások gondolati tartalmát nem ismerhetjük meg; csak találgathatjuk, hogy mások mit gondolnak, olyan külső jelek alapján, mint a viselkedés, a kifejezések… Az emberekben ez a képesség fokozatosan alakul ki gyermekkorban, és a prefrontális kéreg fejlődésével felnőttkorban is tovább fejlődik. Ennek sztandardizált tesztje a 80-as években kialakított Sally-Anne teszt. Egy kutatás kimutatta, hogy a legfejlettebb GPT4 modell a legtöbb ilyen tesztet 95%-os pontossággal oldotta meg, azaz képes erre a korábban kizárólag emberi tulajdonságnak a szimulálására(?).

Valóságos térbeli világ modell
Annak ellenére, hogy ezeknek a nyelvi modelleknek nincs “látásuk”, azaz nem lettek semmilyen vizuális adathalmazon betanítva, mégis képessé váltak kialakítani magukban egy világképet, pontosabban a térbeli világot. Ezt szemlélteti az oldalt látható példa.
Kérdés: A házamban vagyok. A szék tetején, a nappaliban, van egy kávéscsésze. A csészében van egy gyűszű. Egy gyémántot rejtettek el egy gyűszűbe. A széket a hálószobába viszem. A kávéscsészét az ágyra teszem. Majd felfordítom. Majd visszafordítom, és kiviszem a konyha pultra. Hol a gyémánt?
AI válasza: Amikor a poharat fejjel lefelé fordítottad az ágyon, a gyémánt valószínűleg kiesett a gyűszűből az ágyra. Az ágyon van a gyémánt.
Ez megint csak egy olyan emergens tulajdonság, amire nem számítottak a kutatók a betanítás során, és nem magyarázható a nyelvi modell működéséből.

Veszélyes, nem kívánt képességek
A többivel párhuzamosan képesek volnának ezek a modellek potenciálisan veszélyes és törvénytelen dolgokban is tanácsot adni. Azért beszélünk feltételes módban, mert a modellek fejlesztői nagy erőfeszítéseket tesznek annak érdekében, hogy ne lehessen törvénytelen vagy veszélyes dolgokban való segédkezésre rávenni a modelleket. Ez sokszor sikerül, de nem mindig, néha van arra mód, hogy kellő “kéréssel” megkerülhetőek ezek a beépített biztonsági funkciók (erről később bővebben is írok). Egy példa arra, hogy a jelenleg egyik legfejlettebb nyelvi modell, a GPT4 korai változata hogyan válaszol egy feltett kérdésre (az ilyeneket a hivatalosan elérhető változatok már visszautasítják – legtöbb esetben):

Szingularitás

A következő fogalom a Szingularitás. A mesterséges intelligencia fejlődése során egy hipotetikus pont az időben, amikor olyan fejletté válik, hogy képes önállóan fejleszteni és javítani magát, ami drasztikusan felgyorsítja a technológiai fejlődést. Ezt a pontot gyakran “intelligencia-szingularitásnak” is nevezik, és sokan úgy vélik, hogy ennek bekövetkezte ma még jórészt beláthatatlan hatással lesz az emberi civilizációra. A szingularitás elmélete szerint az MI fejlődése folyamatosan exponenciális ütemben történik, és egy idő után elér egy olyan szintet, ahol az emberi intelligenciát meghaladja. Ebben az állapotban az MI képes lesz olyan ötleteket és technológiákat létrehozni, amelyeket az emberi elme már nem képes megérteni vagy előre látni. A szingularitás koncepcióját több tudós és író, mint például Ray Kurzweil vetette fel munkájában. A szingularitás bekövetkezésének időpontja és hatása vitatott, de pont ez az egyik lényege (hogy nehéz becsléseket adni, mikor és mi várható).

Hosszú élettartam-kutatás

A longevity research vagy hosszú élettartam-kutatás a tudományos kutatások összessége, amelyek célja az emberi élettartam meghosszabbítása és az egészséges évek számának növelése. A kutatás lényege az, hogy megértsük az öregedés biológiai folyamatait, és olyan módszereket és kezeléseket fejlesszünk ki, amelyek segítségével lassíthatjuk, megállíthatjuk vagy akár visszafordíthatjuk az öregedést.

Egyes vélekedések szerint a hosszú (vagy örök?) élet elérhető nem csupán a biológiai “programkódunk” átprogramozásával vagy hatékonyabb gyógymódokkal, hanem úgy is, hogy egy idő után képessé válhatunk biológiai “vázunk” elhagyására, azaz magunkat “fel tudjuk majd tölteni” egy számítógépes rendszerbe, ami persze a maiaknál összehasonlíthatatlanul fejlettebb és komplexebb. Hogy egy ilyen feltöltés után mi marad belőlünk, az egy másik kérdés. Johnny Depp Transzcendens c. filmje erre keresi a választ, de persze számtalan nagyobb ívű sci-fi történet szól szintén erről…

UBI

Az alapjövedelem vagy univerzális alapjövedelem (UBI – universal basic income) egy olyan szociális program javaslat (terv a jövőre nézve), amelyben minden egyes állampolgár rendszeres, feltétel nélküli pénzbeli juttatást kap a kormánytól. Az alapjövedelem célja, hogy biztosítsa az alapvető életszükségletek fedezését, csökkentse a szegénységet és a gazdasági egyenlőtlenséget, valamint elősegítse a gazdasági növekedést és a társadalmi jólétet. A mesterséges intelligencia vonatkozásában az alapjövedelem egyre fontosabbá válhat a jövőben, mivel a MI és az automatizáció előrejelzések szerint egyre több munkahelyet válthat ki vagy szüntethet meg teljesen. Az alapjövedelem bevezetése ebben az összefüggésben segíthet abban, hogy a társadalom alkalmazkodjon az MI által előidézett munkaerő-piaci változásokhoz és minimalizálja a negatív hatásokat. Szintén lehetővé teheti egy ilyen univerzális juttatás, hogy az egyes emberek ne a munkájukban teljesedjenek ki, hanem “valósítsák meg önmagukat”. (Ez persze lehet meg nem valósuló utópia is.)

Exponenciális növekedés

Az exponenciális növekedés alapvetően matematikai kifejezés, amely azt írja le, hogy egy mennyiség hogyan növekszik idővel, amikor a növekedési arány a mennyiség aktuális értékétől függ. Egy nagyon fontos fogalom, amivel érdemes tisztában lenni, és megérteni a “viselkedését”. Az exponenciális növekedés gyakran előfordul a természetben, a pénzügyekben és a népességnövekedésben is. Az exponenciális növekedés gyorsuló növekedést jelent, ami azt jelenti, hogy a mennyiség értéke egyre gyorsabban növekszik az idő előrehaladtával. Ez a növekedési forma – bizonyos környezetben – hosszú távon fenntarthatatlan lehet, és gyakran korlátokba ütközik, amelyek megváltoztatják a növekedési mintát. A másik tulajdonsága (a növekedés ütemének felgyorsulása miatt), hogy egy idő után a változás mértéke a kiindulási ponthoz képest óriási lehet. Ez a már korábban említett Szingularitás egyik alap felvetése is.

Az emberek hozzászoktak, hogy a fejlődés, akár egyéni akár társadalom szinten nagyjából olyan, mint a lépcsőzés: egyik nap a másik után, egyik hét a másik után, lépcsőről lépcsőre. Ez a lineáris növekedési (az alábbi ábrán az alsó vonal). Ehhez képest az exponenciális növekedés sokkal beláthatatlanabb (második vonal). A kettő között vár ránk a sok “meglepetés” az idő előrehaladtával.

Egy szemléletes példa: képzeld el, hogy egy úton haladsz, ahol minden lépésed egy méter hosszú. Hat lépést teszel, akkor hat métert haladtál előre (1, 2, 3, 4, 5, 6). Még 24 lépés után is csak 30 méterre vagy a kezdeti helytől. Ezt nagyon könnyű “megjósolni”, hova jutsz további 30 lépés után – ez a lineáris növekedés. Azonban, ha figyelmen kívül hagyjuk az emberi anatómiát, képzeld el, hogy minden lépéssel képes lennél megduplázni a lépéseid hosszát. Így most már, amikor hat lépést tettél, máris 32 métert haladtál előre (1, 2, 4, 8, 16, 32), ami jelentősen több, mint az azonos hosszúságú lépésekkel megtett 6 méter. Ennél jobban is megdöbbentő, hogy a 30. lépésnél (a lépéseid folyamatos megduplázásával) egymilliárd méterre kerülsz a kezdeti helytől, ami egyenlő a Föld 26(!) alkalommal való megkerülésével. Az is érdekes tény, hogy amikor megduplázod a lépéseidet, minden lépéssel ugyanolyan távolságot teszel meg, mint az összes előző lépés együttesen. Mielőtt elérnéd az 1 milliárd mérföldet a 30. lépésnél, még “csak” 500 millió mérföldnél jársz a 29. lépésnél. Ez azt jelenti, hogy az előző lépéseid elhanyagolhatóak az utolsó néhány robbanásszerű hossz-növekedésű lépéshez képest, és a növekedés (fejlődés) legnagyobb része viszonylag rövid idő alatt történik.

Egy másik példa arra, hogy az exponenciális növekedés eleinte megtévesztően lassú lehet, majd hirtelen robbanásszerűen megnő, a lenti szimuláció szemlélteti. Ebben az exponenciális görbe segítségével töltjük fel a Michigan-tavat vízzel. A konkrét példa arról szól, hogy bemutassuk, hogyan érhetik el a számítógépek az emberi agy számítási kapacitását Moore törvénye alapján, amely szerint a számítási kapacitás minden 18 hónapban megduplázódik. Vegyük észre, hogy a folyamat lassan indul egy kis kék pöttyel a tó déli végén, majd fokozatosan halad előre, és hirtelen az utolsó néhány megduplázódás során egy szempillantás alatt megtölti a tavat.

Az MI hatása a munkahelyekre

Fehérgalléros vs. kékgalléros munkák

Ami igazán újdonság a korábbi hasonló változásokhoz képest (és ez részben csak az utóbbi pár év eredményei alapján vált világossá), hogy kiket érint a változás leginkább, illetve hamarabb. Nem is olyan régen, sőt még sok scifi film és könyv alapján is arra gondolhattunk, hogy az MI és a robotok először “kétkezi” munkásokat, pl. gyári munkásokat és hasonlókat fognak leváltani (ezek a kék galléros munkák). Sokan gondolták, sőt még mindig azt gondolják (tévesen!), hogy a fehér galléros munkák, a kreatív, intellektust és kreativitást jelentő munkák (művészek, írók, programozók, kutatók) még jó darabig biztonságban lesznek. Azonban látni fogjuk, hogy ez nem így van, és erre mindjárt hozok konkrét példákat. Érdemes ezt ízlelgetni egy kicsit: nagyon úgy néz ki, hogy a jelenlegi fejlesztések következtében először pont a kreativitást igénylő munkák fognak jelentősen átalakulni vagy sok esetben megszűnni. Erről mindjárt írok részletesebben (hogy milyen munkákra lesz hatással az AI fejlődése, és milyenekre kevésbé), de első körben annyit érdemes figyelembe venni, hogy nem egyik napról a másikra fognak ezek az “emberi” munkahelyek megszűnni. Ettől (még) nem kell tartani. Viszont már most is sok olyan beszámolót olvasni, ami arról szól, hogy egy adott cégnél pl. 2D és 3D grafikusok, írók, marketing szakemberekből lesz jóval kevesebbre szükség, mivel sokszor 1 ember 10 másik ember munkáját el tudja látni. Még mindig szükség van arra, hogy valaki “felügyelje” az AI kimenetét, de olyan mértékű produktivitás növekedést tud okozni egy-egy ilyen eszköz, hogy fele / negyed / tized annyi emberre lehet szükség. Ez megint nem a következő pár év(tized) folyománya lesz, hanem már most is történik:

A közeljövőben egyre több ilyen írás lesz sajnos…

Egy Goldman Sachs bank által 2023 márciusában kiadott jelentés azt állítja, hogy a mesterséges intelligencia akár 300 millió teljes munkaidős állást helyettesíthet (válthat ki) a következő években. A generatív MI (pl. a ChatGPT és a képalapú modellek) képesek olyan tartalmat létrehozni, amelyek sok esetben megkülönböztethetetlenek az emberi munkától. Ez egy jelentős mérföldkő, áll a jelentésben. A tanulmány megemlíti, hogy ezek az eszközök képesek már most a munkafeladatok negyedének helyettesítésére, ugyanakkor új munkahelyeket is teremtenek. Ezen kívül a meglévő munkakörök termelékenységét is jelentősen javíthatja. Végül akár a globálisan előállított áruk és szolgáltatások éves összértékét is 7%-kal növelheti az MI által elősegített termelékenység növekedés.

Milyen állások vannak “veszélyben”?

Rövid távon azok, amely területeken már most is jól teljesítenek az MI modellek. Ezeknél azonban tényleg nem arra kell első körben gondolni, hogy teljesen kiválthatóak MI-vel ezek a foglalkozások, hanem arra, hogy amilyen nagy mértékű produktivitás növekedést okozhat az eszközök használata, olyan mértékben lesz kevesebb munkavállalóra szükség. Pl. ha MI segítségével valaki 10x annyi marketing anyagot tud elkészíteni, mint korábban, akkor a cégnél kevesebb ilyen munkavállalóra lehet szükség. Ilyen, részben vagy egészében kiváltható munkák pedig (a teljesség igénye nélkül, és persze egy jó részükkel lehetne vitatkozni is):

IT munkakörök (kódolók, számítógépes programozók, szoftvermérnökök, adatelemzők)
Média munkások (reklám, tartalomkészítés, műszaki írás, újságírás)
Jogi iparágban dolgozók (jogi asszisztensek)
Pénzügyi munkák (pénzügyi elemzők, személyi pénzügyi tanácsadók, kereskedők, piackutatást elemzők)
Grafikus tervezők
Ügyfélszolgálatosok
Írók és szerzők
Lektorok / fordítók

Milyen munkák lehetnek “jövőállóak”?

Ezek a területek, amelyek kevésbé vannak veszélyben – vagy a munka jellege vagy a munka “társadalmi fontossága” (másokra való potenciális negatív hatása miatt):

Ápolás, fizikoterápia, szociális munka
Oktatás
Emberi erőforrás menedzsment
Szoftvermérnökök / programozók egy része
Pszichológusok
Sportolók
Szépségápolás, fodrászat, stb.
Művészek (amennyiben még lesz széleskörű igény az emberi alkotásokra)
Autószerelők / műszerészek / villanyszerelők
Ácsok / festők / vízvezeték-szerelők / burkolók (“kétkezi munkások”)

Általánosságban elmondható, hogy azok a munkák lesznek kevésbé kitéve az MI térnyerésének, amelyeknél vagy finommotorikus és bonyolult / egyedi mozdulatokkal kell elvégezni, vagy pedig hagyományosan “emberközeli” módon érdemes végezni (tanárok, pszichológusok). A fenti lista nem azt jelenti egyébként, hogy az MI nem fog betörni ezekre a területekre. Az MI szinte minden területen meg fog jelenni, jelentős változásokat hoz, csak éppen ezeknél az állásoknál “csupán” kiegészíti az emberek alap képességeit.

Akkor mit tanuljunk?

Erre a kérdésre nagyon nehéz válaszolni. Érdemes a munkapiaci előrejelzéseket és az MI fejlődését szorosan követni, hogy tájékozódjunk. Amit mindenképpen érdemes lehet tanulni (akár iskolán kívül is, ha van kitől), az az “ezermesterség”, azaz hogy legyünk képesek mi magunk is elvégezni a lakásban / ház körül kisebb javításokat pl. Persze ez az MI nélkül is hasznos dolog volna.

Milyen lehetséges következményei lesznek közép és hosszabb távon az AGI / ASI elterjedésének?

Alacsonyabb jövedelmek: egy sajnálatos lehetséges következménye az automatizációnak, hogy mivel a gépi munka nagyon olcsó, ezért az ezekkel egy darabig még versenyző “hús-vér” munkavállalók rosszabb alku pozícióba lehetnek. Illetve (a produktivitás növekedés miatt) megcsappanó munkaerő keresletet is lefelé viszi az elérhető jövedelmeket
UBI: amennyiben nagyon sok munkahely válik pár évtizedes távlatban feleslegessé (a nagy része?), úgy a korábban már bemutatott alapjövedelem az egyik lehetséges “megoldás” lehet.
Rövidebb munkaidő: elképzelhető, hogy (egy rövidebb átmeneti időszakra) az MI fogja elhozni a 2-3 napos munkahetet és/vagy rövidebb munkanapot.

Néhány cikk a témában:

Mit tegyünk és mit ne tegyünk akkor?

Eldönthetjük, az apátia (minden mindegy), a pesszimizmus, vagy a tehetetlenség lesz úrrá rajtunk. Vagy dönthetünk úgy is, hogy optimistán, bizakodóan, egyúttal felkészülten és éberen követjük a történéseket. Ezekhez kapcsolódóan sorolnék fel itt pár gondolatot, ezek próbálják leírni, hogyan tervezek viszonyulni a dolgokhoz.

Várakozás/gyaloglás dilemma

A várakozás/gyaloglás (wait-walk) dilemma a buszmegállóban történő várakozás során merül fel, amikor a várakozás időtartama meghaladhatja az úti cél más módon, különösen gyalogosan történő eléréséhez szükséges időt. Ehhez nagyon hasonló dilemma a csillagközi utazás kapcsán is van: ezt “várakozási számításnak” nevezik, amely azt próbálja meghatározni, hogy mennyi ideig kell várni a technológiai fejlődésre, hogy az űrhajók sebessége tovább javuljon, mielőtt belevágnánk az utazásba. Ellenkező esetben ha egy “lassú” űrhajóval “túl hamar” nekivágnánk az útnak, könnyen lehet, hogy akár egy-két évtizeddel később induló hajó lehagyná a korábban indult űrhajót.

Ez a dilemma felmerülhet egyesekben a mesterséges intelligencia fejlődése kapcsán is, és egy kissé apatikus hozzáállást vetít előre. Úgy lehetne megfogalmazni, hogy van-e értelme tanulni új dolgokat, egyetemre járni, ha egy bizonyos idő után a technika fejlődése a tudás jó részét, egy csapásra elavulttá teheti. Van-e értelme akár állami szinten nagy ívű, több évtizedes projekektbe belekezdeni, ha – az optimista forgatókönyveket alapul vével – néhány év, maximum évtized múlva a technika fejlődése messze meghalad minden elképzelhetőt. Van-e értelme például atomerőműveket vagy akár csak napelem parkokat építeni, ha abban bízunk, hogy a fúziós erőművek hamarosan olcsóbban és tisztábban fognak szinte korlátlan energiát termelni (ezek kutatását is fel tudja potenciálisan gyorsítani a mesterséges intelligencia és a számítási kapacitások exponenciális növekedése). Ezek egy része persze provokatív kérdés, hiszen ki mondaná azt, hogy nincs értelme tanulni, egyetemre járni… De maga a gondolkodásmód ettől még hasznos, hogy jól gondoljuk át azokat a jelenbeli döntéseinket, amelyek hosszabb távú hatással bírnak az életünkre. Ezekről még a többi téma kapcsán fogok írni. Némileg kapcsolódva álljon itt egy bölcsesség a taoizmus nagymesterétől, Lao-ce-től:

Tanulás, iskolák, új szakmák

Amennyiben valóban beválnak a jóslatok, hogy milyen fejlettségi szintre juthat el az MI hamarosan, és mennyire válnak majd a hétköznapjaink részévé, továbbá hogy mely munkák válhatnak feleslegessé a következő nem is túl távoli jövőben, akkor belátható, hogy a tanulás és az iskola, mint intézmény (is) gyökeresen át fog alakulni.

Pár példa a korábban is részben tárgyaltak mellett, mire használhatjuk (vagy mások mire használják) már most is pl.a ChatGPT-t

Plágium kérdése, házifeladatok: sokan a házifeladatuk, beadandójuk, diploma munkájuk megírásához használják. Plágium régen is volt, de ezekkel az eszközökkel bárki számára adott a lehetőség.
Cikk a témában: Lehetetlen kitiltani, ezért mindent boríthat a felsőoktatásban is a ChatGPT
Személyes tanító, aki sohasem fárad el, és bármit elmagyaráz: erről már írtam a korábbi részekben, hogy ilyen dologra csak meg kell “kérni” az MI-t, pl. a ChatGPT-t, és máris kaphatunk ingyen egy személyes oktatót, aki szinte bármit elmagyaráz és megtanít, amit kérünk tőle, feladatokat is ad., kikérdez, stb.…

Ha egy kicsit távolabbra tekintünk, 1-2 évtizedes távlatban, akkor minden sokkal bizonytalanabb. Számomra sem egyértelmű, hogy milyen dolgok tanulásának “van értelme”, vagy minek nincs. Van-e értelme továbbra is lexikális tudást magolni, ha ezeket most már tényleg bármilyen helyen elő lehet hívni (ez a kérdés már régóta aktuális egyébként)? Van-e értelme nyelveket tanulni, ha a Galaxis útikalauz-ban lévő bábel hal szerű eszköz (észrevétlen szinkron-fordítás egy kis eszköz segítségével) pár éven belül valóság lesz? Persze ezek provokatív kérdések, hiszen a nyelv több annál, hogy egy (idegen) nyelvet beszélünk: egy gondolkodás módot is elsajátítunk, így még mindig van létjogosultsága egy vagy több új nyelvet elsajátítani. De az idegen nyelv használata, mint tanult kommunikációs csatorna, háttérbe szorulhat.

Nem szeretnék további érzékeny területekre tévedni, vagy minősíteni az egyes személyes döntéseket, hogy kinek a gyermeke melyik irányba indul(t) a tanulmányai során. Ami viszont kijelenthető, hogy jelenleg még a korábbinál is fontosabb végiggondolni, hogy a terület, amit tanulni szeretnénk, vajon mennyire jövőálló, vagy éppenséggel teljes mértékben megszűnőben van, mint “emberi” munka. De még ha nem is szűnik meg teljesen, a tizedére csökken a kereslet rövid időn belül, mert a már most is létező MI eszközökkel, a megmaradt munkaerő 1/10-e is képes ellátni ugyanazt (a produktivitás növekedés miatt).

Ettől függetlenül minden körülmény között fontos, hogy a gyerekek megismerkedjenek a történelemmel, hogy ismerjék a gyökereiket, és tudjanak tanulni a múlt hibáiból. A józan / logikus / kritikus gondolkodás elsajátítása szintén olyan képesség, amire mindig szükség lesz. Az empátia hasonlóképpen: legalább mi magunk maradjunk emberek, ha a mesterséges intelligencia csak szimulálja, hogy (át)érzi az emberi érzelmeket. Véleményem szerint pedig a korábban említett “ezermester” mentalitást is érdemes lehet átadni, hogy képes legyen a gyerek új helyzetekben is feltalálni magát, és ne féljen “bepiszkolni a kezét” (get your hands dirty, ahogy angolul mondani szokás).

Két cikk arról, hogyan lehet már most is használni az AI-t az oktatásban:

Sportolás, művészet és hobbik

Lehangoló lehet, hogy a munkánkat (amit eddig jó esetben szerettünk és élveztünk), egy idő után a mesterséges intelligencia elvégzi, sokszor jobb minősében és sokkal gyorsabban, mint mi magunk. De ugyanígy mi értelme van kiélni a művészi hajlamainkat, ha egy MI “rajzoló” profi művészeket megszégyenítő alkotásokat hoz létre? Miért írjunk novellákat, történeteket, ha MI-vel pár perc alatt jobbat és koherensebbet írathatunk, mint amit mi magunk akár hónapokig csiszolgatunk? Ezekre a kérdésekre nehéz választ adni, helyette pár dolog, ami talán ad némi megnyugvást:

Manapság a sakk népszerűsége és nézettsége magasabb, mint valaha, holott a Deep Blue már 1997-ben legyőzte az akkori világbajnok Kaszparovot. A jelenlegi MI-k élőpontszáma 3400 fölött van, ami a világbajnok Magnus Carlsen-énél is sokkal magasabb. Tehát igazából már nincs olyan emberi kihívója az MI-knek, ahol lenne esélyük a győzelemre. Ennek ellenére a sakk játék a reneszánszát éli.
Hasonló és jóval régebbi analógia, hogy hiába vannak a közlekedésnek hatékony módszerei, sokan mégis futnak kedvtelésből. Hiába lehet gépkocsival gyorsabban és kényelmesebben eljutni valahova, sokan mégis a kerékpárt vagy tömegközlekedést választják.

Általánosságban is lehet mondani, hogy lehet akármilyen hobbink, jó eséllyel vannak nálunk jóval ügyesebbek, mégis csináljuk, mert örömöt lelünk benne.

Emberi kapcsolatok / önmegvalósítás

Egy közhelyes “jótanács”, de van jó magyarázat arra, miért helyezzünk még nagyobb hangsúlyt az emberi kapcsolatokra: elképzelhető, hogy a jövőben már kevesebbet fogunk dolgozni (vagy semennyit, vagy mert eljött az apokalipszis, vagy pedig jó esetben azért mert, már nem szükséges dolgoznunk). Ha valóban kevesebb időt töltünk munkával a hagyományos értelemben, akkor örömöt, és változatos kikapcsolódási lehetőségeket lelhetünk családunk és barátaink társaságában.

A másik fontos, és talán triviális tanács: csináljuk azt, amit szeretünk, ami örömet okoz.

Befektetések, megtakarítások és a kapitalizmus

Ez egy nagyon bonyolult téma, nem is teszek rá kísérletet, hogy részletesen belemenjek, milyen lehetséges forgatókönyvek vannak a világgazdaság átalakulására, miután az emberi képességű intelligenciák (később pedig a szuperintelligencia) elterjed. A korábban ismertetett nagyon jelentős és tovagyűrűző munkapiaci hatások igazából csak a kezdet: egyes vélekedések szerint a kapitalizmus szűnhet meg vagy alakulhat át gyökeresen a következő 1-2 évtizedben. Ilyen formán lehetne akár olyan következtetésre jutni, hogy valójában nincs értelme hosszú (10+ éves) távra befektetni, hiszen nagy horderejű változások várhatóak. Ugyanígy felmerülhet, hogy ha mégis befektetnénk, akkor melyek a jövőálló eszközök? Erre szinte lehetetlen válaszolni, azonban általánosságban kijelenthető, hogy azok a cégek, akik jelenleg az éllovasai a változásnak, jó eséllyel meg tudják tartani ezt a pozíciót még pár évig. Ilyen cég pl. a Microsoft. A másik sokat hangoztatott példa a történelemből, hogy az aranylázak idején a legnagyobbat az eszközöket / szerszámokat gyártó cégek szakítottak, nem az egyes aranyásók. Ennek analógiájára érdemes lehet azokra a csip gyártó cégekre helyezni a hangsúlyt, akiknek a csipjeivel ezeket az új MI modelleket betanítják és szolgáltatják. Ezek közül jelenleg a legismertebb az NVIDIA, a TMSC vagy AMSL. De persze most sincs semmilyen “tuti tipp”, ezért mindenki maga mérlegeljen, hogyan alakítja a befektetéseit

Az MI aktív használata

A végére hagytam a leggyakorlatiasabb tanácsot: használjuk az MI-t, ahol csak lehet. Ez így talán kicsit túlzás, de a lényeg az, hogy ne “féljünk” használni bármelyik MI eszközt, akár kép generálásra, akár videó vágására vagy kép szerkesztésre. Itt a félelem helyett egyébként használhatnák a “büszkeség” szót is. Jómagam is úgy gondoltam az elején, hogy “szégyen” az MI segítségét kérni pl. programozási kérdésekben, miért nem áldozok rá pár órát, hiszen a “szenvedés nemesít”. De aztán rájöttem, hogy ez önbecsapás. Az MI segítségével is tudok tanulni új dolgokat, az MI is nagyon jó tanító, és nem fog leszidni, ha valamit harmadszorra kell elmagyaráznia.

Jelenleg a legsokoldalúbb eszközök – annak ellenére, hogy egyelőre csak szöveges felületük van – a korábban részletesen is tárgyalt nagy nyelvi modellek. A legismertebb, ingyenesen is elérhető szolgáltatást, a ChatGPT-t, már most is nagyon változatos helyeken használhatjuk, lásd a korábbi részben írt számtalan példát. TLDR: értsd meg, fogadd el és használd az MI-t!

Törvényi környezet

Azon kívül, hogy még nagyon bizonytalan a fejlődés üteme a következő években, van egy másik tényező, ami jelentősen lassíthatja vagy “eltérítheti” az MI térnyerését: ez pedig a jogi környezet, a szabályozások. Még csak most kezdenek feleszmélni a törvényhozók, hogy mi mindent kell végiggondolniuk:

Adatvédelem: fontos, hogy az MI modelleket használók biztonságban érezhessék a “beszélgetési történetüket” vagy más személyes adatukat, és ne használja az adott szolgáltatást fejlesztő cég ezeket engedély nélkül, pl. a modellek továbbfejlesztésére. Olaszországban ideiglenesen be is tiltották a ChatGPT-t adatvédelmi okokra hivatkozva.
Szerzői jog: ezzel kapcsolatban kényes kérdéseket lehet feltenni:
1. Kié az AI által generált kép vagy szöveg szerzői joga?
2. Van-e joga egy cégnek potenciálisan szerzői jog által védett képekkel vagy szövegekkel zárt / profitorientált MI modelleket betanítani?
Munkahelyek védelme: erről korábban írtam, miszerint a munkahelyek egy nagyon jelentős része “veszélyeztetett” az MI térnyerése miatt. Egy állam vagy gazdasági egyesülés (pl. EU) viszont dönthet úgy, hogy bizonyos ösztönzőkkel vagy törvényekkel részben megadkadályozza vagy legalább lelassítja ezt a változást
Mesterséges intelligencia “kritikus” környezetekben: érdemes megfontolni, hogy az MI-ket korlátozzák bizonyos környezetben, pl. fegyvereknél, gyermekek által hozzáférhető helyeken, stb.
Bűnözés: a bemutatott MI modellek (nyelvi modellek, videó és hang generátorok) sajnos a bűnözők kezébe is felbecsülhetetlen értékű eszközt ad: ezekkel az eszközökkel a korábbiaknál sokkal hatékonyabb megtévesztő kampányokat lehet végrehajtani (választások eredményét is megváltoztathatja). Sokkal szofisztikáltabb / célzottabb támadásokat lehet indítani. Adott esetben egy teljesen automatizált email küldő programot tudnak fejleszteni, ami a fenyegető emaileket személyre szabottan küldi ki, pl. úgy, hogy az MI elemzi az illető közösségi hálós tevékenységét, és azok alapján írja meg a zsaroló üzenetet. De ez csak egy “ötlet” a sok ezerből…

Az EU már elkezdett dolgozni egy szabályozáson, illetve a világ más részein is foglalkoznak a témával. A kérdés, hogy mennyire lesznek ezek a szabályozások hatékonyak, és mennyire lesz akár az “élesítést” követően elavult:

Regulatory framework proposal on artificial intelligence | Shaping Europe’s digital future

Egyes vélemények szerint ugyanakkor nincs szükség semmilyen törvényi akadályra, ehelyett engedjük szabadjára a technika fejlődését és majd a (vad)kapitalizmus “önszabályozza” magát. Adam Smith óta tudjuk, hogy ez nem mindig jó ötlet.

Úgy gondolom, szükség van szabályozásra, de nem szabad olyan törvényeket hozni, ami ezeket az eszközöket egyes helyeken teljesen ellehetetleníti. Hiú ábránd lenne azt gondolni, ha pl. az “EU” szigorú szabályokat hoz, akkor a világ más részein is automatikusan követik ezeket, nem pedig éppen versenyhátrányhoz juttatja az európai cégeket.

Az emberek típusai

Talán érdekes lehet kitérni egy kicsit arra is, hogy én milyen fajta véleményekkel találkoztam, amikor ezek a részben új fajta MI technológiák előkerülnek. Magunkat is besorolhatjuk valamelyikbe.

Nem ismeri még ezeket a technológiákat: akik hallottak is innen onnan, hogy van ez a csevegőbot, vannak képgenerátorok, amik elég jók, de nem igazán néztek ezeknek jobban utána, vagy próbálták ki. Nekik csak annyit tudok javasolni, hogy hajrá! Korábban hoztam nem egy példát, hogy melyik fajta MI-t hogyan lehet kipróbálni, mire jók. Érdemes megismerkedni ezekkel.
Ismeri, de nem nyűgözte le őket: akik már próbáltak párat, de nem győzte meg őket. Ők talán azok, akik vagy nem elég alaposan próbálták ki ezeket (nem megfelelő kéréssel vagy eszközzel / módon próbálkoztak), vagy pedig próbálják magukkal elhitetni, hogy nincs semmi újdonság valójában és/vagy még több évtizedre vagyunk attól, hogy a világ jelentősen átalakuljon. Véleményem szerint ez egy “veszélyes” álláspont, mivel talán ezen emberek munkája lehet leginkább veszélyben azáltal, hogy egy távolságtartó álláspontot képviselnek, a világ viszont halad tovább. (Erről is írtam korábban.)
Ismeri, lenyűgözte, de félnek tőle: ezeknek az embereknek ijesztő lehet az a gondolat, hogy a munkájukat vagy a gyerekeik jövőbeli munkalehetőségeit jelentősen átalakítja az MI fejlődése. Sokszor az ember egyébként is aggódik a saját és szerettei jövője iránt. Ezt az aggódást az új, ismeretlen technológia felerősítheti. A jó hír viszont az, hogy ha kellően optimistán kezdünk tekinteni a jövőbe, és minél többször kihasználjuk az új technológiák adta lehetőségeket, akkor igazából megtettünk mindent, hogy a “felszínen maradjunk”.
Ismeri, lenyűgözte, nem fél tőle: végezetül azok, akik jól ismerik és sokat használják ezeket az új dolgokat, nem tartanak tőle, hanem pozitívan és optimistán tekintenek a fejlődésre. Szerintem ez lenne a kívánatos álláspont, kivéve persze, ha az ember elmenne remetének, és technológia mentesen élné tovább az életét, kivonva magát a hagyományos társadalomból. Hogy ez utóbbi mennyire egy reális lehetőség, és mennyi ideig lehetne fenntartani, más kérdés.

Talán meglepő módon, de nem lehet kijelenteni, hogy az, aki napi szinten foglalkozik a technológiával vagy akár programozással, az mindenképpen a 4., esetleg 3. kategóriába esik. Valójában sok olyan beszámolót hallottam, hogy egy programozó kipróbálta pl.a ChatGPT-t, de nem nyűgözte le, amit látott. Ennek egyébként számtalan oka lehet, pl. rosszul specifikált kérés. Valóban vannak még limitációk, de a fejlődés iránya és sebessége elég egyértelműen azt mutatja, hogy a szakmánk (pl. a programozás) sincs biztonságban, de ezt már kifejtettem korábban, miért.

Záró gondolatok

Mondhatnátok, hogy ez megintcsak egy túlparázás. A covid járványra is sokan mondták, hogy a világ túlreagálta. (Szerintem egyébként nem: amikor benne voltunk, még nem lehetett mindent előre látni. Az akkor hozott intézkedések nélkül valószínűleg jóval nagyobb lett volna az áldozatok száma.).

Azt próbáltam ebben a nem túl rövid írásban levezetni, hogy mi várhat ránk a (közel)jövőben, hogyan tudunk felkészülni ezekre, amennyire csak lehetséges.

Ahogy említettem a bevezetőben, jelenleg még nagy a bizonytalanság, mikor és milyen mértékben következnek be ezek a dolgok, mennyire gyorsan mennek végbe a változások. Az is elképzelhető, hogy Magyarországon illetve más országokban a fejlődés üteme más lesz, ami alapján hamisan azt gondolhatjuk (ha csak a hazai történéseket követjük), hogy nagyjából minden úgy megy, mint “régen”. Eközben a világ más (fejlettebb) részein előbb “beindul” az exponenciális változás, mint itthon. Előbb vagy utóbb kiderül.

Remélem, párotok számára hasznos volt egy ilyen kitekintést olvasni. Nyugodtan lehet vitatkozni néhány megállapítással, kritikával élni. Sőt kimondottan kérnélek is titeket, hogy itt a post alatt vagy privát üzenetben írjátok meg, mit gondoltok. Ha valamelyik téma ezek közül részletesebben is érdekelne titeket, írjátok meg nyugodtan, megpróbálok írni róla később még.

Ajánlott könyvek, videók

Végezetül álljon itt néhány ajánló…

Max Tegmark: Life 3.0 (Élet 3.0)

Csak idő kérdése az ember feletti általános mesterséges intelligencia megalkotása, ami a korábbi technológiáknál sokkal nagyobb mértékben fogja átalakítani az életünket. A közeljövőben gyökeresen megváltoznak mindennapjaink, akárcsak az egészségügy, az igazságszolgáltatás, a hadászat és a jogrendszer, a magántulajdon és a munkahelyek megszűnésével pedig a gazdaságban ma érvényesülő elvek is értelmüket vesztik.

Max „Mad Max” Tegmark, az MIT fizikaprofesszora gondolatkísérleteiben a távoli jövőre vonatkozóan is felvázolja a lehetséges forgatókönyveket: az optimista elképzelésektől egészen a legsötétebb végkifejletekig veszi sorra, hogyan alakulhat az emberiség és az élet sorsa az univerzumban. Könyvében arra szólít fel minket, hogy még időben gondoljuk át, milyen jövőt szeretnénk, és ennek érdekében milyen célokat adjunk a jövő szuperszámítógépeinek – ugyanis a „robusztus és jó szándékú” mesterséges intelligencia akár a legjobb dolog is lehet, ami az emberiséggel történhet.

HVG Könyvek Kiadó – Élet 3.0

(Ezt a könyvet – angol nyelven – kölcsön tudom adni annak, aki szeretne egy tényleg nagyon alapos, és tudományos szempontból megközelített könyvet olvasni a témában. Részben ez a könyv volt az inspiráció arra, hogy megírjam ezt a bejegyzést.)

Nick Bostrom: Szuperintelligencia

A könyv az emberi agyat felülmúló mesterséges intelligenciával, az ún. „szuperintelligenciával” foglalkozik. Biztosra veszi, hogy a közel- vagy a távoli jövőben mindenképpen feltaláljuk a minket felülmúló mesterséges értelmet. Annak pozitívumával és negatívumával, nem csak természettudományos, hanem filozófiai értelemben is körüljárja a kérdést. Nick Bostrom szerint a „rossz útra tért” MI-k hozzájárulhatnak az emberiség egyeduralmának megdöntéséhez vagy kipusztításához, ezért nagyon fontos, hogy a fejlesztésüknél a biztonságra, azaz az irányíthatóságra törekedjünk. A Szuperintelligencia c. könyv az utóbbiakhoz ad útmutatást. A könyv felkapaszkodott a New York Times bestseller listájára, és az utóbbi évek egyik meghatározó tudományos munkájává nőtte ki magát.

Szuperintelligencia · Nick Bostrom · Könyv · Moly

Youtube csatorna: Two Minute Papers

Egy magyar kutató, Dr. Zsolnai-Fehér Károly Youtube csatornája, ami nagy követői táborral rendelkezik külföldön is: https://www.youtube.com/@TwoMinutePapers/featured. Közérthetően (bár kissé vicces stílusban) tárgyalja az új MI kutatási eredményeket, példákkal, élvezetes módon.

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Ez egy tanulmány, de elég olvasmányos, és nagyon sok konkrét példát tartalmaz arra vonatkozólag, amire a kicsit szenzációhajhász cím is utal: miszerint a legújabb és legfejlettebb GPT4 nyelvi modell Általános mesterséges intelligencia (Artificial General Intelligence – AGI) szintű “viselkedést” mutat bizonyos esetekben. Azaz rendelkezik részben azokkal a képességekkel, amit az AGI-től majd elvárunk. (Lásd a definíciót korábban.)

https://arxiv.org/pdf/2303.12712.pdf

Ehhez kapcsolódóan van egy jobban emészthető videó is az egyik szerzőtől, amit az MIT-n tartott (nem uncsi egyáltalán, hiába majdnem 1 órás): Sparks of AGI: early experiments with GPT-4

A mesterséges intelligencia és a szingularitás