A 2024-es év egyik szenzációja a mesterséges intelligencia (MI) használatával alkotott képek és szövegek viharos gyorsaságú terjedése volt. Giccses, vicces és becsapós képek árasztották el a világhálót, kihívás elé állítva a gondolkodó médiafogyasztót. De valahogy meg kellene különböztetni a valóst a mesterséges intelligencia kreálmányaitól... Az algoritmusok rohamos fejlődése miatt a feladat a szakértőknek is egyre nehezebb. A kutatót mindeközben az foglalkoztatja, hogyan lehetne értelmes célokra használni az új technológiát
Évtizedek óta elvárás, hogy az eredményeket vizuálisan is bemutassuk. Mit mond erről a legnépszerűbb MI, a ChatGPT? „A vizualizálás olyan folyamat, amely során adatokat, információkat vagy ötleteket képekké, diagramokká, grafikákká vagy más vizuális formákká alakítunk, hogy könnyebben érthetővé és értelmezhetővé váljanak. Célja, hogy a komplex vagy absztrakt fogalmakat szemléletes módon ábrázolja, segítve ezzel a jobb megértést és elemzést.”
A természettudomány eredményei leggyakrabban számok, táblázatok vagy szöveg formájában jelennek meg, ennek befogadása a döntéshozók és laikusok számára sokszor reménytelen. Ezért is fontos, hogy mindez képi formában is megjelenjen: egy kép többet mondhat ezer szónál…
A kutatók azonban többnyire nem művészek vagy grafikusok. A születő ábrák grafikailag nagyon egyszerűek, gyakran valamilyen vonalas alkotások. Ez egy molekula szerkezeti képleténél még csak-csak elmegy, de egy bonyolult táj elemzésénél már a vizsgálatok komolyságát vonja kétségbe egy karikatúraszerű ábra.
A képi megjelenítés egyik lehetősége, ha a kutató felkér egy stúdiót vagy művészt, aki az útmutatásai alapján elkészít egy-két látványos képet vagy rövid filmet. Ezzel az a probléma, hogy valójában mindez folyamatos szakértői jelenlétet, folytonos korrektúrát, és sok-sok grafikust, plusz időt és pénzt igényel. A mesterséges intelligencia technológiája erre adhat egyre jobb megoldást.

Alkossunk képeket!
A képalkotás egyik különösen problémás területe az egykori tájak, életközösségek és ökoszisztémák megjelenítése. A tájképkészítés MI segítségével önmagában nem komoly kihívás, kisebb gyakorlattal pár perc alatt készíthetünk olyan látványos, de művi „természetfotókat”, amelyekhez hasonlókra csak egzotikus tájakra tett utazással és többéves tájfotós gyakorlattal lehet szert tenni. A közösségi médiában már most is elég sok MI-generált tájkép jelenik meg. Még a természetfotós oldalakon is találkozhatunk ilyenekkel, ami persze etikátlan, hiszen ezek nem valódi fotók.
A kutatók célja azonban nem is ez, hanem fotorealisztikus illusztrációk készítése. De mitől lesz jó egy tájképi rekonstrukció? Elsősorban a tudományos megalapozottságtól, és csak másodsorban az MI-alkalmazások ismeretétől. A tudományos munka a legfontosabb, hiszen nem egy sohasem volt, mesebeli tájat akarunk bemutatni! Mindehhez földrajzi, ökológiai, őskörnyezeti és tájtörténeti ismeretanyag kell, hogy pontosan tudjuk, milyen végeredményt szeretnénk viszontlátni.
Múltbéli tájak nyomában
A történeti földrajz különböző korszakok társadalmi, gazdasági és természeti viszonyainak térbeli sajátosságait kutatja. A régi térképek, oklevelek, krónikák, települési és népességi adatok segítségével feltérképezhető egy középkori település szerkezete, egy folyó medrének változása vagy egy régió gazdasági központjainak elhelyezkedése az évszázadok folyamán.
Ezzel rokon tudományág a tájtörténet, amit elsősorban az ökológusok művelnek. A tájtörténet a tájak kialakulásának és változásának történetét vizsgálja, feltárva a természeti folyamatok és az emberi tevékenység hatását a növényzet fejlődésére a különböző időszakokban.
Az őskörnyezettan a múltbeli környezetek rekonstrukciójával foglalkozik. Azt vizsgálja, hogyan változtak a természeti viszonyok (pl. az éghajlat, a növényzet és az állatvilág) az egyes földtörténeti korokban. Forrásai közé tartoznak az ősmaradványok és az üledékek, ezért elsősorban geológusok és biológusok művelik.
Egyre fontosabbá válik a régészek számára is a múltbeli tájak elemzése. A környezetrégészet a régészeti lelőhelyek természeti környezetének vizsgálatával foglalkozik, feltárva az ember és környezete közötti múltbeli kölcsönhatásokat. Elemzi az éghajlat, a talajviszonyok, a növényzet és az állatvilág szerepét az emberi életmód alakulásában. A tájrégészet pedig a történeti táj változásait kutatja, beleértve a természeti és ember által alakított táji elemeket. Vizsgálja, hogyan formálták a tájat a különböző korszakok társadalmai, például a földhasználattal vagy a településeikkel.
Fontos információkkal szolgálnak a néprajzi kutatások is, például a hagyományos ökológiai tudás feltárásával, mint amilyen a hortobágyi pásztorok ismeretei a puszta régi viszonyairól. És természetesen fontosak a növénytani és geomorfológia ismeretek is. Milyen növényzet jellemző ma egy tájra, és ebből mi lehet az ősi, és mi a modern? Mely domborzati formák az eredetiek, és melyek az ember alkotta mesterséges mintázatok?
Nem gyerekjáték – még
De hogyan lesz a kutatási eredményekből fotorealiszikus tájkép? Az MI-alkalmazások egy szöveges utasítás alapján készítenek képet. Ez az utasítás a „prompt”. Egy tájkép esetében ez olyan információkat tartalmaz, mint a domborzat és a növényzet jellemzői vagy a távlat. Például: „Rajzolj egy képet, amin egy széles, kanyargós folyó látható madártávlatból. Árvíz sújtja a tájat, és a folyó vize túllépett a partvonalon, elárasztva a környező mezőket és fákat. A kép középpontjában a folyó kanyarog, és az ártér tele van vízzel. A víz tükrözi a szürkés égboltot, amelyet felhők borítanak. A fák részben vízben állnak, és a szürkésbarna árnyalatú táj kissé ködös, hűvös hangulatot sugároz.” Ilyen részletes meghatározáshoz gyakorlat kell, de ebben is kérhetjük az MI segítségét.
Az MI-alkalmazások valójában szinte bármit meg tudnak jeleníteni, legfeljebb mi nem tudunk elég pontos utasítást írni.
Legtöbbször az is segítséget jelent, ha ezt angolul tesszük, mert így több képet talál mintaként az alkalmazás. És ez jelenti az MI-képkészítés egyik buktatóját! Nem tudjuk, mit használnak fel mintaként az alkalmazások.
A képek pedig sablonosak és unalmasak lesznek. Hiányzik belőlük a megjeleníteni vágyott táj karaktere, amiről már első pillanatban felismerhetjük, hogy „igen, ez egy alföldi ártér árvíz idején”.
Igen gyakoriak a képalkotási hibák is. Az MI nem teljesen érti a természeti törvényeket, nem érti, miért és hogyan kanyarog egy folyó, és ezt hogy követi a növényzet mintázata. Nekünk kell erre megtanítani a mesterséges intelligenciát, de ehhez már nem elég egy utasítás.


Akkor érhetjük el a legjobb eredményt, ha a különböző technikákat és a különböző MI-alkalmazásokat kombináljuk. A valós tájról készült fotókat, drónfelvételeket kompozíciós és stílusmintaként lehet feltölteni az MI-alkalmazásokba. Ez azt jelenti, hogy megmutatjuk a programnak, hogy mit szeretnénk látni, milyen domborzatot, vízrajzot és növényzetet. Így a saját alkotói stílusunk és a táj egyedi karaktere is megjelenik a képeken. Arra persze vigyázni kell, hogy a mintaként használt képeken ne legyen olyan objektum, amit nem szeretnénk a végeredményen is viszontlátni... Ha például egy műút van a képen, akkor valahol a generált képen is lehet majd út.


A tájképi rekonstrukciók legmagasabb szintjét jelenleg az jelenti, amikor régi térképeket vagy háromdimenziós domborzatmodelleket használunk mintaként, amivel jelentős térbeli hasonlóságot érhetünk el a múltbeli tájhoz. Az Első Katonai Felmérés térképei például kiválóan használhatóak a 200 évvel ezelőtti vízrajz és növényzet foltjainak bemutatásához.
Ha további részletekre vagy kíváncsi, hogyan használható a mesterséges intelligencia a geográfusok számára, lapozz bele a Földgömb 2025/január–februrái lapszámába!

Amennyiben rendszeresen szeretné olvasni lapunkat, fizessen elő kedvezményes áron!
Előfizetek