Nola funtzionatzen du IAren eskalatzea

Nola funtzionatzen du AI Upscaling-ak?

Erantzun laburra: IAren eskalatzea eredu bat bereizmen baxuko eta handiko irudi parekatuetan entrenatuz funtzionatzen du, eta gero pixel gehigarri sinesgarriak aurreikusteko erabiliz eskalatzean. Ereduak antzeko ehundurak edo aurpegiak ikusi baditu entrenamenduan, xehetasun sinesgarriak gehi ditzake; bestela, bideoan haloak, azal argizaria edo keinuak bezalako artefaktuak "haluzinatu" ditzake.

Ondorio nagusiak:

Iragarpena : Modeloak xehetasun sinesgarriak sortzen ditu, ez errealitatearen berreraikuntza bermatua.

Ereduaren aukera : CNNek egonkorragoak izan ohi dira; GANek zorrotzagoak izan daitezke, baina ezaugarriak asmatzeko arriskua dute.

Artefaktuen egiaztapenak : Kontuz haloekin, ehundura errepikatuekin, “ia letrak” eta aurpegi plastikoekin.

Bideoaren egonkortasuna : Erabili denborazko metodoak, bestela fotograma batetik bestera distira eta desbideratzea ikusiko duzu.

Erabilera arriskutsua : Zehaztasuna axola bada, prozesamendua jakinarazi eta emaitzak ilustratibo gisa tratatu.

Nola funtzionatzen du IAren eskalatzea? Infografia.

Ziurrenik ikusi duzu: irudi txiki eta kurruskari bat inprimatzeko, erreproduzitzeko edo aurkezpen batean zimurtu gabe jartzeko bezain garbi bihurtzen da. Iruzurra bezala sentitzen da. Eta - modurik onenean - nolabait hala da 😅

Beraz, IAren eskalatzea nola funtzionatzen duen "ordenagailuak xehetasunak hobetzen ditu" (esku uhintsua) baino zerbait zehatzagoa da, eta "eredu batek bereizmen handiko egitura sinesgarria iragartzen du adibide askotatik ikasitako ereduetan oinarrituta" esamoldeari hurbilago dago ( Irudi superbereizmenerako ikaskuntza sakona: inkesta bat ). Iragarpen urrats hori da joko osoa, eta horregatik izan daiteke IAren eskalatzea harrigarria... edo pixka bat plastikoa... edo zure katuak bibote gehigarriak hazi izan balitu bezala.

Honen ondoren irakurri nahi izango dituzun artikuluak:

🔗 Nola funtzionatzen duen IAk
Ikasi AI-ko modeloen, datuen eta inferentziaren oinarriak.

🔗 Nola ikasten du IAk
Ikusi nola hobetzen duten entrenamendu-datuek eta feedbackak modeloaren errendimendua denboran zehar.

🔗 Nola detektatzen dituen IAk anomaliak
Ulertu oinarrizko ereduak eta nola adimen artifizialak portaera ezohikoak azkar markatzen dituen.

🔗 Nola aurreikusten duen IAk joerak
Arakatu seinaleak hautematen dituzten eta etorkizuneko eskaria aurreikusten duten aurreikuspen metodoak.


Nola funtzionatzen duen IAren eskalatzea: ideia nagusia, eguneroko hitzetan 🧩

Eskalatzea handitzeak bereizmena handitzea esan nahi du: pixel gehiago, irudi handiagoa. Eskalatze tradizionalak (bikubikoa bezala) funtsean pixelak luzatzen ditu eta trantsizioak leuntzen ditu ( interpolazio bikubikoa ). Ondo dago, baina ezin ditu berriak - interpolatu besterik ez du egiten.

IA eskalatzeak zerbait ausartagoa saiatzen da (ikerketaren munduan "super-bereizmena" bezala ere ezagutzen dena) ( Irudiaren super-bereizmenerako ikaskuntza sakona: inkesta bat ):

  • Bereizmen baxuko sarrerari begiratzen dio

  • Ereduak ezagutzen ditu (ertzak, ehundurak, aurpegiko ezaugarriak, testu-trazuak, ehunen ehundura...)

  • Bereizmen handiagoko bertsio batek nolako itxura izan beharko lukeen

  • Eredu horiei egokitzen zaizkien pixel datu gehigarriak sortzen ditu

Ez da "errealitatea ezin hobeto leheneratu", baizik eta "asmakizun oso sinesgarria egin" ( Irudi Superbereizmena Sare Konboluzional Sakonak Erabiliz (SRCNN) ). Susmagarria iruditzen bazaizu, ez zaude oker - baina horregatik funtzionatzen du hain ondo 😄

Eta bai, honek esan nahi du AI eskalatzea funtsean haluzinazio kontrolatua dela... baina modu produktiboan eta pixelak errespetatuz.


Zerk egiten du IAren eskalatze-bertsio ona? ✅🛠️

IA eskalatzaile bat (edo aurrezarpen bat) epaitzen ari bazara, hona hemen garrantzitsuena dena:

  • Xehetasunak berreskuratzea gehiegi egosi gabe
    Eskalatze onak kurruskaria eta egitura gehitzen ditu, ez zarata kurruskaria edo poro faltsuak.

  • Ertzen diziplina
    Lerro garbiek garbi mantentzen dute. Modelo txarrek ertzak dardarka edo haloak sortzen dituzte.

  • Ehundura errealismoa
    Ileak ez luke pintzelkada bihurtu behar. Adreilua ez luke errepikatzen den eredu-zigilu bihurtu behar.

  • Zarata eta konpresioaren kudeaketa
    Eguneroko irudi asko JPEG formatuan hiltzeraino bihurtzen dira. Eskalatzaile on batek ez du kalte hori anplifikatuko ( Benetako ESRGAN ).

  • Aurpegi eta testuaren kontzientzia
    Aurpegiak eta testua dira akatsak antzemateko lekurik errazenak. Modelo onek astiro tratatzen dituzte (edo modu espezializatuak dituzte).

  • Fotograma arteko koherentzia (bideoarentzat)
    Xehetasunak fotogramaz fotograma keinuka badabiltza, zure begiek oihu egingo dute. Bideoaren eskalatzea denbora-egonkortasunaren araberakoa da ( BasicVSR (CVPR 2021) ).

  • Zentzua duten kontrolak
    Benetako emaitzara egokitzen diren graduatzaileak nahi dituzu: zarata kentzea, lausotasuna kentzea, artefaktuen kentzea, pikorren atxikipena, zorroztzea... gauza praktikoak.

Arau lasai bat, baina indarrean dagoena: eskalatze “onena” askotan ia nabaritzen ez duzuna da. Hasieran kamera hobea zenuela dirudi, besterik gabe 📷✨


Konparazio taula: IA eskalatzeko aukera ezagunak (eta zertarako diren onak) 📊🙂

Jarraian, konparazio praktiko bat dago. Prezioak nahita lausoak dira, tresnak lizentziaren, paketeen, kalkulu-kostuen eta gauza dibertigarri horien guztien arabera aldatzen direlako.

Tresna / Ikuspegia Onena honetarako Prezioaren giroa Zergatik funtzionatzen duen (gutxi gorabehera)
Topaz estiloko mahaigaineko eskalatzaileak ( Topaz Photo , Topaz Video ) Argazkiak, bideoa, lan-fluxu erraza Ordainpeko samarra Modelo orokor sendoak + doikuntza asko, "funtzionatzeko" joera dute... gehienetan
Adobe "Super Bereizmena" motako ezaugarriak ( Adobe Hobetu > Super Bereizmena ) Ekosistema horretan dagoeneko dauden argazkilariak Harpidetza-y Xehetasun sendoen berreraikuntza, normalean kontserbadorea (drama gutxiago)
ESRGAN erreala / ESRGAN aldaerak ( ESRGAN erreala , ESRGAN ) Brikolajea, garatzaileak, multzoko lanak Doakoa (baina denbora asko eskatzen duena) Ehundura xehetasunetan bikaina, aurpegietan pikantea izan daiteke kontuz ez bazaude
Difusioan oinarritutako eskalatze moduak ( SR3 ) Sormen lana, emaitza estilizatuak Mistoa Xehetasun ederrak sor ditzake - zentzugabekeriak asmatu ere egin ditzake, beraz... bai
Jokoen eskalatzaileak (DLSS/FSR estilokoak) ( NVIDIA DLSS , AMD FSR 2 ) Denbora errealeko jokoak eta errendatzea Multzokatua Mugimendu datuak eta ikasitako aurretikoak erabiltzen ditu - errendimendu leuna irabazten du 🕹️
Hodeiko eskalatze zerbitzuak Erosotasuna, garaipen azkarrak Erabilera bakoitzeko ordainketa Azkarra + eskalagarria, baina kontrola eta batzuetan sotiltasuna trukatzen dituzu
Bideoetan oinarritutako IA eskalatzaileak ( BasicVSR , Topaz Video ) Antzinako irudiak, animeak, artxiboak Ordainpeko samarra Denbora-trikimailuak keinua murrizteko + bideo-eredu espezializatuak
"Telefono adimendunaren"/galeriaren eskalatzea Erabilera arrunta Barne Emaitza atseginerako egokitutako modelo arinak, ez perfekziorako (oraindik ere erabilgarriak)

Formatuaren bitxikeriaren aitorpena: "Ordaindutako" hitzak lan handia egiten ari da taula horretan. Baina ideia ulertzen duzu 😅


Sekretu handia: modeloek bereizmen baxukotik bereizmen handikorako mapaketa bat ikasten dute 🧠➡️🖼️

IA eskalatze gehienen muinean gainbegiratutako ikaskuntza konfigurazio bat dago ( Irudi Super-Erresoluzioa Sare Konvoluzional Sakonak Erabiliz (SRCNN) ):

  1. Hasi bereizmen handiko irudiekin ("egia")

  2. Txikitu bereizmen baxuko bertsioetara ("sarrera")

  3. Entrenatu eredu bat jatorrizko bereizmen handiko irudia bereizmen txikiko iruditik berreraikitzeko

Denborarekin, ereduak korrelazioak ikasten ditu, hala nola:

  • "Begi inguruko lausotasun mota hau normalean betileei dagokie"

  • "Pixel multzo honek askotan serif testua adierazten du"

  • "Ertz-gradiente honek teilatu-lerro baten itxura du, ez zarata ausazkoa"

Ez da irudi zehatzak buruz ikastea (zentzu sinplean), egitura estatistikoa ikastea baizik ( Irudi Superbereizmenerako Ikaskuntza Sakona: Inkesta bat ). Pentsa ezazu ehunduren eta ertzen gramatika ikastea bezala. Ez poesiaren gramatika, gehiago... IKEAren eskuliburuko gramatika 🪑📦 (metafora traketsa, baina nahiko antzekoa).


Torlojuak eta azkoinak: zer gertatzen da inferentzian zehar (eskala handitzen duzunean) ⚙️✨

Irudi bat AI eskalatzaile batera bidaltzen duzunean, normalean honelako hodi bat egoten da:

  • Aurreprozesamendua

    • Kolore-espazioa bihurtu (batzuetan)

    • Normalizatu pixelen balioak

    • Irudia zatitan teilakatu handia bada (VRAM errealitatearen egiaztapena 😭) ( Real-ESRGAN biltegia (teila aukerak) )

  • Ezaugarrien erauzketa

    • Lehen geruzek ertzak, izkinak eta gradienteak detektatzen dituzte

    • Geruza sakonagoek ereduak detektatzen dituzte: ehundurak, formak, aurpegiko osagaiak

  • Berreraikuntza

    • Modeloak bereizmen handiagoko ezaugarrien mapa sortzen du

    • Ondoren, hori benetako pixel irteera bihurtzen du

  • Postprozesamendua

    • Zorroztze aukerakoa

    • Zarata kentzeko aukera

    • Aukerako artefaktuen ezabapena (txirrin-hotsa, haloak, bloke-egoerak)

Xehetasun sotil bat: tresna askok teilak handitu eta gero josturak nahasten dituzte. Tresna bikainak teilen mugak ezkutatzen dituzte. Tresna bikainek sare-marka ahulak uzten dituzte begiak estutu egiten badituzu. Eta bai, begiak estutu egingo dituzu, gizakiok inperfekzio txikiak % 300eko zoomarekin ikuskatzea maite dugulako, gremlin txikiak bezala 🧌


IA eskalatzeko erabiltzen diren modelo familia nagusiak (eta zergatik diren desberdinak) 🤖📚

1) CNNn oinarritutako super-bereizmena (lanerako zaldi klasikoa)

Sare neuronal konboluzionalak bikainak dira eredu lokaletan: ertzak, ehundurak, egitura txikiak ( Irudi Superbereizmena Sare Konboluzional Sakonak Erabiliz (SRCNN) ).

  • Alde onak: azkarra, egonkorra, sorpresa gutxiago

  • Alde txarrak: gogor estutzen bada, "prozesatu" samarra dirudi

2) GAN oinarritutako eskalatzea (ESRGAN estilokoa) 🎭

GANek (Generative Adversarial Networks) sorgailu bat entrenatzen dute bereizle batek benetakoetatik bereizi ezin ditzakeen bereizmen handiko irudiak sortzeko ( Generative Adversarial Networks ).

  • Alde onak: xehetasun biziak, ehundura ikusgarria

  • Alde txarrak: ez zeuden xehetasunak asmatu ditzake - batzuetan okerrak, batzuetan harrigarriak ( SRGAN , ESRGAN )

GAN batek zorroztasun hori eman diezazuke. Erretratuko subjektuari bekain gehigarri bat ere eman diezaioke. Beraz... aukeratu zure borrokak 😬

3) Difusioan oinarritutako eskalatzea (sormen-komodina) 🌫️➡️🖼️

Difusio-ereduek zarata pausoz pauso kentzen dute eta bereizmen handiko xehetasunak sortzeko gidatu daitezke ( SR3 ).

  • Alde onak: xehetasun sinesgarrietan izugarri ona izan daiteke, batez ere sormenezko lanetarako

  • Alde txarrak: jatorrizko identitate/egituratik urrundu daiteke giro oldarkorra bada ( SR3 )

Hemen hasten da “eskalatzea” “berriro irudikatzea”rekin nahasten. Batzuetan horixe da nahi duzuna. Batzuetan ez.

4) Bideoaren eskalatzea denbora-koherentziarekin 🎞️

Bideoaren eskalatzea sarritan mugimenduaren araberako logika gehitzen du:

  • Xehetasunak egonkortzeko ondoko fotogramak erabiltzen ditu ( BasicVSR (CVPR 2021) )

  • Distira eta arakatzeko artefaktuak saihesten saiatzen da

  • Askotan superbereizmena zarata-kentzearekin eta desgurutzelatzearekin konbinatzen du ( Topaz Video )

Irudien eskala handitzea margolan bat zaharberritzea bezalakoa bada, bideoen eskala handitzea liburu elektroniko bat zaharberritzea bezalakoa da, pertsonaiaren sudurra orrialde bakoitzean forma aldatu gabe. Eta hori... dirudiena baino zailagoa da.


Zergatik dirudien batzuetan IA eskalatzea faltsua (eta nola antzeman) 👀🚩

IA eskalatzea modu ezagunetan huts egiten du. Patroiak ikasten dituzunean, nonahi ikusiko dituzu, auto berri bat erosi eta bat-batean modelo hori kale guztietan ikustea bezala 😵💫

Komunak dio:

  • azala argizariz depilatzea (zarata gehiegi kentzea + leuntzea)

  • Ertzetan gehiegi zorroztutako haloak Interpolazio bikubikoa )

  • Errepikatutako ehundurak (adreiluzko hormak kopiatu-itsatsi eredu bihurtzen dira)

  • "Algoritmoa" oihukatzen duen mikrokontraste kurruskaria

  • Testu-nahasketa, non letrak ia-letra bihurtzen diren (mota txarrena)

  • Xehetasunen desbideratzea, non ezaugarri txikiak sotilki aldatzen diren, batez ere difusio-lan-fluxuetan ( SR3 )

Zati korapilatsua: batzuetan artefaktu hauek “hobeto” ikusten dira begirada batean. Zure garunak zorroztasuna gustuko du. Baina une baten ondoren,… arraroa iruditzen da.

Taktika duin bat zooma urruntzea eta distantzia normalean naturala den ikustea da. % 400eko zoomarekin bakarrik ondo ikusten bada, ez da garaipena, zaletasuna da 😅


Nola funtzionatzen duen IAren igoerak: prestakuntza aldea, matematikako buruhausterik gabe 📉🙂

Superbereizmeneko modeloak entrenatzeak normalean honako hauek dakartza:

Ohiko galera motak:

  • Pixel galera (L1/L2)
    Zehaztasuna sustatzen du. Emaitza apur bat ahulak eman ditzake.

  • Pertzepzio-galerak
    pixel zehatzak baino ezaugarri sakonagoak alderatzen ditu (adibidez, "hau antzekoa Pertzepzio-galerak (Johnson et al., 2016) ).

  • Aurkarien galerak (GAN)
    errealismoa sustatzen du, batzuetan zehaztasun literalaren kaltetan ( SRGAN , Sare Aurkari Generatiboak ).

Sokatira etengabea dago:

  • Jatorrizkoarekiko
    leial izan dadin vs.

  • Egin ezazu bisualki atsegina

Tresna desberdinak espektro horretan leku desberdinetan kokatzen dira. Eta bat nahiago izan dezakezu familiako argazkiak zaharberritzen ari zaren edo poster bat prestatzen ari zaren, non "itxura ona" zehaztasun forentsea baino gehiago axola duen.


Lan-fluxu praktikoak: argazkiak, eskaneatu zaharrak, animeak eta bideoak 📸🧾🎥

Argazkiak (erretratuak, paisaiak, produktuen argazkiak)

Praktika onena normalean hau da:

  • Zarata arina kendu lehenik (beharrezkoa bada)

  • Doikuntza-maila altua ezarpen kontserbadoreekin

  • Gehitu alea berriro gauzak leunak iruditzen bazaizkizu (bai, benetan)

Zerealak gatza bezalakoak dira. Gehiegi jateak afaria hondatzen du, baina bat ere ez da zapore apur bat laua izango 🍟

Eskaneatu zaharrak eta irudi oso konprimituak

Hauek zailagoak dira, ereduak konpresio-blokeak "ehundura" gisa trata ditzakeelako.
Saiatu:

  • Artefaktuak kentzea edo desblokeatzea

  • Ondoren, maila igo

  • Gero zorroztze arina (ez gehiegi... Badakit, denek esaten dute hori, baina hala ere)

Animea eta lerro-artea

Lerro-arteak onura hauek ditu:

  • Ertz garbiak mantentzen dituzten modeloak

  • Ehundura-haluzinazio murriztua
    Animearen eskalatzea askotan itxura bikaina du formak sinpleagoak eta koherenteagoak direlako. (Zortea.)

Bideoa

Bideoak urrats gehigarriak gehitzen ditu:

  • Zarata kendu

  • Desgurutzelarkatzea (iturri batzuetarako)

  • Goi-mailako

  • Denboraren leuntzea edo egonkortzea ( BasicVSR (CVPR 2021) )

  • Kohesiorako aukerako aleen birsartzea

Denbora-koherentzia saltatzen baduzu, xehetasun distiratsu hori lortzen duzu. Behin ohartzen zarenean, ezin duzu ikusi gabe utzi. Gela isil batean kirrinka egiten duen aulki bat bezala 😖


Ezarpenak aukeratzea asmatu gabe (aholku txiki bat) 🎛️😵💫

Hona hemen hasierako pentsamolde duin bat:

  • Aurpegiak plastikozkoak badira
    , murriztu zarata, murriztu zorroztasuna, eta saiatu aurpegia kontserbatzen duen modelo edo modu bat.

  • Ehundurak biziegiak badira,
    jaitsi "xehetasunen hobekuntza" edo "xehetasunen berreskurapena" graduatzaileak, eta gehitu pikor sotila ondoren.

  • Ertzak distira egiten badute
    Jaitsi zorroztasuna, egiaztatu haloa kentzeko aukerak.

  • Irudia gehiegi “AI” dela iruditzen bada,
    kontserbadoreagoa izan. Batzuetan, mugimendurik onena… gutxiago da, besterik gabe.

Gainera: ez handitu 8x eskala, ahal duzulako bakarrik. 2x edo 4x garbi bat izaten da aukerarik onena. Hortik aurrera, modeloari zure pixelei buruzko fanfikzioa idazteko eskatzen ari zara 📖😂


Etika, benetakotasuna eta "egiaren" galdera deserosoa 🧭😬

IAren eskalatzeak lerro bat lausotzen du:

  • Zaharberritzeak bazegoena berreskuratzea esan nahi du

  • Hobekuntzak ez zegoena gehitzea dakar

Argazki pertsonalekin, normalean ondo dago (eta ederra). Kazetaritza, froga legal, irudi mediko edo fideltasunak garrantzia duen edozein gauzarekin... kontuz ibili behar duzu ( OSAC/NIST: Irudi Digitalen Kudeaketa Forentseko Gida Estandarra , SWGDE Irudien Analisi Forentseko Jarraibideak ).

Arau sinple bat:

  • Arrisku handia badago, hartu IAren eskalatzea adibide , ez behin betiko gisa.

Gainera, dibulgazioa garrantzitsua da testuinguru profesionaletan. Ez IA gaiztoa delako, baizik eta publikoak xehetasunak berreraiki edo jaso diren jakin behar duelako. Hori... errespetuzkoa da, besterik gabe.


Amaierako oharrak eta laburpen azkar bat 🧡✅

Beraz, IAren eskalatzea nola funtzionatzen duen hau da: modeloek bereizmen handiko xehetasunak bereizmen baxuko ereduekin nola erlazionatzen diren ikasten dute, eta gero pixel gehigarri sinesgarriak aurreikusten dituzte eskalatzean zehar ( Irudi Superbereizmenerako Ikaskuntza Sakona: Inkesta bat ). Modelo familiaren arabera (CNN, GAN, difusioa, bideo-denborala), iragarpen hori kontserbadorea eta fidela izan daiteke... edo ausarta eta batzuetan desorekatua 😅

Laburpen azkarra

Nahi baduzu, esan iezadazu zer ari zaren handitzen (aurpegiak, argazki zaharrak, bideoak, animeak, testu eskaneatuak), eta "IA itxuraren" ohiko akatsak saihesteko estrategia bat proposatuko dizut 🎯🙂


Maiz egiten diren galderak

AI eskalatzea eta nola funtzionatzen duen

Adimen artifizialaren eskalatzeak (askotan "super-bereizmena" deitzen zaio) irudi baten bereizmena handitzen du entrenamenduan ikasitako ereduetatik bereizmen handiko xehetasun falta iragarriz. Interpolazio bikubikoa bezala pixelak luzatu beharrean, eredu batek ertzak, ehundurak, aurpegiak eta testu-antzeko trazuak aztertzen ditu, eta gero ikasitako eredu horiekin bat datozen pixel datu berriak sortzen ditu. Ez da "errealitatea leheneratzea" baizik eta naturaltasunez irakurtzen den "asmakizun sinesgarri bat egitea".

AI eskalatzea tamaina bikubiko edo tradizionalaren aldean

Eskalatze-metodo tradizionalek (bikuboa bezala) batez ere pixel daudenen artean interpolatzen dute, trantsizioak leunduz xehetasun berririk sortu gabe. IA eskalatzeak egitura sinesgarria berreraikitzea du helburu, seinale bisualak ezagutuz eta seinale horien bereizmen handiko bertsioek nolako itxura izango duten iragarriz. Horregatik, IA emaitzak askoz zorrotzagoak izan daitezke, eta baita ere horregatik sar ditzakete artefaktuak edo iturrian ez zeuden xehetasunak "asmatu".

Zergatik aurpegiak argizarizkoak edo gehiegi leunak izan daitezkeen

Argizari koloreko aurpegiak normalean zarata kentzeko eta leuntzeko prozesu oldarkorraren ondorioz sortzen dira, eta horrek azalaren ehundura naturala kentzen du zorroztearekin batera. Tresna askok zarata eta ehundura fina modu berean tratatzen dituzte, beraz, irudi bat "garbitzeak" poroak eta xehetasun sotilak ezaba ditzake. Ikuspegi ohikoa zarata kentzeko eta zorrozteko prozesua murriztea da, aurpegia zaintzeko modu bat erabiltzea eskuragarri badago, eta gero ale ukitu bat berriro sartzea, emaitza plastiko gutxiago eta fotografikoagoa izan dadin.

Kontuan hartu beharreko ohiko IA eskalatze-artefaktuak

Ohiko seinaleen artean daude ertzetan haloak, errepikatutako ehundura-ereduak (kopiatu-itsatsi adreiluak bezala), mikrokontraste kurruskaria eta "ia letrak" bihurtzen den testua. Difusioan oinarritutako lan-fluxuetan, xehetasunen desbideratzea ere ikus daiteke, non ezaugarri txikiak sotilki aldatzen diren. Bideoan, keinua eta fotograma arteko xehetasunen arakatzea seinale gorri handiak dira. Zoom muturrean bakarrik ikusten bada ondo, ezarpenak ziurrenik oldarkorregiak dira.

Nola GAN, CNN eta difusio-maila handitzaileek emaitzetan duten desberdintasun joera

CNNn oinarritutako superbereizmena egonkorragoa eta aurreikusgarriagoa izan ohi da, baina gogor sakatzen bada "prozesatua" dirudi. GANn oinarritutako aukerekin (ESRGAN estilokoak) ehundura indartsuagoa eta zorroztasun handiagoa hautematen da askotan, baina xehetasun okerrak haluzinatu ditzakete, batez ere aurpegietan. Difusioan oinarritutako eskalatzeak xehetasun ederrak eta sinesgarriak sor ditzake, baina jatorrizko egituratik alden daiteke gidaritza edo indar ezarpenak oso indartsuak badira.

"IA gehiegi" itxura saihesteko ezarpen estrategia praktiko bat

Hasi kontserbadorea: handitu 2× edo 4× faktore muturrekoetara joan aurretik. Aurpegiak plastikozkoak badira, murriztu zarata eta zorroztasuna eta probatu aurpegiaren araberako modu bat. Ehundurak biziegiak badira, murriztu xehetasunen hobekuntza eta kontuan hartu ondoren pikor sotila gehitzea. Ertzak distira egiten badute, murriztu zorroztasuna eta egiaztatu halo edo artefaktuen ezabapena. Hainbat prozesutan, "gutxiago" izateak irabazten du, sinesgarritasuna mantentzen duelako errealismoa.

Eskaneatu aurretik eskaneatu zaharrak edo JPEG konprimitutako irudiak kudeatzea

Irudi konprimituak zailak dira, modeloek bloke-artefaktuak benetako ehunduratzat hartu eta anplifikatu ditzaketelako. Lan-fluxu ohikoa lehenik artefaktuak kentzea edo blokeatzea da, gero eskalatzea handitzea eta, ondoren, behar izanez gero, zorroztasun arina handitzea. Eskaneatzeetarako, garbiketa leunak modeloari kalteen ordez benetako egituran zentratzen lagun diezaioke. Helburua "ehundura faltsuen zantzuak" murriztea da, eskalatzailea sarrera zaratatsuetatik asmakizun fidagarriak egitera behartuta ez egoteko.

Zergatik den bideoen eskalatzea argazkien eskalatzea baino zailagoa

Bideoaren eskalatzea koherentea izan behar da fotograma guztietan, ez bakarrik irudi finko batean ona. Xehetasunak fotogramaz fotograma keinuka badaude, emaitza azkar bihurtzen da arreta galarazten duena. Bideoan oinarritutako ikuspegiek ondoko fotogrametako denbora-informazioa erabiltzen dute berreraikuntza egonkortzeko eta distira-artefaktuak saihesteko. Lan-fluxu askok zarata kentzea, iturri jakin batzuetarako desgurutzelarkatzea eta aukerako pikor-berreskuratzea ere barne hartzen dituzte, sekuentzia osoa artifizialki zorrotza izan beharrean kohesionatua senti dadin.

IAren eskalatzea egokia ez denean edo arriskutsua denean fidatzea

Adimen artifizialaren eskalatzea hobe da hobekuntza gisa hartzea, ez froga gisa. Kazetaritzan, froga juridikoetan, irudi medikoetan edo auzitegi-lanetan bezalako testuinguru garrantzitsuetan, "sinesgarriak" diren pixelak sortzeak engainagarria izan daiteke, jaso ez diren xehetasunak gehi ditzakeelako. Seguruago markoa ilustrazio gisa erabiltzea da eta IA prozesu batek xehetasunak berreraiki dituela agerian uztea. Fideltasuna funtsezkoa bada, gorde jatorrizkoak eta dokumentatu prozesatzeko urrats eta ezarpen guztiak.

Erreferentziak

  1. arXiv - Irudien Superbereizmenerako Ikaskuntza Sakona: Inkesta bat - arxiv.org

  2. arXiv - Irudi Superbereizmena Sare Konboluzional Sakonak Erabiliz (SRCNN) - arxiv.org

  3. arXiv - Benetako ESRGAN - arxiv.org

  4. arXiv - ESRGAN - arxiv.org

  5. arXiv - SR3 - arxiv.org

  6. NVIDIA Garatzailea - NVIDIA DLSS - developer.nvidia.com

  7. AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com

  8. Computer Vision Foundation (CVF) Sarbide Irekia - BasicVSR: Bideo Superbereizmenean Osagai Esentzialen Bilaketa (CVPR 2021) - openaccess.thecvf.com

  9. arXiv - Sare Aurkari Generatiboak - arxiv.org

  10. arXiv - SRGAN - arxiv.org

  11. arXiv - Pertzepzio-galerak (Johnson et al., 2016) - arxiv.org

  12. GitHub - Real-ESRGAN biltegia (teila aukerak) - github.com

  13. Wikipedia - Interpolazio bikubikoa - wikipedia.org

  14. Topaz Labs - Topaz Argazkia - topazlabs.com

  15. Topaz Labs - Topaz Bideoa - topazlabs.com

  16. Adobe Laguntza Zentroa - Adobe Enhance > Super Bereizmena - helpx.adobe.com

  17. NIST / OSAC - Irudi Digitalen Kudeaketa Forentserako Gida Estandarra (1.0 bertsioa) - nist.gov

  18. SWGDE - Irudien analisi forentserako jarraibideak - swgde.org

Aurkitu azken IA AI Laguntzaileen Denda Ofizialean

Guri buruz

Blogera itzuli