Sut mae uwchraddio AI yn gweithio

Sut mae Uwchraddio AI yn gweithio?

Yr ateb byr: Mae uwchraddio AI yn gweithio trwy hyfforddi model ar ddelweddau cydraniad isel ac uchel wedi'u paru, yna ei ddefnyddio i ragweld picseli ychwanegol credadwy yn ystod yr uwchraddio. Os yw'r model wedi gweld gweadau neu wynebau tebyg yn yr hyfforddiant, gall ychwanegu manylion argyhoeddiadol; os na, gall "rhithweledu" arteffactau fel halos, croen cwyraidd, neu fflachio mewn fideo.

Prif bethau i'w cymryd:

Rhagfynegiad : Mae'r model yn cynhyrchu manylion credadwy, nid ail-greu gwarantedig o realiti.

Dewis model : Mae CNNs yn tueddu i fod yn fwy sefydlog; gall GANs edrych yn fwy craff ond mae risg y byddant yn dyfeisio nodweddion.

Gwiriadau arteffactau : Chwiliwch am halos, gweadau ailadroddus, “llythrennau bron”, ac wynebau plastig.

Sefydlogrwydd fideo : Defnyddiwch ddulliau amserol neu fe welwch chi ddisgleirdeb a drifft o ffrâm i ffrâm.

Defnydd risg uchel : Os yw cywirdeb yn bwysig, datgelwch y prosesu a thrinwch y canlyniadau fel rhai darluniadol.

Sut mae uwchraddio AI yn gweithio? Graffeg gwybodaeth.

Mae'n debyg eich bod chi wedi'i weld: mae delwedd fach, grimp yn troi'n rhywbeth digon clir i'w argraffu, ei ffrydio, neu ei ollwng i gyflwyniad heb wingo. Mae'n teimlo fel twyllo. Ac - yn y ffordd orau - mae'n debyg 😅

Felly, Sut mae Uwchraddio AI yn gweithio yn dibynnu ar rywbeth mwy penodol na “mae'r cyfrifiadur yn gwella manylion” (tonnog â llaw) ac yn agosach at “mae model yn rhagweld strwythur cydraniad uchel credadwy yn seiliedig ar batrymau a ddysgodd o lawer o enghreifftiau” ( Dysgu Dwfn ar gyfer Uwch-ddatrysiad Delweddau: Arolwg ). Y cam rhagfynegi hwnnw yw'r gêm gyfan - a dyna pam y gall uwchraddio AI edrych yn syfrdanol… neu ychydig yn blastig… neu fel pe bai eich cath wedi tyfu mwstas bonws.

Erthyglau y gallech fod eisiau eu darllen ar ôl yr un hon:

🔗 Sut mae AI yn gweithio
Dysgwch hanfodion modelau, data, a chasgliadau mewn AI.

🔗 Sut mae AI yn dysgu
Gweler sut mae data hyfforddi ac adborth yn gwella perfformiad model dros amser.

🔗 Sut mae AI yn canfod anomaleddau
Deall llinellau sylfaen patrymau a sut mae AI yn nodi ymddygiad anarferol yn gyflym.

🔗 Sut mae AI yn rhagweld tueddiadau
Archwiliwch ddulliau rhagweld sy'n adnabod signalau ac yn rhagweld galw yn y dyfodol.


Sut mae Uwchraddio AI yn gweithio: y syniad craidd, mewn geiriau bob dydd 🧩

Mae uwchraddio yn golygu cynyddu'r datrysiad: mwy o bicseli, delwedd fwy. Mae uwchraddio traddodiadol (fel biciwbig) yn ymestyn picseli ac yn llyfnhau trawsnewidiadau ( rhyngosodiad biciwbig ). Mae'n iawn, ond ni all ddyfeisio newydd - mae'n rhyngosod yn unig.

Mae uwchraddio AI yn rhoi cynnig ar rywbeth mwy beiddgar (aka “uwch-ddatrysiad” yn y byd ymchwil) ( Dysgu Dwfn ar gyfer Uwch-ddatrysiad Delweddau: Arolwg ):

  • Mae'n edrych ar y mewnbwn cydraniad isel

  • Yn adnabod patrymau (ymylon, gweadau, nodweddion wyneb, strôcs testun, gwehyddu ffabrig…)

  • olwg ddylai fersiwn cydraniad uwch

  • Yn cynhyrchu data picsel ychwanegol sy'n cyd-fynd â'r patrymau hynny

Nid “adfer realiti’n berffaith,” yn fwy fel “gwneud dyfaliad hynod gredadwy” ( Datrysiad Uwch Delwedd Gan Ddefnyddio Rhwydweithiau Cyfryngol Dwfn (SRCNN) ). Os yw hynny’n swnio ychydig yn amheus, dydych chi ddim yn anghywir - ond dyna hefyd pam ei fod yn gweithio mor dda 😄

Ac ie, mae hyn yn golygu bod uwchraddio AI yn rhithweledigaeth dan reolaeth yn y bôn… ond mewn ffordd gynhyrchiol, sy'n parchu picseli.


Beth sy'n gwneud fersiwn dda o uwchraddio AI? ✅🛠️

Os ydych chi'n beirniadu uwchraddiwr AI (neu osodiad rhagosodedig), dyma beth sy'n tueddu i fod bwysicaf:

  • Adfer manylion heb orgoginio
    Mae uwchraddio da yn ychwanegu crispness a strwythur, nid sŵn crensiog na mandyllau ffug.

  • Disgyblaeth ymyl
    Mae llinellau glân yn aros yn lân. Mae modelau gwael yn gwneud i ymylon siglo neu egin halos.

  • Realaeth gwead
    Ni ddylai gwallt ddod yn strôc brwsh paent. Ni ddylai brics ddod yn stamp patrwm ailadroddus.

  • Trin sŵn a chywasgu
    Mae llawer o ddelweddau bob dydd yn cael eu JPEGio i farwolaeth. Nid yw uwchraddiwr da yn chwyddo'r difrod hwnnw ( Real-ESRGAN ).

  • Ymwybyddiaeth o wynebau a thestun
    Wynebau a thestun yw'r lleoedd hawsaf i weld camgymeriadau. Mae modelau da yn eu trin yn ysgafn (neu mae ganddyn nhw ddulliau arbenigol).

  • Cysondeb ar draws fframiau (ar gyfer fideo)
    Os yw manylion yn fflachio o ffrâm i ffrâm, bydd eich llygaid yn sgrechian. Mae uwchraddio fideo yn byw neu'n marw yn ôl sefydlogrwydd amserol ( BasicVSR (CVPR 2021) ).

  • Rheolyddion sy'n gwneud synnwyr
    Rydych chi eisiau llithryddion sy'n mapio i ganlyniadau go iawn: dad-sŵn, dad-aneglurder, tynnu arteffactau, cadw grawn, hogi… y pethau ymarferol.

Rheol dawel sy'n dal i fyny: yr uwchraddio "gorau" yn aml yw'r un rydych chi prin yn sylwi arno. Mae'n edrych fel petaech chi wedi cael camera gwell i ddechrau 📷✨


Tabl Cymharu: opsiynau uwchraddio AI poblogaidd (a'r hyn maen nhw'n dda ar ei gyfer) 📊🙂

Isod mae cymhariaeth ymarferol. Mae prisiau'n aneglur yn fwriadol oherwydd bod offer yn amrywio yn ôl trwydded, bwndeli, costau cyfrifiadurol, a'r holl bethau hwyl hynny.

Offeryn / Dull Gorau ar gyfer Awyrgylch pris Pam mae'n gweithio (yn fras)
Uwchraddwyr bwrdd gwaith arddull Topaz ( Topaz Photo , Topaz Video ) Lluniau, fideo, llif gwaith hawdd Taledig iawn Modelau cyffredinol cryf + llawer o diwnio, yn tueddu i “weithio”… gan mwyaf
Nodweddion math “Super Resolution” Adobe ( Adobe Enhance > Super Resolution ) Ffotograffwyr sydd eisoes yn yr ecosystem honno Tanysgrifiad-y Ail-greu manylion cadarn, fel arfer yn geidwadol (llai o ddrama)
Amrywiadau ESRGAN Go Iawn / ESRGAN ( ESRGAN Go Iawn , ESRGAN ) DIY, datblygwyr, swyddi swp Am ddim (ond yn gostus o ran amser) Gwych am fanylion gwead, gall fod yn sbeislyd ar wynebau os nad ydych chi'n ofalus
Moddau uwchraddio seiliedig ar drylediad ( SR3 ) Gwaith creadigol, canlyniadau steilus Cymysg Gall greu manylion hyfryd - gall hefyd ddyfeisio nonsens, felly… ie
Uwchraddwyr gemau (arddull DLSS/FSR) ( NVIDIA DLSS , AMD FSR 2 ) Hapchwarae a rendro amser real Wedi'i fwndelu Yn defnyddio data symudiad a rhagolygon a ddysgwyd - perfformiad llyfn yn ennill 🕹️
Gwasanaethau uwchraddio cwmwl Cyfleustra, enillion cyflym Talu fesul defnydd Cyflym + graddadwy, ond rydych chi'n masnachu rheolaeth ac weithiau cynildeb
Uwchraddwyr AI sy'n canolbwyntio ar fideo ( BasicVSR , Topaz Video ) Hen luniau, anime, archifau Taledig iawn Triciau amserol i leihau fflachio + modelau fideo arbenigol
Uwchraddio ffôn/oriel “clyfar” Defnydd achlysurol Wedi'i gynnwys Modelau ysgafn wedi'u tiwnio ar gyfer allbwn dymunol, nid perffeithrwydd (yn dal yn ddefnyddiol)

Cyffes rhyfedd fformatio: Mae “Paid-ish” yn gwneud llawer o waith yn y tabl yna. Ond rydych chi'n cael y syniad 😅


Y gyfrinach fawr: mae modelau'n dysgu mapio o gydraniad isel i gydraniad uchel 🧠➡️🖼️

Wrth wraidd y rhan fwyaf o uwchraddio AI mae gosodiad dysgu dan oruchwyliaeth ( Datrysiad Uwch Delweddau Gan Ddefnyddio Rhwydweithiau Cyfryngol Dwfn (SRCNN) ):

  1. Dechreuwch gyda delweddau cydraniad uchel (y "gwirionedd")

  2. Lleihau'r samplu i fersiynau cydraniad isel (y "mewnbwn")

  3. Hyfforddi model i ail-greu'r cydraniad uchel gwreiddiol o'r cydraniad isel

Dros amser, mae'r model yn dysgu cydberthnasau fel:

  • “Mae’r math yma o aneglurder o amgylch llygad fel arfer yn perthyn i amrannau”

  • “Mae’r clwstwr picsel hwn yn aml yn dynodi testun serif”

  • “Mae’r graddiant ymyl hwn yn edrych fel llinell ar do, nid sŵn ar hap”

Nid cofio delweddau penodol ydyw (yn yr ystyr syml), ond dysgu strwythur ystadegol ( Dysgu Dwfn ar gyfer Uwch-ddatrysiad Delweddau: Arolwg ). Meddyliwch amdano fel dysgu gramadeg gweadau ac ymylon. Nid gramadeg barddoniaeth, yn fwy fel… gramadeg â llaw IKEA 🪑📦 (trosiad lletchwith, ond yn ddigon agos).


Y manylion: beth sy'n digwydd yn ystod casgliad (pan fyddwch chi'n uwchraddio) ⚙️✨

Pan fyddwch chi'n bwydo delwedd i mewn i uwchraddiwr AI, fel arfer mae piblinell fel hon:

  • Rhagbrosesu

  • Echdynnu nodweddion

    • Mae haenau cynnar yn canfod ymylon, corneli, graddiannau

    • Mae haenau dyfnach yn canfod patrymau: gweadau, siapiau, cydrannau wyneb

  • Ailadeiladu

    • Mae'r model yn cynhyrchu map nodweddion cydraniad uwch

    • Yna'n trosi hynny'n allbwn picsel gwirioneddol

  • Ôl-brosesu

    • Hogi dewisol

    • Dad-sŵn dewisol

    • Atal arteffactau dewisol (canu, halos, blocio)

Un manylyn cynnil: mae llawer o offer yn uwchraddio teils, yna'n cyfuno gwythiennau. Mae offer gwych yn cuddio ffiniau teils. Mae offer gwych yn gadael marciau grid gwan os byddwch chi'n llygadrythu. Ac ie, byddwch chi'n llygadrythu, oherwydd mae bodau dynol wrth eu bodd yn archwilio amherffeithrwydd bach ar chwyddo 300% fel gremlins bach 🧌


Y prif deuluoedd model a ddefnyddir ar gyfer uwchraddio AI (a pham maen nhw'n teimlo'n wahanol) 🤖📚

1) Uwch-ddatrysiad wedi'i seilio ar CNN (y ceffyl gwaith clasurol)

Mae rhwydweithiau niwral cyfryngol yn wych ar gyfer patrymau lleol: ymylon, gweadau, strwythurau bach ( Datrysiad Uwch Delweddau Gan Ddefnyddio Rhwydweithiau Cyfryngol Dwfn (SRCNN) ).

  • Manteision: cyflym iawn, sefydlog, llai o syrpreisys

  • Anfanteision: gall edrych braidd yn "brosesedig" os caiff ei wthio'n galed

2) Uwchraddio seiliedig ar GAN (arddull ESRGAN) 🎭

Mae GANs (Rhwydweithiau Gwrthwynebol Cynhyrchiol) yn hyfforddi generadur i gynhyrchu delweddau cydraniad uchel na all gwahaniaethwr eu gwahaniaethu oddi wrth rai go iawn ( Rhwydweithiau Gwrthwynebol Cynhyrchiol ).

  • Manteision: manylion cryf, gwead trawiadol

  • Anfanteision: gall ddyfeisio manylion nad oedd yno - weithiau'n anghywir, weithiau'n rhyfedd ( SRGAN , ESRGAN )

Gall GAN ​​roi'r craffter sy'n haeddu anadl i chi. Gall hefyd roi ael ychwanegol i bwnc eich portread. Felly… dewiswch eich brwydrau 😬

3) Uwchraddio ar sail trylediad (y cerdyn gwyllt creadigol) 🌫️➡️🖼️

Mae modelau trylediad yn dadsŵn gam wrth gam a gellir eu harwain i gynhyrchu manylion cydraniad uchel ( SR3 ).

  • Manteision: gall fod yn wallgof o dda am fanylion credadwy, yn enwedig ar gyfer gwaith creadigol

  • Anfanteision: gall symud i ffwrdd o'r hunaniaeth/strwythur gwreiddiol os yw'r gosodiadau'n ymosodol ( SR3 )

Dyma lle mae “uwchraddio” yn dechrau cymysgu i “ailddychmygu”. Weithiau dyna’n union yr hyn rydych chi ei eisiau. Weithiau nid yw.

4) Uwchraddio fideo gyda chysondeb amserol 🎞️

Mae uwchraddio fideo yn aml yn ychwanegu rhesymeg sy'n ymwybodol o symudiad:

  • Yn defnyddio fframiau cyfagos i sefydlogi manylion ( BasicVSR (CVPR 2021) )

  • Yn ceisio osgoi fflachio ac arteffactau sy'n cropian

  • Yn aml yn cyfuno uwch-ddatrysiad â dad-sŵn a dad-rhyngblethu ( Fideo Topaz )

Os yw uwchraddio delweddau fel adfer un paentiad, mae uwchraddio fideo fel adfer llyfr troi heb newid siâp trwyn y cymeriad bob tudalen. Sydd… yn anoddach nag y mae'n swnio.


Pam mae uwchraddio AI weithiau'n edrych yn ffug (a sut i'w weld) 👀🚩

Mae uwchraddio AI yn methu mewn ffyrdd adnabyddadwy. Unwaith y byddwch chi'n dysgu'r patrymau, fe welwch chi nhw ym mhobman, fel prynu car newydd a sylwi'n sydyn ar y model hwnnw ar bob stryd 😵💫

Dywed cyffredin:

  • Croen cwyro ar wynebau (gormod o ddad-sŵn + llyfnhau)

  • Halos wedi'u gor-fynio o amgylch ymylon (tiriogaeth "gor-saethu" glasurol) ( rhyngosodiad deiciwbig )

  • Gweadau ailadroddus (waliau brics yn dod yn batrymau copïo-gludo)

  • Micro-gyferbyniad crensiog sy'n gweiddi "algorithm"

  • Manteisio testun lle mae llythrennau'n dod yn bron yn llythrennau (y math gwaethaf)

  • Drifft manylion lle mae nodweddion bach yn newid yn gynnil, yn enwedig mewn llifau gwaith gwasgariad ( SR3 )

Y rhan anodd: weithiau mae'r arteffactau hyn yn edrych yn "well" ar yr olwg gyntaf. Mae eich ymennydd yn hoffi miniogrwydd. Ond ar ôl eiliad, mae'n teimlo'n... od.

Tacteg dda yw chwyddo allan a gwirio a yw'n edrych yn naturiol ar bellter gwylio arferol. Os mai dim ond ar chwyddo 400% y mae'n edrych yn dda, nid yw hynny'n fuddugoliaeth, mae'n hobi 😅


Sut mae Uwchraddio AI yn gweithio: yr ochr hyfforddi, heb y cur pen mathemateg 📉🙂

Mae hyfforddi modelau uwch-ddatrysiad fel arfer yn cynnwys:

Mathau nodweddiadol o golledion:

Mae yna frwydr dynnu gyson:

  • Gwnewch hi'n ffyddlon i'r gwreiddiol
    vs.

  • Gwnewch hi'n bleserus yn weledol

Mae gwahanol offer yn glanio mewn gwahanol leoedd ar y sbectrwm hwnnw. Ac efallai y byddwch chi'n well ganddo un yn dibynnu a ydych chi'n adfer lluniau teulu neu'n paratoi poster lle mae "edrych yn dda" yn bwysicach na chywirdeb fforensig.


Llifau gwaith ymarferol: lluniau, sganiau hen, anime, a fideo 📸🧾🎥

Lluniau (portreadau, tirweddau, lluniau cynnyrch)

Yr arfer gorau fel arfer yw:

  • Dad-sŵn ysgafn yn gyntaf (os oes angen)

  • Uchel eu safon gyda gosodiadau ceidwadol

  • Ychwanegwch grawn yn ôl os yw pethau'n teimlo'n rhy llyfn (ydw, wir)

Mae grawn fel halen. Mae gormod yn difetha cinio, ond ni all dim o gwbl flasu ychydig yn fflat 🍟

Sganiau hen a delweddau wedi'u cywasgu'n drwm

Mae'r rhain yn anoddach oherwydd gallai'r model drin blociau cywasgu fel "gwead".
Rhowch gynnig ar:

  • Tynnu neu ddadflocio arteffactau

  • Yna uwchraddio

  • Yna hogi'n ysgafn (dim gormod… mi wn, mae pawb yn dweud hynny, ond serch hynny)

Anime a chelf llinell

Mae celf llinell yn elwa o:

  • Modelau sy'n cadw ymylon glân

  • Rhithweledigaeth gwead llai Mae
    uwchraddio anime yn aml yn edrych yn wych oherwydd bod y siapiau'n symlach ac yn gyson. (Lwcus.)

Fideo

Mae'r fideo yn ychwanegu camau ychwanegol:

  • Dadsŵn

  • Dad-blethu (ar gyfer rhai ffynonellau)

  • Uchelgeisiol

  • Llyfnhau neu sefydlogi amserol ( BasicVSR (CVPR 2021) )

  • Ailgyflwyno grawn dewisol ar gyfer cydlyniant

Os byddwch chi'n hepgor cysondeb amserol, byddwch chi'n cael y manylion disglair hynny'n fflachio. Unwaith i chi sylwi arno, ni allwch ei ddad-weld. Fel cadair gwichian mewn ystafell dawel 😖


Dewis gosodiadau heb ddyfalu'n wyllt (taflen dwyllo fach) 🎛️😵💫

Dyma feddylfryd cychwynnol da:

  • Os yw wynebau'n edrych yn blastig,
    lleihewch y sŵn, lleihewch y miniogrwydd, rhowch gynnig ar fodel neu fodd sy'n cadw wynebau.

  • Os yw gweadau'n edrych yn rhy ddwys,
    gostwngwch y llithryddion “gwella manylion” neu “adfer manylion”, ychwanegwch raen cynnil ar ôl.

  • Os yw'r ymylon yn tywynnu
    Trowch i lawr y miniogi, gwiriwch yr opsiynau atal halo.

  • Os yw'r ddelwedd yn edrych yn rhy “AI”
    Ewch yn fwy ceidwadol. Weithiau'r symudiad gorau yw… llai.

Hefyd: peidiwch â'i uwchraddio 8x dim ond oherwydd eich bod chi'n gallu. 2x neu 4x glân yw'r man perffaith yn aml. Heblaw hynny, rydych chi'n gofyn i'r model ysgrifennu ffuglen gefnogwyr am eich picseli 📖😂


Moeseg, dilysrwydd, a'r cwestiwn lletchwith o "wirionedd" 🧭😬

Mae uwchraddio AI yn aneglur llinell:

  • Mae adferiad yn golygu adfer yr hyn a oedd yno

  • Mae gwella yn awgrymu ychwanegu'r hyn nad oedd

Gyda lluniau personol, mae fel arfer yn iawn (ac yn hyfryd). Gyda newyddiaduraeth, tystiolaeth gyfreithiol, delweddu meddygol, neu unrhyw beth lle mae ffyddlondeb yn bwysig… mae angen i chi fod yn ofalus ( OSAC/NIST: Canllaw Safonol ar gyfer Rheoli Delweddau Digidol Fforensig , Canllawiau SWGDE ar gyfer Dadansoddi Delweddau Fforensig ).

Rheol syml:

  • Os yw'r risgiau'n uchel, ystyriwch uwchraddio AI fel rhywbeth darluniadol , nid fel rhywbeth pendant.

Hefyd, mae datgeliad yn bwysig mewn cyd-destunau proffesiynol. Nid oherwydd bod deallusrwydd artiffisial yn ddrwg, ond oherwydd bod cynulleidfaoedd yn haeddu gwybod a gafodd manylion eu hail-greu neu eu cipio. Mae hynny'n... barchus.


Nodiadau cloi a chrynodeb byr 🧡✅

Felly, sut mae Uwchraddio AI yn gweithio : mae modelau'n dysgu sut mae manylion cydraniad uchel yn tueddu i gysylltu â phatrymau cydraniad isel, yna'n rhagweld picseli ychwanegol credadwy yn ystod uwchraddio ( Dysgu Dwfn ar gyfer Uwch-ddatrysiad Delwedd: Arolwg ). Yn dibynnu ar y teulu modelau (CNN, GAN, trylediad, fideo-amserol), gall y rhagfynegiad hwnnw fod yn geidwadol ac yn ffyddlon ... neu'n feiddgar ac weithiau'n ansicr 😅

Crynodeb cyflym

Os ydych chi eisiau, dywedwch wrthyf beth rydych chi'n ei uwchraddio (wynebau, hen luniau, fideo, anime, sganiau testun), a byddaf yn awgrymu strategaeth gosodiadau sy'n tueddu i osgoi'r peryglon cyffredin "edrych AI" 🎯🙂


Cwestiynau Cyffredin

Uwchraddio AI a sut mae'n gweithio

Mae uwchraddio AI (a elwir yn aml yn "uwch-ddatrysiad") yn cynyddu datrysiad delwedd trwy ragweld manylion cydraniad uchel sydd ar goll o batrymau a ddysgwyd yn ystod hyfforddiant. Yn lle ymestyn picseli yn unig fel rhyngosodiad deu-giwbig, mae model yn astudio ymylon, gweadau, wynebau, a strôcs tebyg i destun, yna'n cynhyrchu data picsel newydd sy'n cyd-fynd â'r patrymau a ddysgwyd hynny. Mae'n llai o "adfer realiti" a mwy o "wneud dyfaliad credadwy" sy'n darllen fel rhywbeth naturiol.

Uwchraddio AI yn erbyn newid maint deucubig neu draddodiadol

Mae dulliau uwchraddio traddodiadol (fel biciwbig) yn rhyngosod yn bennaf rhwng picseli presennol, gan lyfnhau trawsnewidiadau heb greu manylion newydd go iawn. Nod uwchraddio AI yw ail-greu strwythur credadwy trwy adnabod ciwiau gweledol a rhagweld sut olwg sydd ar fersiynau cydraniad uchel o'r ciwiau hynny. Dyna pam y gall canlyniadau AI deimlo'n llawer mwy miniog, a hefyd pam y gallant gyflwyno arteffactau neu "ddyfeisio" manylion nad oeddent yn bresennol yn y ffynhonnell.

Pam y gall wynebau edrych yn gwyraidd neu'n rhy llyfn

Mae wynebau cwyraidd fel arfer yn deillio o ddad-sŵn a llyfnhau ymosodol ynghyd â hogi sy'n tynnu gwead naturiol y croen i ffwrdd. Mae llawer o offer yn trin sŵn a gwead mân yn yr un modd, felly gall "glanhau" delwedd ddileu mandyllau a manylion cynnil. Dull cyffredin yw lleihau dad-sŵn a hogi, defnyddio modd cadw wynebau os yw ar gael, yna ailgyflwyno ychydig o raen fel bod y canlyniad yn teimlo'n llai plastig ac yn fwy ffotograffig.

Arteffactau uwchraddio AI cyffredin i gadw llygad amdanynt

Mae arwyddion nodweddiadol yn cynnwys halos o amgylch ymylon, patrymau gwead ailadroddus (fel briciau copïo-gludo), micro-gyferbyniad crensiog, a thestun sy'n troi'n "lythrennau bron". Mewn llifau gwaith sy'n seiliedig ar drylediad, gallwch hefyd weld manylion yn symud yn gyflym lle mae nodweddion bach yn newid yn gynnil. Ar gyfer fideo, mae manylion yn fflachio ac yn cropian ar draws fframiau yn faneri coch mawr. Os yw'n edrych yn dda ar chwyddo eithafol yn unig, mae'n debyg bod y gosodiadau'n rhy ymosodol.

Sut mae uwchraddwyr GAN, CNN, ac uwchsafwyr trylediad yn tueddu i fod yn wahanol o ran canlyniadau

Mae uwch-ddatrysiad sy'n seiliedig ar CNN yn tueddu i fod yn fwy cyson a rhagweladwy, ond gall edrych yn "brosesedig" os caiff ei wthio'n galed. Yn aml, mae opsiynau sy'n seiliedig ar GAN (arddull ESRGAN) yn cynhyrchu gwead mwy grymus a miniogrwydd canfyddedig, ond gallant greu rhithweledigaeth o fanylion anghywir, yn enwedig ar wynebau. Gall uwchraddio sy'n seiliedig ar drylediad gynhyrchu manylion hardd a chredadwy, ond gall wyro o'r strwythur gwreiddiol os yw'r gosodiadau canllaw neu gryfder yn rhy gryf.

Strategaeth gosodiadau ymarferol ar gyfer osgoi golwg "rhy AI"

Dechreuwch yn geidwadol: uwchraddiwch 2× neu 4× cyn cyrraedd at ffactorau eithafol. Os yw wynebau'n edrych yn blastig, diddymwch y dadsŵn a'r hogi a rhowch gynnig ar ddull sy'n ymwybodol o wynebau. Os yw gweadau'n mynd yn rhy ddwys, gostwngwch y gwelliant manylion ac ystyriwch ychwanegu graen cynnil wedyn. Os yw ymylon yn tywynnu, lleihau'r hogi a gwirio atal halo neu arteffactau. Mewn llawer o biblinellau, mae "llai" yn ennill oherwydd ei fod yn cadw realaeth gredadwy.

Trin sganiau hen neu ddelweddau wedi'u cywasgu'n drwm o ran JPEG cyn eu huwchraddio

Mae delweddau cywasgedig yn anodd oherwydd gall modelau drin arteffactau bloc fel gwead go iawn a'u mwyhau. Llif gwaith cyffredin yw tynnu neu ddadflocio arteffactau yn gyntaf, yna uwchraddio, yna hogi'n ysgafn dim ond os oes angen. Ar gyfer sganiau, gall glanhau ysgafn helpu'r model i ganolbwyntio ar y strwythur gwirioneddol yn hytrach na difrod. Y nod yw lleihau "ciwiau gwead ffug" fel nad yw'r un sy'n uwchraddio yn cael ei orfodi i wneud dyfaliadau hyderus o fewnbynnau swnllyd.

Pam mae uwchraddio fideo yn anoddach na uwchraddio lluniau

Rhaid i uwchraddio fideo fod yn gyson ar draws fframiau, nid dim ond yn dda ar un ddelwedd llonydd. Os yw manylion yn fflachio o ffrâm i ffrâm, mae'r canlyniad yn dod yn tynnu sylw'n gyflym. Mae dulliau sy'n canolbwyntio ar fideo yn defnyddio gwybodaeth amserol o fframiau cyfagos i sefydlogi ail-greu ac osgoi arteffactau disglair. Mae llawer o lifau gwaith hefyd yn cynnwys dad-sŵn, dad-blethu ar gyfer rhai ffynonellau, ac ailgyflwyno grawn dewisol fel bod y dilyniant cyfan yn teimlo'n gydlynol yn hytrach nag yn artiffisial o finiog.

Pan nad yw uwchraddio AI yn briodol neu pan fo'n beryglus dibynnu arno

Mae'n well trin uwchraddio AI fel gwelliant, nid prawf. Mewn cyd-destunau pwysig fel newyddiaduraeth, tystiolaeth gyfreithiol, delweddu meddygol, neu waith fforensig, gall cynhyrchu picseli "credadwy" gamarwain oherwydd gall ychwanegu manylion na chawsant eu dal. Fframio mwy diogel yw ei ddefnyddio'n ddarluniadol a datgelu bod proses AI wedi ail-greu manylion. Os yw ffyddlondeb yn hanfodol, cadwch y gwreiddiol a dogfennwch bob cam prosesu a gosodiad.

Cyfeiriadau

  1. arXiv - Dysgu Dwfn ar gyfer Uwch-ddatrysiad Delweddau: Arolwg - arxiv.org

  2. arXiv - Uwch-Datrysiad Delwedd Gan Ddefnyddio Rhwydweithiau Cyfunol Dwfn (SRCNN) - arxiv.org

  3. arXiv - Real-ESRGAN - arxiv.org

  4. arXiv - ESRGAN - arxiv.org

  5. arXiv - SR3 - arxiv.org

  6. Datblygwr NVIDIA - NVIDIA DLSS - developer.nvidia.com

  7. AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com

  8. Mynediad Agored Sefydliad Gweledigaeth Gyfrifiadurol (CVF) - BasicVSR: Y Chwilio am Gydrannau Hanfodol mewn Uwch-Ddatrysiad Fideo (CVPR 2021) - openaccess.thecvf.com

  9. arXiv - Rhwydweithiau Cynhyrchiol Gwrthwynebol - arxiv.org

  10. arXiv - SRGAN - arxiv.org

  11. arXiv - Colledion Canfyddiadol (Johnson et al., 2016) - arxiv.org

  12. GitHub - Storfa Real-ESRGAN (dewisiadau teils) - github.com

  13. Wicipedia - Rhyngosodiad biciwbig - wikipedia.org

  14. Labs Topaz - Llun Topaz - topazlabs.com

  15. Topaz Labs - Fideo Topaz - topazlabs.com

  16. Canolfan Gymorth Adobe - Adobe Enhance > Datrysiad Uwch - helpx.adobe.com

  17. NIST / OSAC - Canllaw Safonol ar gyfer Rheoli Delweddau Digidol Fforensig (Fersiwn 1.0) - nist.gov

  18. SWGDE - Canllawiau ar gyfer Dadansoddi Delweddau Fforensig - swgde.org

Dewch o hyd i'r AI Diweddaraf yn y Siop Swyddogol ar gyfer Cynorthwywyr AI

Amdanom Ni

Yn ôl i'r blog