Yr ateb byr: Mae uwchraddio AI yn gweithio trwy hyfforddi model ar ddelweddau cydraniad isel ac uchel wedi'u paru, yna ei ddefnyddio i ragweld picseli ychwanegol credadwy yn ystod yr uwchraddio. Os yw'r model wedi gweld gweadau neu wynebau tebyg yn yr hyfforddiant, gall ychwanegu manylion argyhoeddiadol; os na, gall "rhithweledu" arteffactau fel halos, croen cwyraidd, neu fflachio mewn fideo.
Prif bethau i'w cymryd:
Rhagfynegiad : Mae'r model yn cynhyrchu manylion credadwy, nid ail-greu gwarantedig o realiti.
Dewis model : Mae CNNs yn tueddu i fod yn fwy sefydlog; gall GANs edrych yn fwy craff ond mae risg y byddant yn dyfeisio nodweddion.
Gwiriadau arteffactau : Chwiliwch am halos, gweadau ailadroddus, “llythrennau bron”, ac wynebau plastig.
Sefydlogrwydd fideo : Defnyddiwch ddulliau amserol neu fe welwch chi ddisgleirdeb a drifft o ffrâm i ffrâm.
Defnydd risg uchel : Os yw cywirdeb yn bwysig, datgelwch y prosesu a thrinwch y canlyniadau fel rhai darluniadol.

Mae'n debyg eich bod chi wedi'i weld: mae delwedd fach, grimp yn troi'n rhywbeth digon clir i'w argraffu, ei ffrydio, neu ei ollwng i gyflwyniad heb wingo. Mae'n teimlo fel twyllo. Ac - yn y ffordd orau - mae'n debyg 😅
Felly, Sut mae Uwchraddio AI yn gweithio yn dibynnu ar rywbeth mwy penodol na “mae'r cyfrifiadur yn gwella manylion” (tonnog â llaw) ac yn agosach at “mae model yn rhagweld strwythur cydraniad uchel credadwy yn seiliedig ar batrymau a ddysgodd o lawer o enghreifftiau” ( Dysgu Dwfn ar gyfer Uwch-ddatrysiad Delweddau: Arolwg ). Y cam rhagfynegi hwnnw yw'r gêm gyfan - a dyna pam y gall uwchraddio AI edrych yn syfrdanol… neu ychydig yn blastig… neu fel pe bai eich cath wedi tyfu mwstas bonws.
Erthyglau y gallech fod eisiau eu darllen ar ôl yr un hon:
🔗 Sut mae AI yn gweithio
Dysgwch hanfodion modelau, data, a chasgliadau mewn AI.
🔗 Sut mae AI yn dysgu
Gweler sut mae data hyfforddi ac adborth yn gwella perfformiad model dros amser.
🔗 Sut mae AI yn canfod anomaleddau
Deall llinellau sylfaen patrymau a sut mae AI yn nodi ymddygiad anarferol yn gyflym.
🔗 Sut mae AI yn rhagweld tueddiadau
Archwiliwch ddulliau rhagweld sy'n adnabod signalau ac yn rhagweld galw yn y dyfodol.
Sut mae Uwchraddio AI yn gweithio: y syniad craidd, mewn geiriau bob dydd 🧩
Mae uwchraddio yn golygu cynyddu'r datrysiad: mwy o bicseli, delwedd fwy. Mae uwchraddio traddodiadol (fel biciwbig) yn ymestyn picseli ac yn llyfnhau trawsnewidiadau ( rhyngosodiad biciwbig ). Mae'n iawn, ond ni all ddyfeisio newydd - mae'n rhyngosod yn unig.
Mae uwchraddio AI yn rhoi cynnig ar rywbeth mwy beiddgar (aka “uwch-ddatrysiad” yn y byd ymchwil) ( Dysgu Dwfn ar gyfer Uwch-ddatrysiad Delweddau: Arolwg ):
-
Mae'n edrych ar y mewnbwn cydraniad isel
-
Yn adnabod patrymau (ymylon, gweadau, nodweddion wyneb, strôcs testun, gwehyddu ffabrig…)
-
olwg ddylai fersiwn cydraniad uwch
-
Yn cynhyrchu data picsel ychwanegol sy'n cyd-fynd â'r patrymau hynny
Nid “adfer realiti’n berffaith,” yn fwy fel “gwneud dyfaliad hynod gredadwy” ( Datrysiad Uwch Delwedd Gan Ddefnyddio Rhwydweithiau Cyfryngol Dwfn (SRCNN) ). Os yw hynny’n swnio ychydig yn amheus, dydych chi ddim yn anghywir - ond dyna hefyd pam ei fod yn gweithio mor dda 😄
Ac ie, mae hyn yn golygu bod uwchraddio AI yn rhithweledigaeth dan reolaeth yn y bôn… ond mewn ffordd gynhyrchiol, sy'n parchu picseli.
Beth sy'n gwneud fersiwn dda o uwchraddio AI? ✅🛠️
Os ydych chi'n beirniadu uwchraddiwr AI (neu osodiad rhagosodedig), dyma beth sy'n tueddu i fod bwysicaf:
-
Adfer manylion heb orgoginio
Mae uwchraddio da yn ychwanegu crispness a strwythur, nid sŵn crensiog na mandyllau ffug. -
Disgyblaeth ymyl
Mae llinellau glân yn aros yn lân. Mae modelau gwael yn gwneud i ymylon siglo neu egin halos. -
Realaeth gwead
Ni ddylai gwallt ddod yn strôc brwsh paent. Ni ddylai brics ddod yn stamp patrwm ailadroddus. -
Trin sŵn a chywasgu
Mae llawer o ddelweddau bob dydd yn cael eu JPEGio i farwolaeth. Nid yw uwchraddiwr da yn chwyddo'r difrod hwnnw ( Real-ESRGAN ). -
Ymwybyddiaeth o wynebau a thestun
Wynebau a thestun yw'r lleoedd hawsaf i weld camgymeriadau. Mae modelau da yn eu trin yn ysgafn (neu mae ganddyn nhw ddulliau arbenigol). -
Cysondeb ar draws fframiau (ar gyfer fideo)
Os yw manylion yn fflachio o ffrâm i ffrâm, bydd eich llygaid yn sgrechian. Mae uwchraddio fideo yn byw neu'n marw yn ôl sefydlogrwydd amserol ( BasicVSR (CVPR 2021) ). -
Rheolyddion sy'n gwneud synnwyr
Rydych chi eisiau llithryddion sy'n mapio i ganlyniadau go iawn: dad-sŵn, dad-aneglurder, tynnu arteffactau, cadw grawn, hogi… y pethau ymarferol.
Rheol dawel sy'n dal i fyny: yr uwchraddio "gorau" yn aml yw'r un rydych chi prin yn sylwi arno. Mae'n edrych fel petaech chi wedi cael camera gwell i ddechrau 📷✨
Tabl Cymharu: opsiynau uwchraddio AI poblogaidd (a'r hyn maen nhw'n dda ar ei gyfer) 📊🙂
Isod mae cymhariaeth ymarferol. Mae prisiau'n aneglur yn fwriadol oherwydd bod offer yn amrywio yn ôl trwydded, bwndeli, costau cyfrifiadurol, a'r holl bethau hwyl hynny.
| Offeryn / Dull | Gorau ar gyfer | Awyrgylch pris | Pam mae'n gweithio (yn fras) |
|---|---|---|---|
| Uwchraddwyr bwrdd gwaith arddull Topaz ( Topaz Photo , Topaz Video ) | Lluniau, fideo, llif gwaith hawdd | Taledig iawn | Modelau cyffredinol cryf + llawer o diwnio, yn tueddu i “weithio”… gan mwyaf |
| Nodweddion math “Super Resolution” Adobe ( Adobe Enhance > Super Resolution ) | Ffotograffwyr sydd eisoes yn yr ecosystem honno | Tanysgrifiad-y | Ail-greu manylion cadarn, fel arfer yn geidwadol (llai o ddrama) |
| Amrywiadau ESRGAN Go Iawn / ESRGAN ( ESRGAN Go Iawn , ESRGAN ) | DIY, datblygwyr, swyddi swp | Am ddim (ond yn gostus o ran amser) | Gwych am fanylion gwead, gall fod yn sbeislyd ar wynebau os nad ydych chi'n ofalus |
| Moddau uwchraddio seiliedig ar drylediad ( SR3 ) | Gwaith creadigol, canlyniadau steilus | Cymysg | Gall greu manylion hyfryd - gall hefyd ddyfeisio nonsens, felly… ie |
| Uwchraddwyr gemau (arddull DLSS/FSR) ( NVIDIA DLSS , AMD FSR 2 ) | Hapchwarae a rendro amser real | Wedi'i fwndelu | Yn defnyddio data symudiad a rhagolygon a ddysgwyd - perfformiad llyfn yn ennill 🕹️ |
| Gwasanaethau uwchraddio cwmwl | Cyfleustra, enillion cyflym | Talu fesul defnydd | Cyflym + graddadwy, ond rydych chi'n masnachu rheolaeth ac weithiau cynildeb |
| Uwchraddwyr AI sy'n canolbwyntio ar fideo ( BasicVSR , Topaz Video ) | Hen luniau, anime, archifau | Taledig iawn | Triciau amserol i leihau fflachio + modelau fideo arbenigol |
| Uwchraddio ffôn/oriel “clyfar” | Defnydd achlysurol | Wedi'i gynnwys | Modelau ysgafn wedi'u tiwnio ar gyfer allbwn dymunol, nid perffeithrwydd (yn dal yn ddefnyddiol) |
Cyffes rhyfedd fformatio: Mae “Paid-ish” yn gwneud llawer o waith yn y tabl yna. Ond rydych chi'n cael y syniad 😅
Y gyfrinach fawr: mae modelau'n dysgu mapio o gydraniad isel i gydraniad uchel 🧠➡️🖼️
Wrth wraidd y rhan fwyaf o uwchraddio AI mae gosodiad dysgu dan oruchwyliaeth ( Datrysiad Uwch Delweddau Gan Ddefnyddio Rhwydweithiau Cyfryngol Dwfn (SRCNN) ):
-
Dechreuwch gyda delweddau cydraniad uchel (y "gwirionedd")
-
Lleihau'r samplu i fersiynau cydraniad isel (y "mewnbwn")
-
Hyfforddi model i ail-greu'r cydraniad uchel gwreiddiol o'r cydraniad isel
Dros amser, mae'r model yn dysgu cydberthnasau fel:
-
“Mae’r math yma o aneglurder o amgylch llygad fel arfer yn perthyn i amrannau”
-
“Mae’r clwstwr picsel hwn yn aml yn dynodi testun serif”
-
“Mae’r graddiant ymyl hwn yn edrych fel llinell ar do, nid sŵn ar hap”
Nid cofio delweddau penodol ydyw (yn yr ystyr syml), ond dysgu strwythur ystadegol ( Dysgu Dwfn ar gyfer Uwch-ddatrysiad Delweddau: Arolwg ). Meddyliwch amdano fel dysgu gramadeg gweadau ac ymylon. Nid gramadeg barddoniaeth, yn fwy fel… gramadeg â llaw IKEA 🪑📦 (trosiad lletchwith, ond yn ddigon agos).
Y manylion: beth sy'n digwydd yn ystod casgliad (pan fyddwch chi'n uwchraddio) ⚙️✨
Pan fyddwch chi'n bwydo delwedd i mewn i uwchraddiwr AI, fel arfer mae piblinell fel hon:
-
Rhagbrosesu
-
Trosi gofod lliw (weithiau)
-
Normaleiddio gwerthoedd picsel
-
Teilsiwch y ddelwedd yn ddarnau os yw'n fawr (gwiriad realiti VRAM 😭) ( Repo Real-ESRGAN (dewisiadau teils) )
-
-
Echdynnu nodweddion
-
Mae haenau cynnar yn canfod ymylon, corneli, graddiannau
-
Mae haenau dyfnach yn canfod patrymau: gweadau, siapiau, cydrannau wyneb
-
-
Ailadeiladu
-
Mae'r model yn cynhyrchu map nodweddion cydraniad uwch
-
Yna'n trosi hynny'n allbwn picsel gwirioneddol
-
-
Ôl-brosesu
-
Hogi dewisol
-
Dad-sŵn dewisol
-
Atal arteffactau dewisol (canu, halos, blocio)
-
Un manylyn cynnil: mae llawer o offer yn uwchraddio teils, yna'n cyfuno gwythiennau. Mae offer gwych yn cuddio ffiniau teils. Mae offer gwych yn gadael marciau grid gwan os byddwch chi'n llygadrythu. Ac ie, byddwch chi'n llygadrythu, oherwydd mae bodau dynol wrth eu bodd yn archwilio amherffeithrwydd bach ar chwyddo 300% fel gremlins bach 🧌
Y prif deuluoedd model a ddefnyddir ar gyfer uwchraddio AI (a pham maen nhw'n teimlo'n wahanol) 🤖📚
1) Uwch-ddatrysiad wedi'i seilio ar CNN (y ceffyl gwaith clasurol)
Mae rhwydweithiau niwral cyfryngol yn wych ar gyfer patrymau lleol: ymylon, gweadau, strwythurau bach ( Datrysiad Uwch Delweddau Gan Ddefnyddio Rhwydweithiau Cyfryngol Dwfn (SRCNN) ).
-
Manteision: cyflym iawn, sefydlog, llai o syrpreisys
-
Anfanteision: gall edrych braidd yn "brosesedig" os caiff ei wthio'n galed
2) Uwchraddio seiliedig ar GAN (arddull ESRGAN) 🎭
Mae GANs (Rhwydweithiau Gwrthwynebol Cynhyrchiol) yn hyfforddi generadur i gynhyrchu delweddau cydraniad uchel na all gwahaniaethwr eu gwahaniaethu oddi wrth rai go iawn ( Rhwydweithiau Gwrthwynebol Cynhyrchiol ).
-
Manteision: manylion cryf, gwead trawiadol
-
Anfanteision: gall ddyfeisio manylion nad oedd yno - weithiau'n anghywir, weithiau'n rhyfedd ( SRGAN , ESRGAN )
Gall GAN roi'r craffter sy'n haeddu anadl i chi. Gall hefyd roi ael ychwanegol i bwnc eich portread. Felly… dewiswch eich brwydrau 😬
3) Uwchraddio ar sail trylediad (y cerdyn gwyllt creadigol) 🌫️➡️🖼️
Mae modelau trylediad yn dadsŵn gam wrth gam a gellir eu harwain i gynhyrchu manylion cydraniad uchel ( SR3 ).
-
Manteision: gall fod yn wallgof o dda am fanylion credadwy, yn enwedig ar gyfer gwaith creadigol
-
Anfanteision: gall symud i ffwrdd o'r hunaniaeth/strwythur gwreiddiol os yw'r gosodiadau'n ymosodol ( SR3 )
Dyma lle mae “uwchraddio” yn dechrau cymysgu i “ailddychmygu”. Weithiau dyna’n union yr hyn rydych chi ei eisiau. Weithiau nid yw.
4) Uwchraddio fideo gyda chysondeb amserol 🎞️
Mae uwchraddio fideo yn aml yn ychwanegu rhesymeg sy'n ymwybodol o symudiad:
-
Yn defnyddio fframiau cyfagos i sefydlogi manylion ( BasicVSR (CVPR 2021) )
-
Yn ceisio osgoi fflachio ac arteffactau sy'n cropian
-
Yn aml yn cyfuno uwch-ddatrysiad â dad-sŵn a dad-rhyngblethu ( Fideo Topaz )
Os yw uwchraddio delweddau fel adfer un paentiad, mae uwchraddio fideo fel adfer llyfr troi heb newid siâp trwyn y cymeriad bob tudalen. Sydd… yn anoddach nag y mae'n swnio.
Pam mae uwchraddio AI weithiau'n edrych yn ffug (a sut i'w weld) 👀🚩
Mae uwchraddio AI yn methu mewn ffyrdd adnabyddadwy. Unwaith y byddwch chi'n dysgu'r patrymau, fe welwch chi nhw ym mhobman, fel prynu car newydd a sylwi'n sydyn ar y model hwnnw ar bob stryd 😵💫
Dywed cyffredin:
-
Croen cwyro ar wynebau (gormod o ddad-sŵn + llyfnhau)
-
Halos wedi'u gor-fynio o amgylch ymylon (tiriogaeth "gor-saethu" glasurol) ( rhyngosodiad deiciwbig )
-
Gweadau ailadroddus (waliau brics yn dod yn batrymau copïo-gludo)
-
Micro-gyferbyniad crensiog sy'n gweiddi "algorithm"
-
Manteisio testun lle mae llythrennau'n dod yn bron yn llythrennau (y math gwaethaf)
-
Drifft manylion lle mae nodweddion bach yn newid yn gynnil, yn enwedig mewn llifau gwaith gwasgariad ( SR3 )
Y rhan anodd: weithiau mae'r arteffactau hyn yn edrych yn "well" ar yr olwg gyntaf. Mae eich ymennydd yn hoffi miniogrwydd. Ond ar ôl eiliad, mae'n teimlo'n... od.
Tacteg dda yw chwyddo allan a gwirio a yw'n edrych yn naturiol ar bellter gwylio arferol. Os mai dim ond ar chwyddo 400% y mae'n edrych yn dda, nid yw hynny'n fuddugoliaeth, mae'n hobi 😅
Sut mae Uwchraddio AI yn gweithio: yr ochr hyfforddi, heb y cur pen mathemateg 📉🙂
Mae hyfforddi modelau uwch-ddatrysiad fel arfer yn cynnwys:
-
Setiau data paru (mewnbwn cydraniad isel, targed cydraniad uchel) ( Delwedd Uwch-Ddatrysiad Gan Ddefnyddio Rhwydweithiau Crynhoad Dwfn (SRCNN) )
-
Swyddogaethau colled sy'n cosbi ail-greu anghywir ( SRGAN )
Mathau nodweddiadol o golledion:
-
Colli picsel (L1/L2)
Yn annog cywirdeb. Gall gynhyrchu canlyniadau ychydig yn feddal. -
Colli canfyddiadol
Yn cymharu nodweddion dyfnach (fel “a yw hyn yn edrych yn debyg”) yn hytrach na picseli union ( Colledion Canfyddiadol (Johnson et al., 2016) ). -
Colli Gwrthwynebol (GAN)
Yn annog realaeth, weithiau ar draul cywirdeb llythrennol ( SRGAN , Rhwydweithiau Gwrthwynebol Cynhyrchiol ).
Mae yna frwydr dynnu gyson:
-
Gwnewch hi'n ffyddlon i'r gwreiddiol
vs. -
Gwnewch hi'n bleserus yn weledol
Mae gwahanol offer yn glanio mewn gwahanol leoedd ar y sbectrwm hwnnw. Ac efallai y byddwch chi'n well ganddo un yn dibynnu a ydych chi'n adfer lluniau teulu neu'n paratoi poster lle mae "edrych yn dda" yn bwysicach na chywirdeb fforensig.
Llifau gwaith ymarferol: lluniau, sganiau hen, anime, a fideo 📸🧾🎥
Lluniau (portreadau, tirweddau, lluniau cynnyrch)
Yr arfer gorau fel arfer yw:
-
Dad-sŵn ysgafn yn gyntaf (os oes angen)
-
Uchel eu safon gyda gosodiadau ceidwadol
-
Ychwanegwch grawn yn ôl os yw pethau'n teimlo'n rhy llyfn (ydw, wir)
Mae grawn fel halen. Mae gormod yn difetha cinio, ond ni all dim o gwbl flasu ychydig yn fflat 🍟
Sganiau hen a delweddau wedi'u cywasgu'n drwm
Mae'r rhain yn anoddach oherwydd gallai'r model drin blociau cywasgu fel "gwead".
Rhowch gynnig ar:
-
Tynnu neu ddadflocio arteffactau
-
Yna uwchraddio
-
Yna hogi'n ysgafn (dim gormod… mi wn, mae pawb yn dweud hynny, ond serch hynny)
Anime a chelf llinell
Mae celf llinell yn elwa o:
-
Modelau sy'n cadw ymylon glân
-
Rhithweledigaeth gwead llai Mae
uwchraddio anime yn aml yn edrych yn wych oherwydd bod y siapiau'n symlach ac yn gyson. (Lwcus.)
Fideo
Mae'r fideo yn ychwanegu camau ychwanegol:
-
Dadsŵn
-
Dad-blethu (ar gyfer rhai ffynonellau)
-
Uchelgeisiol
-
Llyfnhau neu sefydlogi amserol ( BasicVSR (CVPR 2021) )
-
Ailgyflwyno grawn dewisol ar gyfer cydlyniant
Os byddwch chi'n hepgor cysondeb amserol, byddwch chi'n cael y manylion disglair hynny'n fflachio. Unwaith i chi sylwi arno, ni allwch ei ddad-weld. Fel cadair gwichian mewn ystafell dawel 😖
Dewis gosodiadau heb ddyfalu'n wyllt (taflen dwyllo fach) 🎛️😵💫
Dyma feddylfryd cychwynnol da:
-
Os yw wynebau'n edrych yn blastig,
lleihewch y sŵn, lleihewch y miniogrwydd, rhowch gynnig ar fodel neu fodd sy'n cadw wynebau. -
Os yw gweadau'n edrych yn rhy ddwys,
gostwngwch y llithryddion “gwella manylion” neu “adfer manylion”, ychwanegwch raen cynnil ar ôl. -
Os yw'r ymylon yn tywynnu
Trowch i lawr y miniogi, gwiriwch yr opsiynau atal halo. -
Os yw'r ddelwedd yn edrych yn rhy “AI”
Ewch yn fwy ceidwadol. Weithiau'r symudiad gorau yw… llai.
Hefyd: peidiwch â'i uwchraddio 8x dim ond oherwydd eich bod chi'n gallu. 2x neu 4x glân yw'r man perffaith yn aml. Heblaw hynny, rydych chi'n gofyn i'r model ysgrifennu ffuglen gefnogwyr am eich picseli 📖😂
Moeseg, dilysrwydd, a'r cwestiwn lletchwith o "wirionedd" 🧭😬
Mae uwchraddio AI yn aneglur llinell:
-
Mae adferiad yn golygu adfer yr hyn a oedd yno
-
Mae gwella yn awgrymu ychwanegu'r hyn nad oedd
Gyda lluniau personol, mae fel arfer yn iawn (ac yn hyfryd). Gyda newyddiaduraeth, tystiolaeth gyfreithiol, delweddu meddygol, neu unrhyw beth lle mae ffyddlondeb yn bwysig… mae angen i chi fod yn ofalus ( OSAC/NIST: Canllaw Safonol ar gyfer Rheoli Delweddau Digidol Fforensig , Canllawiau SWGDE ar gyfer Dadansoddi Delweddau Fforensig ).
Rheol syml:
-
Os yw'r risgiau'n uchel, ystyriwch uwchraddio AI fel rhywbeth darluniadol , nid fel rhywbeth pendant.
Hefyd, mae datgeliad yn bwysig mewn cyd-destunau proffesiynol. Nid oherwydd bod deallusrwydd artiffisial yn ddrwg, ond oherwydd bod cynulleidfaoedd yn haeddu gwybod a gafodd manylion eu hail-greu neu eu cipio. Mae hynny'n... barchus.
Nodiadau cloi a chrynodeb byr 🧡✅
Felly, sut mae Uwchraddio AI yn gweithio : mae modelau'n dysgu sut mae manylion cydraniad uchel yn tueddu i gysylltu â phatrymau cydraniad isel, yna'n rhagweld picseli ychwanegol credadwy yn ystod uwchraddio ( Dysgu Dwfn ar gyfer Uwch-ddatrysiad Delwedd: Arolwg ). Yn dibynnu ar y teulu modelau (CNN, GAN, trylediad, fideo-amserol), gall y rhagfynegiad hwnnw fod yn geidwadol ac yn ffyddlon ... neu'n feiddgar ac weithiau'n ansicr 😅
Crynodeb cyflym
-
Mae uwchraddio traddodiadol yn ymestyn picseli ( rhyngosodiad biciwbig )
-
Mae uwchraddio AI yn rhagweld manylion coll gan ddefnyddio patrymau dysgedig ( Uwch-ddatrysiad Delwedd Gan Ddefnyddio Rhwydweithiau Cyfryngol Dwfn (SRCNN) )
-
Daw canlyniadau gwych o'r model cywir + cymalu
-
Chwiliwch am halos, wynebau cwyraidd, gweadau ailadroddus, a fflachiadau mewn fideo ( BasicVSR (CVPR 2021) )
-
Yn aml, mae uwchraddio yn "ail-greu credadwy", nid yn wirionedd perffaith ( SRGAN , ESRGAN )
Os ydych chi eisiau, dywedwch wrthyf beth rydych chi'n ei uwchraddio (wynebau, hen luniau, fideo, anime, sganiau testun), a byddaf yn awgrymu strategaeth gosodiadau sy'n tueddu i osgoi'r peryglon cyffredin "edrych AI" 🎯🙂
Cwestiynau Cyffredin
Uwchraddio AI a sut mae'n gweithio
Mae uwchraddio AI (a elwir yn aml yn "uwch-ddatrysiad") yn cynyddu datrysiad delwedd trwy ragweld manylion cydraniad uchel sydd ar goll o batrymau a ddysgwyd yn ystod hyfforddiant. Yn lle ymestyn picseli yn unig fel rhyngosodiad deu-giwbig, mae model yn astudio ymylon, gweadau, wynebau, a strôcs tebyg i destun, yna'n cynhyrchu data picsel newydd sy'n cyd-fynd â'r patrymau a ddysgwyd hynny. Mae'n llai o "adfer realiti" a mwy o "wneud dyfaliad credadwy" sy'n darllen fel rhywbeth naturiol.
Uwchraddio AI yn erbyn newid maint deucubig neu draddodiadol
Mae dulliau uwchraddio traddodiadol (fel biciwbig) yn rhyngosod yn bennaf rhwng picseli presennol, gan lyfnhau trawsnewidiadau heb greu manylion newydd go iawn. Nod uwchraddio AI yw ail-greu strwythur credadwy trwy adnabod ciwiau gweledol a rhagweld sut olwg sydd ar fersiynau cydraniad uchel o'r ciwiau hynny. Dyna pam y gall canlyniadau AI deimlo'n llawer mwy miniog, a hefyd pam y gallant gyflwyno arteffactau neu "ddyfeisio" manylion nad oeddent yn bresennol yn y ffynhonnell.
Pam y gall wynebau edrych yn gwyraidd neu'n rhy llyfn
Mae wynebau cwyraidd fel arfer yn deillio o ddad-sŵn a llyfnhau ymosodol ynghyd â hogi sy'n tynnu gwead naturiol y croen i ffwrdd. Mae llawer o offer yn trin sŵn a gwead mân yn yr un modd, felly gall "glanhau" delwedd ddileu mandyllau a manylion cynnil. Dull cyffredin yw lleihau dad-sŵn a hogi, defnyddio modd cadw wynebau os yw ar gael, yna ailgyflwyno ychydig o raen fel bod y canlyniad yn teimlo'n llai plastig ac yn fwy ffotograffig.
Arteffactau uwchraddio AI cyffredin i gadw llygad amdanynt
Mae arwyddion nodweddiadol yn cynnwys halos o amgylch ymylon, patrymau gwead ailadroddus (fel briciau copïo-gludo), micro-gyferbyniad crensiog, a thestun sy'n troi'n "lythrennau bron". Mewn llifau gwaith sy'n seiliedig ar drylediad, gallwch hefyd weld manylion yn symud yn gyflym lle mae nodweddion bach yn newid yn gynnil. Ar gyfer fideo, mae manylion yn fflachio ac yn cropian ar draws fframiau yn faneri coch mawr. Os yw'n edrych yn dda ar chwyddo eithafol yn unig, mae'n debyg bod y gosodiadau'n rhy ymosodol.
Sut mae uwchraddwyr GAN, CNN, ac uwchsafwyr trylediad yn tueddu i fod yn wahanol o ran canlyniadau
Mae uwch-ddatrysiad sy'n seiliedig ar CNN yn tueddu i fod yn fwy cyson a rhagweladwy, ond gall edrych yn "brosesedig" os caiff ei wthio'n galed. Yn aml, mae opsiynau sy'n seiliedig ar GAN (arddull ESRGAN) yn cynhyrchu gwead mwy grymus a miniogrwydd canfyddedig, ond gallant greu rhithweledigaeth o fanylion anghywir, yn enwedig ar wynebau. Gall uwchraddio sy'n seiliedig ar drylediad gynhyrchu manylion hardd a chredadwy, ond gall wyro o'r strwythur gwreiddiol os yw'r gosodiadau canllaw neu gryfder yn rhy gryf.
Strategaeth gosodiadau ymarferol ar gyfer osgoi golwg "rhy AI"
Dechreuwch yn geidwadol: uwchraddiwch 2× neu 4× cyn cyrraedd at ffactorau eithafol. Os yw wynebau'n edrych yn blastig, diddymwch y dadsŵn a'r hogi a rhowch gynnig ar ddull sy'n ymwybodol o wynebau. Os yw gweadau'n mynd yn rhy ddwys, gostwngwch y gwelliant manylion ac ystyriwch ychwanegu graen cynnil wedyn. Os yw ymylon yn tywynnu, lleihau'r hogi a gwirio atal halo neu arteffactau. Mewn llawer o biblinellau, mae "llai" yn ennill oherwydd ei fod yn cadw realaeth gredadwy.
Trin sganiau hen neu ddelweddau wedi'u cywasgu'n drwm o ran JPEG cyn eu huwchraddio
Mae delweddau cywasgedig yn anodd oherwydd gall modelau drin arteffactau bloc fel gwead go iawn a'u mwyhau. Llif gwaith cyffredin yw tynnu neu ddadflocio arteffactau yn gyntaf, yna uwchraddio, yna hogi'n ysgafn dim ond os oes angen. Ar gyfer sganiau, gall glanhau ysgafn helpu'r model i ganolbwyntio ar y strwythur gwirioneddol yn hytrach na difrod. Y nod yw lleihau "ciwiau gwead ffug" fel nad yw'r un sy'n uwchraddio yn cael ei orfodi i wneud dyfaliadau hyderus o fewnbynnau swnllyd.
Pam mae uwchraddio fideo yn anoddach na uwchraddio lluniau
Rhaid i uwchraddio fideo fod yn gyson ar draws fframiau, nid dim ond yn dda ar un ddelwedd llonydd. Os yw manylion yn fflachio o ffrâm i ffrâm, mae'r canlyniad yn dod yn tynnu sylw'n gyflym. Mae dulliau sy'n canolbwyntio ar fideo yn defnyddio gwybodaeth amserol o fframiau cyfagos i sefydlogi ail-greu ac osgoi arteffactau disglair. Mae llawer o lifau gwaith hefyd yn cynnwys dad-sŵn, dad-blethu ar gyfer rhai ffynonellau, ac ailgyflwyno grawn dewisol fel bod y dilyniant cyfan yn teimlo'n gydlynol yn hytrach nag yn artiffisial o finiog.
Pan nad yw uwchraddio AI yn briodol neu pan fo'n beryglus dibynnu arno
Mae'n well trin uwchraddio AI fel gwelliant, nid prawf. Mewn cyd-destunau pwysig fel newyddiaduraeth, tystiolaeth gyfreithiol, delweddu meddygol, neu waith fforensig, gall cynhyrchu picseli "credadwy" gamarwain oherwydd gall ychwanegu manylion na chawsant eu dal. Fframio mwy diogel yw ei ddefnyddio'n ddarluniadol a datgelu bod proses AI wedi ail-greu manylion. Os yw ffyddlondeb yn hanfodol, cadwch y gwreiddiol a dogfennwch bob cam prosesu a gosodiad.
Cyfeiriadau
-
arXiv - Dysgu Dwfn ar gyfer Uwch-ddatrysiad Delweddau: Arolwg - arxiv.org
-
arXiv - Uwch-Datrysiad Delwedd Gan Ddefnyddio Rhwydweithiau Cyfunol Dwfn (SRCNN) - arxiv.org
-
arXiv - Real-ESRGAN - arxiv.org
-
arXiv - ESRGAN - arxiv.org
-
arXiv - SR3 - arxiv.org
-
Datblygwr NVIDIA - NVIDIA DLSS - developer.nvidia.com
-
AMD GPUOpen - FidelityFX Super Resolution 2 - gpuopen.com
-
Mynediad Agored Sefydliad Gweledigaeth Gyfrifiadurol (CVF) - BasicVSR: Y Chwilio am Gydrannau Hanfodol mewn Uwch-Ddatrysiad Fideo (CVPR 2021) - openaccess.thecvf.com
-
arXiv - Rhwydweithiau Cynhyrchiol Gwrthwynebol - arxiv.org
-
arXiv - SRGAN - arxiv.org
-
arXiv - Colledion Canfyddiadol (Johnson et al., 2016) - arxiv.org
-
GitHub - Storfa Real-ESRGAN (dewisiadau teils) - github.com
-
Wicipedia - Rhyngosodiad biciwbig - wikipedia.org
-
Labs Topaz - Llun Topaz - topazlabs.com
-
Topaz Labs - Fideo Topaz - topazlabs.com
-
Canolfan Gymorth Adobe - Adobe Enhance > Datrysiad Uwch - helpx.adobe.com
-
NIST / OSAC - Canllaw Safonol ar gyfer Rheoli Delweddau Digidol Fforensig (Fersiwn 1.0) - nist.gov
-
SWGDE - Canllawiau ar gyfer Dadansoddi Delweddau Fforensig - swgde.org