Beth yw AI Esboniadwy?

Mae AI Esboniadwy yn un o'r ymadroddion hynny sy'n swnio'n daclus wrth ginio ac yn dod yn gwbl hanfodol y funud y mae algorithm yn rhoi diagnosis meddygol, yn cymeradwyo benthyciad, neu'n nodi llwyth. Os ydych chi erioed wedi meddwl, iawn, ond pam wnaeth y model hynny ... rydych chi eisoes yn nhiriogaeth AI Esboniadwy. Gadewch i ni ddadbacio'r syniad mewn iaith glir - dim hud, dim ond dulliau, cyfaddawdau, ac ychydig o wirioneddau caled.

Erthyglau y gallech fod eisiau eu darllen ar ôl yr un hon:

🔗 Beth yw rhagfarn AI?
Deall rhagfarn AI, ei ffynonellau, ei effeithiau, a'i strategaethau lliniaru.

🔗 Beth yw AI rhagfynegol?
Archwiliwch AI rhagfynegol, defnyddiau cyffredin, manteision a chyfyngiadau ymarferol.

🔗 Beth yw robot dynolryw AI?
Dysgwch sut mae AI yn pweru robotiaid dynol, galluoedd, enghreifftiau a heriau.

🔗 Beth yw hyfforddwr AI?
Darganfyddwch beth mae hyfforddwyr AI yn ei wneud, y sgiliau gofynnol, a'r llwybrau gyrfa.

Beth mae AI Esboniadwy yn ei olygu mewn gwirionedd

Deallusrwydd Artiffisial Esboniadwy yw'r arfer o ddylunio a defnyddio systemau Deallusrwydd Artiffisial fel y gall bodau dynol - y bobl benodol yr effeithir arnynt gan neu sy'n gyfrifol am benderfyniadau, nid dim ond dewiniaid mathemateg - ddeall eu hallbynnau. Mae NIST yn rhannu hyn yn bedwar egwyddor: darparu esboniad ,ei wneud yn ystyrlon i'r gynulleidfa, sicrhau cywirdeb yr esboniad (yn ffyddlon i'r model), a pharchu terfynau gwybodaeth (peidiwch â gorbwysleisio'r hyn y mae'r system yn ei wybod) [1].

Rhywbeth bach o'r ochr hanesyddol: gwthiodd meysydd sy'n hanfodol i ddiogelwch ar hyn yn gynnar, gan anelu at fodelau sy'n aros yn gywir ond yn ddigon dehongladwy i ymddiried "yn y ddolen." Nid yw seren y gogledd wedi newid - esboniadau defnyddiadwy heb ddifetha perfformiad.

Pam mae AI Esboniadwy yn bwysicach nag yr ydych chi'n meddwl 💡

Ymddiriedaeth a mabwysiadu - Mae pobl yn derbyn systemau y gallant eu holi, eu cwestiynu a'u cywiro.
Risg a diogelwch - Esboniadau o ddulliau methiant arwyneb cyn iddynt eich synnu ar raddfa fawr.
Disgwyliadau rheoleiddio - Yn yr UE, mae Deddf AI yn gosod dyletswyddau tryloywder clir - e.e., dweud wrth bobl pryd maen nhw'n rhyngweithio â AI mewn cyd-destunau penodol a labelu cynnwys a gynhyrchwyd neu a driniwyd gan AI yn briodol [2].

Gadewch i ni fod yn onest - nid esboniadau yw dangosfyrddau godidog. Mae esboniad da yn helpu rhywun i benderfynu beth i'w wneud nesaf.

Beth sy'n gwneud Deallusrwydd Artiffisial Esboniadwy yn ddefnyddiol ✅

Pan fyddwch chi'n gwerthuso unrhyw ddull XAI, gofynnwch am:

Ffyddlondeb - A yw'r esboniad yn adlewyrchu ymddygiad y model, neu a yw'n adrodd stori gysurus yn unig?
Defnyddioldeb i'r gynulleidfa - Mae gwyddonwyr data eisiau graddiannau; mae clinigwyr eisiau gwrthffeithiau neu reolau; mae cwsmeriaid eisiau rhesymau mewn iaith glir ynghyd â'r camau nesaf.
Sefydlogrwydd - Ni ddylai newidiadau bach i'r mewnbwn droi'r stori o A i Z.
Gweithredadwyedd - Os nad yw'r allbwn yn ddymunol, beth allai fod wedi newid?
Gonestrwydd ynglŷn ag ansicrwydd - Dylai esboniadau ddatgelu terfynau, nid eu peintio drostynt.
Eglurder cwmpas - Ai lleol ar gyfer un rhagfynegiad neu fyd-eang ar ymddygiad model?

Os cofiwch chi un peth yn unig: mae esboniad defnyddiol yn newid penderfyniad rhywun, nid dim ond eu hwyliau.

Cysyniadau allweddol y byddwch chi'n eu clywed llawer 🧩

Dehongliadwyedd vs esboniadwyedd - Dehongliadwyedd: mae'r model yn ddigon syml i'w ddarllen (e.e., coeden fach). Esboniadwyedd: ychwanegu dull ar ei ben i wneud model cymhleth yn ddarllenadwy.
Lleol vs byd-eang - Mae lleol yn esbonio un penderfyniad; mae byd-eang yn crynhoi ymddygiad yn gyffredinol.
Ôl-hoc yn erbyn mewnosodol - Mae ôl-hoc yn egluro blwch du hyfforddedig; mae mewnosodol yn defnyddio modelau y gellir eu dehongli'n gynhenid.

Ydy, mae'r llinellau hyn yn pylu. Mae hynny'n iawn; mae iaith yn esblygu; nid yw eich cofrestr risg.

Dulliau Deallusrwydd Artiffisial Esboniadwy Poblogaidd - y daith 🎡

Dyma daith gyffrous, gyda naws canllaw sain amgueddfa ond yn fyrrach.

1) Priodoliadau nodweddion ychwanegol

SHAP - Yn neilltuo cyfraniad i bob nodwedd at ragfynegiad penodol trwy syniadau damcaniaethol gemau. Yn boblogaidd am esboniadau ychwanegol clir a safbwynt unedig ar draws modelau [3].

2) Modelau dirprwyol lleol

LIME - Yn hyfforddi model syml, lleol o amgylch yr achos i'w egluro. Crynodebau cyflym, darllenadwy gan bobl o ba nodweddion oedd yn bwysig gerllaw. Gwych ar gyfer demos, yn ddefnyddiol o ran sefydlogrwydd ymarfer-gwylio [4].

3) Dulliau sy'n seiliedig ar raddiant ar gyfer rhwydi dwfn

Graddiannau Integredig - Yn priodoli pwysigrwydd trwy integreiddio graddiannau o linell sylfaen i'r mewnbwn; yn aml yn cael ei ddefnyddio ar gyfer gweledigaeth a thestun. Acsiomau synhwyrol; mae angen gofal gyda llinellau sylfaen a sŵn [1].

4) Esboniadau yn seiliedig ar enghreifftiau

Gwrthffeithiau - “Pa newid lleiaf fyddai wedi newid y canlyniad?” Perffaith ar gyfer gwneud penderfyniadau oherwydd ei fod yn naturiol ymarferol - gwnewch X i gael Y [1].

5) Prototeipiau, rheolau, a dibyniaeth rhannol

Mae prototeipiau'n dangos enghreifftiau cynrychioliadol; mae rheolau'n dal patrymau fel os yw incwm > X a hanes = glân yna cymeradwywch; mae dibyniaeth rannol yn dangos effaith gyfartalog nodwedd dros ystod. Syniadau syml, yn aml yn cael eu tanbrisio.

6) Ar gyfer modelau iaith

Priodoliadau tocyn/rhychwant, enghreifftiau a adferwyd, a rhesymeg strwythuredig. Defnyddiol, gyda'r rhybudd arferol: nid yw mapiau gwres taclus yn gwarantu rhesymu achosol [5].

Achos cyflym (cyfansawdd) o'r maes 🧪

Mae benthyciwr maint canolig yn defnyddio model â hwb graddiant ar gyfer penderfyniadau credyd. Mae SHAP lleol yn helpu asiantau i esbonio canlyniad anffafriol (“Dyled-i-incwm a defnydd credyd diweddar oedd y prif ysgogwyr.”) [3]. Mae wrthffeithiol yn awgrymu dewis ymarferol (“Lleihau defnydd cylchdroi ~10% neu ychwanegu £1,500 mewn blaendaliadau wedi'u gwirio i newid y penderfyniad.”) [1]. Yn fewnol, mae'r tîm yn cynnal profion ar hap ar ddelweddau arddull amlygrwydd maen nhw'n eu defnyddio mewn sicrhau ansawdd i sicrhau nad dim ond synwyryddion ymyl mewn cudd yw'r uchafbwyntiau [5]. Yr un model, esboniadau gwahanol ar gyfer gwahanol gynulleidfaoedd - cwsmeriaid, gweithredwyr ac archwilwyr.

Y darn lletchwith: gall esboniadau gamarwain 🙃

Mae rhai dulliau amlygrwydd yn edrych yn argyhoeddiadol hyd yn oed pan nad ydyn nhw wedi'u clymu i'r model hyfforddedig na'r data. Dangosodd gwiriadau synnwyr cyffredin y gall rhai technegau fethu profion sylfaenol, gan roi ymdeimlad ffug o ddealltwriaeth. Cyfieithiad: gall lluniau tlws fod yn theatr bur. Adeiladwch brofion dilysu ar gyfer eich dulliau esboniad [5].

Hefyd, prin ≠ gonest. Gallai rheswm un frawddeg guddio rhyngweithiadau mawr. Gall gwrthddywediadau bach mewn esboniad nodi ansicrwydd model go iawn - neu sŵn yn unig. Eich gwaith chi yw dweud pa un yw pa un.

Llywodraethu, polisi, a'r safon sy'n codi ar gyfer tryloywder 🏛️

Mae llunwyr polisi yn disgwyl tryloywder sy'n briodol i'r cyd-destun. Yn yr UE, mae Deddf AI yn nodi rhwymedigaethau megis hysbysu pobl pan fyddant yn rhyngweithio â AI mewn achosion penodol, a labelu cynnwys a gynhyrchwyd neu a driniwyd gan AI gyda hysbysiadau a dulliau technegol priodol, yn amodol ar eithriadau (e.e., defnyddiau cyfreithlon neu fynegiant gwarchodedig) [2]. Ar ochr beirianneg, mae NIST yn darparu canllawiau sy'n canolbwyntio ar egwyddorion i helpu timau i ddylunio esboniadau y gall pobl eu defnyddio mewn gwirionedd [1].

Sut i ddewis dull AI Esboniadwy - map cyflym 🗺️

Dechreuwch o'r penderfyniad - Pwy sydd angen yr esboniad, ac ar gyfer pa gamau?
Parwch y dull â'r model a'r cyfrwng
- Dulliau graddiant ar gyfer rhwydi dwfn mewn gweledigaeth neu NLP [1].
- SHAP neu LIME ar gyfer modelau tablaidd pan fyddwch angen priodoliadau nodwedd [3][4].
- Gwrthffeithiau ar gyfer adferiad ac apeliadau sy'n wynebu cwsmeriaid [1].
Gosod gatiau ansawdd - Gwiriadau ffyddlondeb, profion sefydlogrwydd, ac adolygiadau dynol-yn-y-ddolen [5].
Cynllunio ar gyfer graddfa - Dylai esboniadau fod yn logadwy, yn brofadwy, ac yn archwiliadwy.
Terfynau dogfennu - Nid oes unrhyw ddull yn berffaith; ysgrifennwch ddulliau methiant hysbys.

Bach o'r neilltu - os na allwch chi brofi esboniadau yn yr un ffordd ag yr ydych chi'n profi modelau, efallai na fydd gennych chi esboniadau, dim ond teimladau.

Tabl cymharu - opsiynau AI Esboniadwy cyffredin 🧮

Ychydig yn od yn fwriadol; mae bywyd go iawn yn flêr.

Offeryn / Dull	Cynulleidfa orau	Pris	Pam mae'n gweithio iddyn nhw
SHAP	Gwyddonwyr data, archwilwyr	Am ddim/ar agor	Priodoliadau ychwanegol - cyson, cymharol [3].
LEIM	Timau cynnyrch, dadansoddwyr	Am ddim/ar agor	Dirprwyon lleol cyflym; hawdd eu hamlygu; weithiau'n swnllyd [4].
Graddiannau Integredig	Peirianwyr ML ar rwydweithiau dwfn	Am ddim/ar agor	Priodoliadau seiliedig ar raddiant gydag axiomau synhwyrol [1].
Gwrthffeithiau	Defnyddwyr terfynol, cydymffurfiaeth, gweithrediadau	Cymysg	Yn ateb yn uniongyrchol beth i'w newid; yn hynod ymarferol [1].
Rhestrau rheolau / Coed	Perchnogion risg, rheolwyr	Am ddim/ar agor	Dehongliadwyedd cynhenid; crynodebau byd-eang.
Dibyniaeth rhannol	Datblygwyr modelau, sicrhau ansawdd	Am ddim/ar agor	Yn delweddu effeithiau cyfartalog ar draws ystodau.
Prototeipiau ac enghreifftiau	Dylunwyr, adolygwyr	Am ddim/ar agor	Enghreifftiau concrit, sy'n gyfeillgar i bobl; yn berthnasol.
Llwyfannau offer	Timau platfform, llywodraethu	Masnachol	Monitro + esboniad + archwiliad mewn un lle bron.

Ydy, mae celloedd yn anwastad. Dyna fywyd.

Llif gwaith syml ar gyfer Deallusrwydd Artiffisial Esboniadwy mewn cynhyrchu 🛠️

Cam 1 - Diffiniwch y cwestiwn.
Penderfynwch anghenion pwy sydd bwysicaf. Nid yw esboniadwyedd i wyddonydd data yr un peth â llythyr apêl i gwsmer.

Cam 2 - Dewiswch y dull yn ôl cyd-destun.

Model risg tablaidd ar gyfer benthyciadau - dechreuwch gyda SHAP ar gyfer lleol a byd-eang; ychwanegwch wrthffeithiau ar gyfer ad-daliad [3][1].
Dosbarthwr gweledigaeth - defnyddiwch Raddfeydd Integredig neu debyg; ychwanegwch wiriadau synnwyr cyffredin i osgoi peryglon amlygrwydd [1][5].

Cam 3 - Dilysu esboniadau.
Gwnewch brofion cysondeb esboniadau; tarfu ar fewnbynnau; gwiriwch fod nodweddion pwysig yn cyd-fynd â gwybodaeth am y maes. Os yw eich prif nodweddion yn symud yn wyllt bob tro y byddwch yn ailhyfforddi, oedwch.

Cam 4 - Gwnewch esboniadau'n ddefnyddiadwy.
Rhesymau mewn iaith glir ochr yn ochr â siartiau. Cynhwyswch gamau gweithredu nesaf gorau. Cynigiwch ddolenni i herio canlyniadau lle bo'n briodol - dyma'n union beth mae rheolau tryloywder yn ceisio'i gefnogi [2].

Cam 5 - Monitro a chofnodi.
Tracio sefydlogrwydd esboniadau dros amser. Mae esboniadau camarweiniol yn arwydd risg, nid nam cosmetig.

Ymchwiliad Dwfn 1: Esboniadau lleol vs byd-eang ar waith 🔍

Mae Local yn helpu person i ddeall pam y cafodd eu hachos y penderfyniad hwnnw - hollbwysig mewn cyd-destunau sensitif.
Mae Byd-eang yn helpu eich tîm i sicrhau bod ymddygiad dysgedig y model yn cyd-fynd â pholisi a gwybodaeth am y maes.

Gwnewch y ddau. Gallech ddechrau'n lleol ar gyfer gweithrediadau gwasanaeth, yna ychwanegu monitro byd-eang ar gyfer drifft ac adolygiad tegwch.

Ymchwiliad Dwfn 2: Gwrthffeithiau ar gyfer adferiad ac apeliadau 🔄

Mae pobl eisiau gwybod y newid lleiaf i gael canlyniad gwell. Mae esboniadau gwrthffeithiol yn gwneud yn union hynny -newid y ffactorau penodol hyn ac mae'r canlyniad yn troi [1]. Byddwch yn ofalus: rhaid i wrthffeithiol barchu hyfywedd a thegwch. Nid cynllun yw dweud wrth rywun am newid priodoledd na ellir ei newid, mae'n faner goch.

Ymchwiliad Dwfn 3: Amlygrwydd gwirio synnwyr cyffredin 🧪

Os ydych chi'n defnyddio mapiau amlygrwydd neu raddiannau, rhedeg gwiriadau synnwyr cyffredin. Mae rhai technegau'n cynhyrchu mapiau bron yn union yr un fath hyd yn oed pan fyddwch chi'n rhoi paramedrau model ar hap - sy'n golygu y gallent fod yn tynnu sylw at ymylon a gweadau, nid tystiolaeth ddysgedig. Mapiau gwres godidog, stori gamarweiniol. Adeiladu gwiriadau awtomataidd i mewn i CI/CD [5].

Cwestiynau Cyffredin sy'n codi ym mhob cyfarfod 🤓

C: A yw Deallusrwydd Artiffisial Esboniadwy yr un peth â thegwch?
A: Na. Mae esboniadau yn eich helpu i weld ymddygiad; mae tegwch yn briodwedd y mae'n rhaid i chi ei phrofi a'i gorfodi. Yn gysylltiedig, nid yn union yr un fath.

C: A yw modelau symlach bob amser yn well?
A: Weithiau. Ond mae syml ac anghywir yn dal i fod yn anghywir. Dewiswch y model symlaf sy'n bodloni gofynion perfformiad a llywodraethu.

C: A fydd esboniadau'n gollwng IP?
A: Gallant. Graddnodi manylion yn ôl cynulleidfa a risg; dogfennwch yr hyn rydych chi'n ei ddatgelu a pham.

C: A allwn ni ddangos pwysigrwydd nodweddion a dweud ei fod wedi gorffen?
A: Ddim o ddifrif. Addurn yw bariau pwysigrwydd heb gyd-destun nac ateb.

Rhy Hir, Heb Ddarllen y Fersiwn a'r sylwadau terfynol 🌯

Deallusrwydd Artiffisial Esboniadwy yw'r ddisgyblaeth o wneud ymddygiad model yn ddealladwy ac yn ddefnyddiol i'r bodau dynol sy'n dibynnu arno. Mae gan yr esboniadau gorau ffyddlondeb, sefydlogrwydd, a chynulleidfa glir. Mae gan ddulliau fel SHAP, LIME, Graddiannau Integredig, a gwrthffeithiau gryfderau - defnyddiwch nhw'n fwriadol, profwch nhw'n drylwyr, a chyflwynwch nhw mewn iaith y gall pobl weithredu arni. A chofiwch, gall delweddau llyfn fod yn theatrig; gofynnwch am dystiolaeth bod eich esboniadau'n adlewyrchu ymddygiad gwirioneddol y model. Adeiladwch esboniadwyedd i mewn i gylchred bywyd eich model - nid ychwanegiad sgleiniog mohono, mae'n rhan o sut rydych chi'n cludo'n gyfrifol.

A dweud y gwir, mae braidd fel rhoi llais i'ch model. Weithiau mae'n mwmian; weithiau mae'n gor-esbonio; weithiau mae'n dweud yn union yr hyn yr oeddech chi angen ei glywed. Eich gwaith chi yw ei helpu i ddweud y peth iawn, wrth y person iawn, ar yr adeg iawn. A thaflu label da neu ddau i mewn. 🎯

Cyfeiriadau

[1] NIST IR 8312 - Pedwar Egwyddor Deallusrwydd Artiffisial Esboniadwy. Sefydliad Cenedlaethol Safonau a Thechnoleg. darllen mwy

[2] Rheoliad (EU) 2024/1689 - Deddf Deallusrwydd Artiffisial (Cyfnodolyn Swyddogol/EUR-Lex). darllen mwy

[3] Lundberg a Lee (2017) - “Dull Unedig o Ddehongli Rhagfynegiadau Model.” arXiv. darllen mwy

[4] Ribeiro, Singh a Guestrin (2016) - “Pam Ddylwn i Ymddiried Ynoch Chi?” Yn Esbonio Rhagfynegiadau Unrhyw Ddosbarthwr. arXiv. darllen mwy

[5] Adebayo et al. (2018) - “Gwiriadau Synnwyr cyffredin ar gyfer Mapiau Amlygrwydd.” NeurIPS (PDF papur). darllen mwy

Dewch o hyd i'r AI Diweddaraf yn y Siop Swyddogol ar gyfer Cynorthwywyr AI

Amdanom Ni

Yn ôl i'r blog