o ble mae AI yn cael gwybodaeth

O ble mae AI yn cael ei wybodaeth?

Ydych chi erioed wedi eistedd yno'n crafu'ch pen, fel ... o ble mae'r pethau hyn yn dod mewn gwirionedd ? Hynny yw, nid yw deallusrwydd artiffisial yn chwilota trwy bentyrrau llyfrgell llychlyd nac yn gwylio ffilmiau byr YouTube yn slei. Eto rywsut mae'n dod o hyd i atebion i bopeth - o driciau lasagna i ffiseg twll du - fel pe bai ganddo gabinet ffeilio diwaelod y tu mewn. Mae'r realiti yn fwy rhyfedd, ac efallai'n fwy diddorol nag y byddech chi'n dyfalu. Gadewch i ni ei ddadbacio ychydig (ac ie, efallai chwalu cwpl o fythau ar hyd y ffordd).


Ai Dewiniaeth ydy o? 🌐

Nid dewiniaeth mohono, er ei fod yn teimlo felly weithiau. Yr hyn sy'n digwydd o dan y cwfl yw rhagfynegi patrymau . Nid yw modelau iaith mawr (LLMs) yn storio ffeithiau yn y ffordd y mae eich ymennydd yn dal gafael ar rysáit bisgedi eich mam-gu; yn lle hynny, maent wedi'u hyfforddi i ddyfalu'r gair nesaf (tocyn) yn seiliedig ar yr hyn a ddaeth o'i flaen [2]. Yn ymarferol, mae hynny'n golygu eu bod yn glynu wrth berthnasoedd: pa eiriau sy'n hongian gyda'i gilydd, sut mae brawddegau fel arfer yn cymryd siâp, sut mae syniadau cyfan yn cael eu hadeiladu fel sgaffaldiau. Dyna pam mae'r allbwn yn swnio'n iawn, er - gonestrwydd llwyr - ei fod yn efelychu ystadegol, nid dealltwriaeth [4].

Felly beth sy'n gwneud gwybodaeth a gynhyrchir gan AI yn ddefnyddiol ? Llond llaw o bethau:

  • Amrywiaeth data - tynnu o ffynonellau dirifedi, nid un nant gul.

  • Diweddariadau - heb gylchoedd adnewyddu, mae'n mynd yn hen ffasiwn yn gyflym.

  • Hidlo - yn ddelfrydol dal sothach cyn iddo dreiddio i mewn (er, gadewch i ni fod yn onest, mae tyllau yn y rhwyd ​​​​yna).

  • Croeswirio - pwyso ar ffynonellau awdurdod (meddyliwch am NASA, WHO, prifysgolion mawr), sy'n hanfodol yn y rhan fwyaf o lyfrau chwarae llywodraethu AI [3].

rhithwelediadau hynny ? Nonsens caboledig yn y bôn wedi'i gyflwyno â wyneb syth [2][3].

Erthyglau y gallech fod eisiau eu darllen ar ôl yr un hon:

🔗 A all AI ragweld rhifau loteri
Archwilio mythau a ffeithiau am ragfynegiadau loteri AI.

🔗 Beth mae'n ei olygu i fabwysiadu dull cyfannol o ymdrin ag AI
Deall AI gyda safbwyntiau cytbwys ar foeseg ac effaith.

🔗 Beth mae'r Beibl yn ei ddweud am ddeallusrwydd artiffisial
Archwilio safbwyntiau Beiblaidd ar dechnoleg a chreadigaeth ddynol.


Cymhariaeth Gyflym: O Ble mae AI yn Tynnu 📊

Nid yw pob ffynhonnell yn gyfartal, ond mae pob un yn chwarae ei ran. Dyma gipolwg.

Math o Ffynhonnell Pwy sy'n ei Ddefnyddio (AI) Cost/Gwerth Pam Mae'n Gweithio (neu Ddim...)
Llyfrau ac Erthyglau Modelau iaith mawr Amhrisiadwy (rhywfaint) Gwybodaeth ddwys, strwythuredig - mae'n heneiddio'n gyflym.
Gwefannau a Blogiau Bron pob AI Am ddim (gyda sŵn) Amrywiaeth wyllt; cymysgedd o ddisgleirdeb a sbwriel llwyr.
Papurau Academaidd Deallusrwydd Artiffisial sy'n drwm ar ymchwil Weithiau wedi'u talu â waliau Trylwyredd + hygrededd, ond wedi'i fynegi mewn jargon trwm.
Data Defnyddiwr Deallusrwydd Artiffisial wedi'i Bersonoli Hynod sensitif ⚠️ Teilwra craff, ond digonedd o gur pen preifatrwydd.
Gwe Amser Real AIs sy'n gysylltiedig â chwiliadau Am ddim (os ar-lein) Yn cadw gwybodaeth yn ffres; yr anfantais yw'r risg o ehangu sibrydion.

Bydysawd Data Hyfforddi 🌌

Dyma gyfnod “dysgu plentyndod”. Dychmygwch roi miliynau o lyfrau stori, toriadau newyddion, a thyllau cwningen Wicipedia i blentyn ar unwaith. Dyna sut olwg sydd ar rag-hyfforddi. Yn y byd go iawn, mae darparwyr yn taflu data sydd ar gael yn gyhoeddus, ffynonellau trwyddedig, a thestun a gynhyrchwyd gan hyfforddwyr [2].

Wedi'u haenu ar ei ben: enghreifftiau dynol wedi'u curadu - atebion da, atebion gwael, gwthiadau i'r cyfeiriad cywir - cyn i'r atgyfnerthu hyd yn oed ddechrau [1].

Rhybudd tryloywder: nid yw cwmnïau'n datgelu pob manylyn. Mae rhai rheiliau gwarchod yn gyfrinachedd (effeithiau deallusol, pryderon diogelwch), felly dim ond ffenestr rhannol a gewch i'r gymysgedd wirioneddol [2].


Chwilio Amser Real: Y Topin Ychwanegol 🍒

Gall rhai modelau nawr edrych y tu allan i'w swigod hyfforddi. Dyna gynhyrchu adfer-estynedig (RAG) - yn y bôn tynnu darnau o fynegai byw neu storfa ddogfennau, yna eu gwehyddu i'r ateb [5]. Perffaith ar gyfer pethau sy'n newid yn gyflym fel penawdau newyddion neu brisiau stoc.

Y broblem? Mae'r rhyngrwyd yn gyfartal o athrylith a sbwriel. Os yw hidlwyr neu wiriadau tarddiad yn wan, rydych mewn perygl o ddata sothach yn dod i mewn yn sleifio - yn union yr hyn y mae fframweithiau risg yn rhybuddio amdano [3].

Datrysiad cyffredin: mae cwmnïau'n cysylltu modelau â'u eu hunain , felly mae atebion yn dyfynnu polisi AD cyfredol neu ddogfen gynnyrch wedi'i diweddaru yn lle ei hanwybyddu. Meddyliwch: llai o eiliadau "o diar", atebion mwy dibynadwy.


Mireinio: Cam Caboli AI 🧪

Mae modelau crai sydd wedi'u hyfforddi ymlaen llaw yn lletchwith. Felly maen nhw'n cael eu mireinio :

  • Eu dysgu i fod yn gymwynasgar, yn ddiniwed, yn onest (trwy ddysgu atgyfnerthol o adborth dynol, RLHF) [1].

  • Tywodio ymylon anniogel neu wenwynig (aliniad) [1].

  • Addasu ar gyfer tôn - boed hynny'n gyfeillgar, yn ffurfiol, neu'n sarkastig chwareus.

Nid yw cymaint yn caboli diemwnt â chorlannu eirlithriad ystadegol i ymddwyn yn fwy fel partner sgwrsio.


Y Bwmpiau a'r Methiannau 🚧

Gadewch i ni beidio â cheisio esgus ei fod yn ddi-ffael:

  • Rhithwelediadau - atebion clir sy'n hollol anghywir [2][3].

  • Rhagfarn - mae'n adlewyrchu patrymau sydd wedi'u pobi yn y data; gall hyd yn oed eu mwyhau os na chaiff ei wirio [3][4].

  • Dim profiad uniongyrchol - gall siarad am ryseitiau cawl ond heb erioed flasu un [4].

  • Gorhyder - mae'r rhyddiaith yn llifo fel pe bai'n gwybod, hyd yn oed pan nad yw. Mae fframweithiau risg yn pwysleisio rhagdybiaethau sy'n codi [3].


Pam Mae'n Teimlo Fel Gwybod 🧠

Nid oes ganddo unrhyw gredoau, dim cof yn yr ystyr ddynol, ac yn sicr dim hunan. Eto, oherwydd ei fod yn cysylltu brawddegau'n llyfn, mae eich ymennydd yn ei ddarllen fel pe bai'n deall . Yr hyn sy'n digwydd yw rhagfynegiad ar raddfa enfawr : yn malu triliynau o debygolrwyddau mewn eiliadau byrion [2].

Ymddygiad sy'n dod i'r amlwg yw'r naws "deallusrwydd" - mae ymchwilwyr yn ei alw, ychydig yn chwerthinllyd, yn "parot stocastig" [4].


Cyfatebiaeth sy'n Addas i Blant 🎨

Dychmygwch barot sydd wedi darllen pob llyfr yn y llyfrgell. Nid yw'n deall y straeon ond gall ailgymysgu'r geiriau i rywbeth sy'n teimlo'n ddoeth. Weithiau mae'n berffaith; weithiau mae'n nonsens - ond gyda digon o ddawn, ni allwch chi bob amser ddweud y gwahaniaeth.


I Gloi: O Ble Daw Gwybodaeth Deallusrwydd Artiffisial 📌

Mewn termau plaen:

  • Data hyfforddi enfawr (cyhoeddus + trwyddedig + a gynhyrchwyd gan hyfforddwr) [2].

  • Addasu'n fanwl gydag adborth dynol i lunio tôn/ymddygiad [1].

  • Systemau adfer pan gânt eu cysylltu â ffrydiau data byw [5].

Nid yw AI yn “gwybod” pethau - mae'n rhagweld testun . Dyna ei uwch-bŵer a'i sawdl Achilles. Y gwir amdani? Gwiriwch y pethau pwysig bob amser yn erbyn ffynhonnell ddibynadwy [3].


Cyfeiriadau

  1. Ouyang, L. et al. (2022). Hyfforddi modelau iaith i ddilyn cyfarwyddiadau gydag adborth dynol (InstructGPT) . arXiv .

  2. OpenAI (2023). Adroddiad Technegol GPT-4 - cymysgedd o ddata trwyddedig, cyhoeddus, a data a grëwyd gan ddyn; amcan a chyfyngiadau rhagfynegi'r tocyn nesaf. arXiv .

  3. NIST (2023). Fframwaith Rheoli Risg AI (AI RMF 1.0) - tarddiad, dibynadwyedd, a rheolaethau risg. PDF .

  4. Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). Ar Beryglon Parotiaid Stocastig: A all Modelau Iaith Fod yn Rhy Fawr? PDF .

  5. Lewis, P. et al. (2020). Cynhyrchu Adalw-Ehangedig ar gyfer NLP Gwybodaeth-ddwys . arXiv .


Dewch o hyd i'r AI Diweddaraf yn y Siop Swyddogol ar gyfer Cynorthwywyr AI

Amdanom Ni

Yn ôl i'r blog