Erantzun laburra: Oinarrizko ereduak datu-multzo zabal eta zabaletan entrenatutako IA eredu handiak dira, eta gero lan askotara (idazketa, bilaketa, kodeketa, irudiak) egokitzen dira, gonbidapenen, doikuntza finduen, tresnen edo berreskurapenaren bidez. Erantzun fidagarriak behar badituzu, lotu itzazu oinarriekin (RAG bezala), muga argiekin eta egiaztapenekin, inprobisatzen utzi beharrean.
Ondorio nagusiak:
Definizioa : Oinarrizko eredu zabalki entrenatu bat, zeregin askotan berrerabilia, ez zeregin bat eredu bakoitzeko.
Egokitzapena : Erabili gonbidapenak, doikuntza fina, LoRA/egokitzaileak, RAG eta tresnak portaera gidatzeko.
Egokitzapen sortzailea : Testua, irudia, audioa, kodea eta eduki multimodala sortzea ahalbidetzen dute.
Kalitate seinaleak : Lehentasuna eman kontrolagarritasunari, haluzinazio gutxiagori, gaitasun multimodalei eta inferentzia eraginkorrari.
Arriskuen kontrolak : Haluzinazioetarako, alborapenetarako, pribatutasun-ihesetarako eta gobernantzaren eta probaren bidezko injekzio azkarretarako planifikazioa.

Honen ondoren irakurri nahi izango dituzun artikuluak:
🔗 Zer da IA enpresa bat?
Ulertu nola eraikitzen dituzten IA enpresek produktuak, taldeak eta diru-sarreren ereduak.
🔗 Nolakoa da IA kodea?
Ikusi IA kodearen adibideak, Python ereduetatik hasi eta APIetaraino.
🔗 Zer da IA algoritmo bat?
Ikasi zer diren IA algoritmoak eta nola hartzen dituzten erabakiak.
🔗 Zer da AI teknologia?
Arakatu automatizazioa, analisiak eta aplikazio adimendunak bultzatzen dituzten IA teknologia nagusiak.
1) Oinarri-ereduak - lainorik gabeko definizioa 🧠
Oinarri -eredua datu zabaletan (normalean tona batzuetan) entrenatutako IA eredu handi eta orokor bat da, zeregin askotara egokitu ahal izateko, ez bakar batera ( NIST , Stanford CRFM ).
Eredu bereizi bat eraiki beharrean:
-
mezu elektronikoak idaztea
-
galderak erantzuten
-
PDFak laburbiltzea
-
irudiak sortzea
-
laguntza-txartelak sailkatzea
-
hizkuntzak itzultzea
-
kode iradokizunak egitea
...oinarrizko eredu handi bat entrenatzen duzu, “mundua ikasten” duena modu estatistiko lauso batean, eta gero egokitzen gonbidapenekin, doikuntza finekin edo tresna gehigarriekin ( Bommasani et al., 2021 ).
gidatu dezakezun motor orokor bat da
Eta bai, gako-hitza “orokorra” da. Hori da trikimailu osoa.
2) Zer dira Oinarrizko Ereduak IA Generatiboan? (Nola egokitzen diren zehazki) 🎨📝
Beraz, zer dira Oinarrizko Ereduak IA Sortzailean? sor dezaketen sistemak elikatzen dituzten oinarrizko ereduak dira : testua, irudiak, audioa, kodea, bideoa eta gero eta gehiago... horien guztien nahasketak ( NIST , NIST IA Sortzaileko Profila ).
IA sortzailea ez da soilik “spam / ez spam” bezalako etiketak aurreikustea. Pertsona batek egindakoak diruditen emaitzak sortzea da.
-
paragrafoak
-
poemak
-
produktuen deskribapenak
-
ilustrazioak
-
melodiak
-
aplikazio prototipoak
-
ahots sintetikoak
-
eta batzuetan sinesgaitzak diren zentzugabekeriak 🙃
Oinarrizko ereduak bereziki onak dira hemen, honako arrazoi hauengatik:
-
datu-multzo erraldoietatik eredu zabalak xurgatu dituzte ( Bommasani et al., 2021 )
-
galdera berrietara orokortu dezakete (baita arraroetara ere) ( Brown et al., 2020 )
-
dozenaka irteeratarako berrerabili daitezke hutsetik berriro entrenatu gabe ( Bommasani et al., 2021 )
"Oinarrizko geruza" dira - ogi-orearen antzera. Baguette, pizza edo kanela-opilak egin ditzakezu labean... ez da metafora perfektua, baina ulertzen nauzu 😄
3) Zergatik aldatu zuten dena (eta zergatik ez dion jendeak haiei buruz hitz egiteari uzten) 🚀
Oinarrizko ereduen aurretik, IA asko zeregin espezifikoetarako zen:
-
Sentimenduen analisirako eredu bat trebatu
-
beste bat itzulpengintzan trebatu
-
beste bat trebatu irudien sailkapenerako
-
beste bat trebatu izendatutako entitateen ezagutzarako
Hori funtzionatu zuen, baina motela, garestia eta… hauskorra zen.
Fundazio ereduek irauli egin zuten:
-
behin aurrez entrenatu (ahalegin handia)
-
nonahi berrerabili (ordainketa handia) ( Bommasani et al., 2021 )
Berrerabilpen hori biderkatzailea da. Enpresek 20 ezaugarri eraiki ditzakete modelo-familia baten gainean, gurpila 20 aldiz berrasmatu beharrean.
Gainera, erabiltzailearen esperientzia naturalagoa bihurtu da:
-
ez duzu “sailkatzailerik erabiltzen”
-
Modeloarekin hitz egiten duzu inoiz lo egiten ez duen lankide lagungarri bat balitz bezala ☕🤝
Batzuetan, dena gaizki ulertzen duen lankide baten antzekoa ere bada, baina tira. Hazkundea.
4) Oinarrizko ideia: aurreprestakuntza + egokitzapena 🧩
Ia fundazio-eredu guztiek eredu bati jarraitzen diote ( Stanford CRFM , NIST ):
Aurre-prestakuntza ("internet xurgatzeko moduko" fasea) 📚
Modeloa datu-multzo masibo eta zabaletan entrenatzen da, autogainbegiratutako ikaskuntza ( NIST ) erabiliz. Hizkuntza-ereduentzat, horrek normalean falta diren hitzak edo hurrengo tokena aurreikustea esan nahi du ( Devlin et al., 2018 , Brown et al., 2020 ).
irudikapen orokorrak irakastea :
-
gramatika
-
gertaerak (mota batekoak)
-
arrazoiketa ereduak (batzuetan)
-
idazketa estiloak
-
kodearen egitura
-
gizakiaren asmoa komuna
Egokitzapena ("praktiko bihurtzeko" fasea) 🛠️
Ondoren, hauetako bat edo gehiago erabiliz egokitzen duzu:
-
argibideak (hizkuntza arruntean)
-
instrukzioen doikuntza (argibideak jarraitzeko entrenatzea) ( Wei et al., 2021 )
-
doikuntza fina (zure domeinu datuetan trebatzea)
-
LoRA / egokitzaileak (doikuntza arinak dituzten metodoak) ( Hu et al., 2021 )
-
RAG (berreskurapen-gehitutako belaunaldia - ereduak zure dokumentuak kontsultatzen ditu) ( Lewis et al., 2020 )
-
tresnen erabilera (funtzioak deitzea, barne sistemak arakatzea, etab.)
Horregatik idatz dezake oinarrizko eredu berak amodiozko eszena bat... eta gero bost segundo geroago SQL kontsulta bat arazten lagun dezake 😭
5) Zerk egiten du oinarri-eredu baten bertsio ona? ✅
Atal hau da jendeak saltatu eta gero damutzen dena.
Oinarri-eredu “on” bat ez da “handiagoa” bakarrik. Handiagoak laguntzen du, noski… baina ez da gauza bakarra. Oinarri-eredu baten bertsio on batek normalean honako hauek ditu:
Orokortze sendoa 🧠
Zeregin askotan ondo funtzionatzen du, zeregin espezifikoetarako birziklatze-prestakuntzarik behar izan gabe ( Bommasani et al., 2021 ).
Zuzendaritza eta kontrolagarritasuna 🎛️
Era fidagarrian jarrai ditzake argibide hauek:
-
"Laburra izan"
-
"Erabili puntuak"
-
"Idatzi tonu atsegin batean"
-
"Ez agerian utzi informazio konfidentziala"
Modelo batzuk adimentsuak dira, baina irristakorrak. Dutxan xaboi-pastilla bat eusten saiatzea bezala. Lagungarriak, baina irregularrak 😅
Haluzinazio joera txikia (edo gutxienez ziurgabetasun zintzoa) 🧯
Ez dago haluzinazioetatik immune den eredurik, baina onak direnak:
-
gutxiago haluzinatu
-
ziurgabetasuna maizago onartu
-
berreskurapena erabiltzean, testuinguru horretatik gertuago egon ( Ji et al., 2023 , Lewis et al., 2020 )
Gaitasun multimodal ona (beharrezkoa denean) 🖼️🎧
Irudiak irakurtzen, grafikoak interpretatzen edo audioa ulertzen duten laguntzaileak eraikitzen ari bazara, multimodalak asko axola du ( Radford et al., 2021 ).
Inferentzia eraginkorra ⚡
Latentzia eta kostua garrantzitsuak dira. Indartsua baina motela den modelo bat gurpil zulatua duen kirol-auto baten antzekoa da.
Segurtasun eta lerrokatze portaera 🧩
Ez bakarrik “dena ukatu”, baizik eta:
-
saihestu argibide kaltegarriak
-
alborapena murriztu
-
gai sentikorrak kontu handiz kudeatu
-
oinarrizko jailbreak saiakerei aurre egin (neurri batean...) ( NIST AI RMF 1.0 , NIST Generative AI Profile )
Dokumentazioa + ekosistema 🌱
Lehorra dirudi honek, baina benetakoa da:
-
tresneria
-
ebaluazio-arnesak
-
hedapen aukerak
-
enpresaren kontrolak
-
doikuntza finaren laguntza
Bai, “ekosistema” hitz lausoa da. Nik ere gorroto dut. Baina garrantzitsua da.
6) Konparazio taula - ohiko zimendu ereduen aukerak (eta zertarako diren onak) 🧾
Jarraian, konparazio-taula praktiko eta apur bat inperfektu bat dago. Ez da "benetako zerrenda bakarra", baizik eta: jendeak naturan aukeratzen duena.
| tresna / modelo mota | audientzia | prezio ertaineko | zergatik funtzionatzen duen |
|---|---|---|---|
| Jabedun LLM (txat estilokoa) | Abiadura + leuntasuna nahi duten taldeak | erabileran oinarritutakoa / harpidetza | Argibideen jarraipen bikaina, errendimendu orokorra sendoa, normalean onena “kutxatik aterata” 😌 |
| LLM pisu irekikoa (auto-ostatua) | kontrola nahi duten eraikitzaileak | azpiegitura kostua (eta buruko minak) | Pertsonalizagarria, pribatutasuna errespetatzen duena, tokian tokiko exekutatu daiteke... gauerdian jolastea gustatzen bazaizu |
| Difusio-irudien sorgailua | sortzaileak, diseinu taldeak | doakotik ordainpekora | Irudien sintesi bikaina, estiloen aniztasuna, lan-fluxu iteratiboak (baita ere: hatzak deskonektatuta egon daitezke) ✋😬 ( Ho et al., 2020 , Rombach et al., 2021 ) |
| "Ikusmen-hizkuntza" eredu multimodala | Irudiak + testua irakurtzen dituzten aplikazioak | erabileran oinarritutako | Irudiei, pantaila-argazkiei eta diagramei buruzko galderak egiteko aukera ematen dizu - harrigarriro erabilgarria ( Radford et al., 2021 ) |
| Oinarri-eredua txertatzea | bilaketa + RAG sistemak | dei bakoitzeko kostu baxua | Testua bektore bihurtzen du bilaketa semantikorako, multzokatzerako eta gomendioetarako - MVP energia lasaia ( Karpukhin et al., 2020 , Douze et al., 2024 ) |
| Ahots-testu oinarri eredua | dei-zentroak, sortzaileak | erabileran oinarritutakoa / tokikoa | Transkripzio azkarra, hizkuntza anitzeko laguntza, zarata handiko audioetarako nahikoa ona (normalean) 🎙️ ( Xuxurlatu ) |
| Testutik ahots bihurtzeko oinarri eredua | produktu taldeak, komunikabideak | erabileran oinarritutako | Ahots naturalaren sorrera, ahots estiloak, narrazioa - izugarri errealistak izan daitezke ( Shen et al., 2017 ) |
| Kodean oinarritutako LLM | garatzaileak | erabileran oinarritutakoa / harpidetza | Hobea kode ereduetan, arazketan, berregituraketan... hala ere ez naiz adimena irakurtzen 😅 |
Konturatu “oinarri-ereduak” ez duela soilik “txatbot” esan nahi. Txertatzeak eta hizketa-ereduak ere oinarri-itxurakoak izan daitezke, zabalak eta zeregin guztietan berrerabilgarriak direlako ( Bommasani et al., 2021 , NIST ).
7) Begirada hurbilagoa: nola ikasten duten hizkuntza-oinarrizko ereduek (bibrazio-bertsioa) 🧠🧃
Hizkuntzaren oinarri-ereduak (askotan LLM deituak) testu-bilduma erraldoietan entrenatzen dira normalean. Tokenak iragarriz ikasten dute ( Brown et al., 2020 ). Hori da dena. Ez da hauts sekreturik.
Baina magia da tokenak iragartzeak eredua egitura ikastera behartzen duela ( CSET ):
-
gramatika eta sintaxia
-
gai-harremanak
-
arrazoiketa-ereduak (batzuetan)
-
pentsamendu sekuentzia arruntak
-
jendeak nola azaltzen dituen gauzak, nola eztabaidatzen duen, nola barkamena eskatzen duen, nola negoziatzen duen, nola irakasten duen
Gizakiek egiten duten modua “ulertu” gabe milioika elkarrizketa imitatzen ikastea bezala da. Eta horrek ez luke funtzionatu behar dirudi... eta hala ere funtzionatzen jarraitzen du.
Gehiegikeria txiki bat: funtsean, giza idazkera probabilitate-garun erraldoi batean konprimitzea bezala da.
Baina, berriz ere, metafora hori madarikatua da. Baina mugitzen gara 😄
8) Begirada hurbilagoa: difusio ereduak (zergatik funtzionatzen duten irudiek modu ezberdinean) 🎨🌀
Irudi-oinarri-ereduek sarritan difusio- metodoak erabiltzen dituzte ( Ho et al., 2020 , Rombach et al., 2021 ).
Ideia orokorrean:
-
Gehitu zarata irudiei telebista estatiko bihurtu arte
-
zarata hori pausoz pauso alderantzikatzeko eredu bat trebatu
-
belaunaldian, zaratarekin hasi eta "zarata kendu" irudi batean, gonbidapen batek gidatuta ( Ho et al., 2020 )
Horregatik irudiak sortzea argazki bat "errebelatzea" bezala sentitzen da, baina argazkia supermerkatu bateko pasillo batean kirol oinetakoak jantzita dragoi bat da 🛒🐉
Difusio ereduak onak dira honako arrazoiengatik:
-
kalitate handiko irudiak sortzen dituzte
-
testuak gogor gidatu ditzake
-
fintze iteratiboa onartzen dute (aldaerak, margotzea, eskalatzea) ( Rombach et al., 2021 )
Batzuetan hauekin ere borrokan aritzen dira:
-
irudien barruko testu-errendatzea
-
anatomia xehetasun finak
-
pertsonaien identitate koherentea eszena guztietan (hobetzen ari da, baina hala ere)
9) Begirada hurbilagoa: oinarri-eredu multimodalak (testua + irudiak + audioa) 👀🎧📝
Oinarri-eredu multimodalek datu mota ugari ulertu eta sortzea dute helburu:
-
testua
-
irudiak
-
audioa
-
bideoa
-
batzuetan sentsore-itxurako sarrerak ( NIST Generative AI Profile )
Zergatik den garrantzitsua hau benetako bizitzan:
-
bezeroarentzako arreta-zerbitzuak pantaila-argazkiak interpretatu ditzake
-
Irisgarritasun tresnek irudiak deskribatu ditzakete
-
hezkuntza aplikazioek diagramak azaldu ditzakete
-
sortzaileek formatuak azkar birnahas ditzakete
-
negozio-tresnek aginte-paneleko pantaila-argazki bat "irakurri" eta laburbildu dezakete
Ezkutuan, sistema multimodalek askotan irudikapenak lerrokatzen dituzte:
-
irudi bat txertatze bihurtu
-
testua txertatze bihurtu
-
ikasi “katua” katu pixelekin bat datorren espazio partekatu bat 😺 ( Radford et al., 2021 )
Ez da beti dotorea. Batzuetan, koltxa bat bezala josita egoten da. Baina funtzionatzen du.
10) Doikuntza fina vs. gonbidapena vs. RAG (nola egokitzen den oinarrizko eredua) 🧰
Oinarrizko eredu bat arlo jakin baterako (zuzenbidea, medikuntza, bezeroarentzako arreta, barne ezagutza) praktiko bihurtzen saiatzen ari bazara, hainbat palanka dituzu:
Gomendioak 🗣️
Azkarrena eta errazena.
-
alde onak: zero entrenamendu, berehalako iterazioa
-
alde txarrak: inkoherentea izan daiteke, testuinguruaren mugak, berehalako hauskortasuna
Doikuntza fina 🎯
Trebatu eredua gehiago zure adibideekin.
-
alde onak: portaera koherenteagoa, domeinu-hizkuntza hobea, gonbidapenen luzera murriztu dezake
-
alde txarrak: kostua, datuen kalitate eskakizunak, gehiegi egokitzeko arriskua, mantentze-lanak
Doikuntza arina (LoRA / egokitzaileak) 🧩
Doikuntza finaren bertsio eraginkorragoa ( Hu et al., 2021 ).
-
abantailak: merkeagoa, modularra, errazagoa trukatzeko
-
alde txarrak: oraindik prestakuntza-bideak eta ebaluazioa behar ditu
RAG (berreskuratze-gehitutako belaunaldia) 🔎
Modeloak zure ezagutza-basetik dokumentu garrantzitsuak lortzen ditu eta horiek erabiliz erantzuten du ( Lewis et al., 2020 ).
-
alde onak: ezagutza eguneratua, barne aipuak (ezartzen baduzu), birziklatze gutxiago
-
alde txarrak: berreskuratze-kalitateak arrakasta edo porrota eragin dezake, zatiketa eta txertatze onak behar ditu
Benetan esanda: sistema arrakastatsu askok gonbidapenak + RAG konbinatzen dituzte. Doikuntza fina indartsua da, baina ez da beti beharrezkoa. Jendeak azkarregi egiten du, ikusgarria dirudielako 😅
11) Arriskuak, mugak eta “mesedez, ez zabaldu hau itsu-itsuan” atala 🧯😬
Oinarrizko ereduak indartsuak dira, baina ez dira software tradizionala bezain egonkorrak. Konfiantza arazoak dituen praktiketan aritzen den ikasle talentudun baten antzekoagoak dira.
Planifikatu beharreko muga nagusiak:
Haluzinazioak 🌀
Modeloek asmatu dezakete:
-
iturri faltsuak
-
datu okerrak
-
urrats sinesgarriak baina okerrak ( Ji et al., 2023 )
Arintzeak:
-
Testuinguru oinarridun RAG ( Lewis et al., 2020 )
-
irteera mugatuak (eskemak, tresna-deiak)
-
"ez asmatu" agindu esplizitua
-
egiaztapen geruzak (arauak, gurutzatutako egiaztapenak, gizakien berrikuspena)
Alborapenak eta eredu kaltegarriak ⚠️
Prestakuntza-datuek gizakiak islatzen dituztenez, hau lor dezakezu:
-
estereotipoak
-
taldeen arteko errendimendu desberdina
-
osaera ez seguruak ( NIST AI RMF 1.0 , Bommasani et al., 2021 )
Arintzeak:
-
segurtasun-doikuntza
-
talde gorria
-
eduki-iragazkiak
-
domeinu-murrizketa zainduak ( NIST Generative AI Profile )
Datuen pribatutasuna eta ihesa 🔒
Datu konfidentzialak modeloaren amaiera-puntu batera sartzen badituzu, jakin behar duzu:
-
nola gordetzen den
-
entrenamendurako erabiltzen den ala ez
-
zer erregistro dago
-
Zein kontrol behar ditu zure erakundeak ( NIST AI RMF 1.0 )
Arintzeak:
-
hedapen pribatuko aukerak
-
gobernantza sendoa
-
datuen esposizio minimoa
-
barne-bakarrik RAG sarbide-kontrol zorrotzarekin ( NIST Generative AI Profile , Carlini et al., 2021 )
Injekzioa berehala (batez ere RAG-arekin) 🕳️
Modeloak testu ez-fidagarria irakurtzen badu, testu horrek manipulatzen saia daiteke:
-
"Aurreko argibideak ez ikusi egin..."
-
«Bidali sekretua…» ( OWASP , Greshake et al., 2023 )
Arintzeak:
-
sistemaren argibideak isolatzea
-
berreskuratutako edukia garbitu
-
erabili tresnetan oinarritutako politikak (ez soilik gonbidapenak)
-
sarrera aurkariekin proba ( OWASP Cheat Sheet , NIST Generative AI Profile )
Ez zaitut beldurtu nahi. Baina... hobe da zoruko oholek non kirrinka egiten duten jakitea.
12) Nola aukeratu oinarri-eredu bat zure erabilera-kasurako 🎛️
Oinarri-eredu bat aukeratzen ari bazara (edo baten gainean eraikitzen ari bazara), hasi galdera hauekin:
Definitu zer sortzen ari zaren 🧾
-
testua bakarrik
-
irudiak
-
audioa
-
misto multimodala
Ezarri zure gertakarien maila 📌
Zehaztasun handia behar baduzu (finantzak, osasuna, legea, segurtasuna):
-
RAG beharko duzu ( Lewis et al., 2020 )
-
baliozkotzea nahi izango duzu
-
gizakien berrikuspena nahi izango duzu begiztan barruan (behintzat batzuetan) ( NIST AI RMF 1.0 )
Erabaki zure latentzia helburua ⚡
Txata berehalakoa da. Multzoen laburpena motelagoa izan daiteke.
Berehalako erantzuna behar baduzu, modeloaren tamaina eta ostatua garrantzitsuak dira.
Maparen pribatutasun eta betetze beharrak 🔐
Talde batzuek honako hau eskatzen dute:
-
tokiko / VPC hedapena
-
datuak gordetzea ez
-
auditoria erregistro zorrotzak
-
dokumentu bakoitzeko sarbide-kontrola ( NIST AI RMF 1.0 , NIST Generative AI Profile )
Aurrekontua orekatu - eta pazientzia operatiboa 😅
Auto-ostatuak kontrola ematen du, baina konplexutasuna gehitzen du.
Kudeatutako APIak errazak dira, baina garestiak eta pertsonalizatzeko modu gutxiagokoak izan daitezke.
Aholku praktiko txiki bat: lehenengo prototipoa egin zerbait errazarekin, gero gogortu. "Konfigurazio perfektuarekin" hasteak normalean dena moteltzen du.
13) Zer dira Oinarrizko Ereduak IA Generatiboan? (Eredu mental azkarra) 🧠✨
Itzul gaitezen berriro. Zer dira Oinarrizko Ereduak IA Generatiboan?
Hauek dira:
-
datu zabaletan entrenatutako eredu orokor handiak ( NIST , Stanford CRFM )
-
edukia (testua, irudiak, audioa, etab.) sortzeko gai dena ( NIST Generative AI Profile )
-
zeregin askotara egokitzeko modukoa, gonbidapenen, doikuntza finaren eta berreskurapenaren bidez ( Bommasani et al., 2021 )
-
IA sortzaile moderno gehienen oinarrizko geruza elikatzen duena
Ez dira arkitektura edo marka bakar bat. Plataforma baten antzera jokatzen duten modeloen kategoria bat dira.
Oinarrizko modelo bat kalkulagailu baten antzekoa baino gehiago sukalde baten antzekoa da. Otordu asko prestatu ditzakezu bertan. Ogi txigortua erre ere egin dezakezu arreta jartzen ez baduzu... baina sukaldea oraindik ere nahiko erabilgarria da 🍳🔥
14) Laburpena eta ondorioak ✅🙂
Oinarri-ereduak IA sortzailearen motor berrerabilgarriak dira. Zabalki entrenatzen dira, eta gero zeregin espezifikoetara egokitzen dira gonbidapenen, doikuntza finduen eta berreskurapenaren bidez ( NIST , Stanford CRFM ). Harrigarriak, nahasiak, indartsuak eta, noizean behin, barregarriak izan daitezke, dena aldi berean.
Laburpena:
-
Oinarrizko eredua = helburu orokorreko oinarrizko eredua ( NIST )
-
AI Generatiboa = edukien sorrera, ez sailkapena bakarrik ( NIST AI Generatiboaren profila )
-
Egokitzapen metodoek (gonbita, RAG, doikuntza) praktiko egiten dute ( Lewis et al., 2020 , Hu et al., 2021 )
-
Modelo bat aukeratzea hainbat konpentsaziotan oinarritzen da: zehaztasuna, kostua, latentzia, pribatutasuna, segurtasuna ( NIST AI RMF 1.0 )
IA generatiboarekin zerbait eraikitzen ari bazara, zimendu-ereduak ulertzea ez da aukerakoa. Eraikina dagoen solairu osoa da... eta bai, batzuetan zorua pixka bat dardarka dago 😅
Maiz egiten diren galderak
Oinarrizko ereduak, modu sinplean esanda
Oinarrizko eredua datu zabaletan trebatutako IA eredu handi eta orokor bat da, zeregin askotan berrerabili ahal izateko. Lan bakoitzeko eredu bakarra eraiki beharrean, "oinarrizko" eredu sendo batekin hasten zara eta beharren arabera egokitzen duzu. Egokitzapen hori askotan gonbidapenen, doikuntza finen, berreskurapenaren (RAG) edo tresnen bidez gertatzen da. Ideia nagusia zabalera gehi gidatzeko gaitasuna da.
Nola desberdintzen diren oinarrizko ereduak ohiko zeregin espezifikoetarako IA ereduetatik
Ohiko IAk askotan zeregin bakoitzerako eredu bereizi bat entrenatzen du, hala nola sentimenduen analisia edo itzulpena. Oinarrizko ereduek eredu hori alderantzikatzen dute: behin aurrez entrenatu, eta gero funtzio eta produktu askotan berrerabili. Horrek ahalegin bikoiztua murriztu eta gaitasun berrien entrega bizkortu dezake. Ordezkoa da software klasikoa baino gutxiago aurreikus daitezkeela, mugak eta probak gehitzen ez badituzu.
Oinarrizko ereduak IA generatiboan
Adimen artifizial sortzailean, oinarrizko ereduak dira testua, irudiak, audioa, kodea edo irteera multimodalak bezalako eduki berriak sor ditzaketen oinarrizko sistemak. Ez daude etiketatzera edo sailkapenera mugatuta; gizakiak egindako lanaren antza duten erantzunak sortzen dituzte. Aurre-prestakuntzan zehar eredu zabalak ikasten dituztenez, gonbidapen mota eta formatu asko kudea ditzakete. Esperientzia sortzaile moderno gehienen atzean dagoen "oinarrizko geruza" dira.
Nola ikasten dute oinarrizko ereduek aurre-prestakuntzan
Hizkuntza-oinarrizko eredu gehienek tokenak iragartzen ikasten dute, hala nola hurrengo hitza edo testuan falta diren hitzak. Helburu soil horrek gramatika, estiloa eta azalpen-eredu arruntak bezalako egiturak barneratzera bultzatzen ditu. Munduko ezagutza handia ere barneratu dezakete, nahiz eta ez beti fidagarria izan. Emaitza geroago lan espezifikoetarako bideratu dezakezun irudikapen orokor sendoa da.
Proposamenaren, doikuntza finaren, LoRAren eta RAGren arteko aldea
Argibideak erabiliz portaera gidatzeko modurik azkarrena gonbidapena da, baina hauskorra izan daiteke. Doikuntza finak eredua zure adibideetan gehiago entrenatzen du portaera koherenteagoa izan dadin, baina kostua eta mantentze-lanak gehitzen ditu. LoRA/egokitzaileak doikuntza finetarako ikuspegi arinagoa dira, askotan merkeagoa eta modularragoa dena. RAG-ek dokumentu garrantzitsuak berreskuratzen ditu eta ereduaren erantzuna testuinguru hori erabiliz lortzen du, eta horrek freskotasuna eta oinarria mantentzen laguntzen du.
Noiz erabili behar da RAG doikuntza finaren ordez
RAG aukera bikaina izan ohi da zure egungo dokumentuetan edo barne ezagutza-basean oinarritutako erantzunak behar dituzunean. "Asmatzeko beharra" murriztu dezake, ereduari testuinguru egokia emanez sorkuntza-garaian. Doikuntza fina egokiagoa da estilo koherentea, domeinu-esaldia edo gonbidapenek fidagarritasunez sortu ezin duten portaera behar dituzunean. Sistema praktiko askok gonbidapena + RAG konbinatzen dituzte doikuntza fina hartu aurretik.
Nola murriztu haluzinazioak eta lortu erantzun fidagarriagoak
Ohiko ikuspegia da eredua berreskurapenarekin (RAG) oinarritzea, emandako testuinguruaren antzekoa izan dadin. Irteerak eskemekin mugatu ditzakezu, urrats gakoetarako tresna-deiak eska ditzakezu eta "ez asmatu" argibide esplizituak gehitu. Egiaztapen-geruzak ere garrantzitsuak dira, hala nola arau-egiaztapenak, gurutzatutako egiaztapena eta gizakien berrikuspena kasu garrantzitsuenetan. Tratatu eredua probabilitate-laguntzaile gisa, ez egiaren iturri gisa lehenespenez.
Oinarri-ereduekin ekoizpenean dauden arrisku handienak
Arrisku ohikoenen artean daude haluzinazioak, entrenamendu-datuetatik datozen eredu alboratuak edo kaltegarriak, eta pribatutasun-ihesak, datu sentikorrak gaizki kudeatzen badira. Sistemak ere zaurgarriak izan daitezke gonbidapen-injekzioen aurrean, batez ere ereduak dokumentuetatik edo web edukietatik fidagarria ez den testua irakurtzen duenean. Arintze-neurrien artean, normalean, gobernantza, talde gorria, sarbide-kontrolak, gonbidapen-eredu seguruagoak eta ebaluazio egituratua daude. Planifikatu arrisku horiei aurre egiteko goiz, geroago konponketak egin beharrean.
Injekzio azkarra eta zergatik den garrantzitsua RAG sistemetan
Prompt injekzioa testu ez-fidagarri batek argibideak gainidazten saiatzen denean gertatzen da, hala nola "aurreko argibideak alde batera utzi" edo "sekretuak agerian utzi". RAG-en, berreskuratutako dokumentuek argibide gaizto horiek izan ditzakete, eta modeloak jarrai diezaieke kontuz ez bazaude. Ohiko ikuspegia sistemaren argibideak isolatzea, berreskuratutako edukia garbitzea eta tresnetan oinarritutako gidalerroetan oinarritzea da, soilik promptsen ordez. Aurkako sarrerak erabiliz probatzeak puntu ahulak agerian uzten laguntzen du.
Nola aukeratu oinarri-eredu bat zure erabilera-kasurako
Hasi sortu behar duzuna definitzen: testua, irudiak, audioa, kodea edo irteera multimodalak. Ondoren, ezarri zure faktualitate-maila - zehaztasun handiko domeinuek askotan oinarriak (RAG), balidazioa eta batzuetan gizakien berrikuspena behar dituzte. Kontuan hartu latentzia eta kostua, motela edo garestia den eredu sendo bat zaila izan daitekeelako bidaltzea. Azkenik, lotu pribatutasun- eta betetze-beharrak hedapen-aukera eta -kontrolekin.
Erreferentziak
-
Estandar eta Teknologia Institutu Nazionala (NIST) - Oinarrizko Eredua (Glosarioko terminoa) - csrc.nist.gov
-
Estandar eta Teknologiaren Institutu Nazionala (NIST) - NIST AI 600-1: IA Sortzailearen Profila - nvlpubs.nist.gov
-
Estandar eta Teknologiaren Institutu Nazionala (NIST) - NIST AI 100-1: AI Arriskuen Kudeaketa Esparrua (AI RMF 1.0) - nvlpubs.nist.gov
-
Stanfordeko Oinarrizko Ereduen Ikerketa Zentroa (CRFM) - Txostena - crfm.stanford.edu
-
arXiv - Fundazio ereduen aukera eta arriskuei buruz (Bommasani et al., 2021) - arxiv.org
-
arXiv - Hizkuntza Ereduak Ikasle Gutxi Batzuk Dira (Brown et al., 2020) - arxiv.org
-
arXiv - Berreskurapen-gehitutako sorkuntza ezagutza intentsiboko NLP zereginetarako (Lewis et al., 2020) - arxiv.org
-
arXiv - LoRA: Hizkuntza Eredu Handien Egokitzapen Maila Baxukoa (Hu et al., 2021) - arxiv.org
-
arXiv - BERT: Hizkuntzaren Ulermenerako Transformadore Bidirekzional Sakonen Aurre-entrenamendua (Devlin et al., 2018) - arxiv.org
-
arXiv - Hizkuntza Eredu Doituak Zero-Shot Ikasleak dira (Wei et al., 2021) - arxiv.org
-
ACM Liburutegi Digitala - Hizkuntza Naturalaren Sorkuntzan Haluzinazioen Inkesta (Ji et al., 2023) - dl.acm.org
-
arXiv - Hizkuntza Naturalaren Gainbegiratzetik Transferi daitezkeen Eredu Bisualak Ikastea (Radford et al., 2021) - arxiv.org
-
arXiv - Zarata kentzeko difusio probabilista ereduak (Ho et al., 2020) - arxiv.org
-
arXiv - Bereizmen handiko irudien sintesia difusio latenteko ereduekin (Rombach et al., 2021) - arxiv.org
-
arXiv - Pasabide Trinkoen Berreskurapena Domeinu Irekiko Galderak Erantzun ahal izateko (Karpukhin et al., 2020) - arxiv.org
-
arXiv - Faiss liburutegia (Douze et al., 2024) - arxiv.org
-
OpenAI - Whisper aurkezten - openai.com
-
arXiv - WaveNet Mel espektrogramaren iragarpenetan baldintzatuz TTS sintesi naturala (Shen et al., 2017) - arxiv.org
-
Segurtasun eta Teknologia Berrien Zentroa (CSET), Georgetown Unibertsitatea - Hurrengo hitzaren iragarpenaren botere harrigarria: hizkuntza-eredu handien azalpena (1. zatia) - cset.georgetown.edu
-
USENIX - Prestakuntza Datuak Hizkuntza Eredu Handietatik Ateratzea (Carlini et al., 2021) - usenix.org
-
OWASP - LLM01: Injekzio azkarra - genai.owasp.org
-
arXiv - Eskatu duzuna baino gehiago: Aplikazioetan integratutako hizkuntza-eredu handiei eragiten dieten injekzio-mehatxu berrien analisi integrala (Greshake et al., 2023) - arxiv.org
-
OWASP Cheat Sheet Series - LLM Injekzioen Prebentzio Berehalako Cheat Sheet - cheatsheetseries.owasp.org