Erantzun laburra: Praktikan funtzionatzen duen IA agente bat eraikitzeko, erabili begizta kontrolatu gisa: hartu sarrera, erabaki hurrengo ekintza, deitu tresna mugatu bat, behatu emaitza eta errepikatu "eginda" egiaztapen garbi bat gainditu arte. Bere lekua irabazten du zeregina urrats anitzekoa eta tresnek bultzatutakoa denean; eskaera bakar batek konpontzen badu, saltatu agentea. Gehitu tresna-eskema zorrotzak, urrats-mugak, erregistroa eta balidatzaile/kritikari bat, tresnek huts egiten dutenean edo sarrerak anbiguoak direnean, agenteak eskala dezan begizta baten ordez.
Ondorio nagusiak:
Kontrolatzaile begizta : Sarrera→ekindu→errepikapena behatu inplementatu, gelditzeko baldintza esplizituekin eta urrats maximoekin.
Tresnen diseinua : Tresnak estu, idatzita, baimenduta eta balioztatuta mantendu, "edozer gauza" kaosa saihesteko.
Memoriaren higienea : Erabili epe laburreko egoera trinkoa eta epe luzeko berreskurapena; saihestu transkripzio osoak botatzea.
Erabilera okerraren aurkako erresistentzia : Gehitu baimendutako zerrendak, tasa mugak, idempotentzia eta "lehorte-exekuzioa" ekintza arriskutsuetarako.
Probagarritasuna : Mantendu eszenatoki multzo bat (hutsegiteak, anbiguotasuna, injekzioak) eta berriro exekutatu aldaketa bakoitzean.

🔗 Nola neurtu IAren errendimendua
Ikasi neurri praktikoak abiadura, zehaztasuna eta fidagarritasuna alderatzeko.
🔗 Nola hitz egin IArekin
Erabili galderak, testuingurua eta jarraipenak erantzun hobeak lortzeko.
🔗 Nola ebaluatu IA ereduak
Konparatu ereduak probak, errubrikak eta benetako munduko zereginen emaitzak erabiliz.
🔗 Nola optimizatu IA ereduak
Hobetu kalitatea eta kostua doikuntza, inausketa eta monitorizazioarekin.
1) Zer den IA agente bat, pertsona normal baten terminoetan 🧠
IA agente bat begizta bat da. LangChain “Agenteak” dokumentuak
Hori da dena. Erdian garun bat duen begizta bat.
Sarrera → pentsatu → ekin → behatu → errepikatu . Erreakzionatu papera (arrazoitu + ekin)
Non:
-
Sarrera erabiltzailearen eskaera edo gertaera bat da (mezu elektroniko berria, laguntza-txartela, sentsore-ping-a).
-
Pentsatu hurrengo urratsari buruzko arrazoiketa egiten duen hizkuntza eredu bat da.
-
Ekintza tresna bat deitzea da (barne dokumentuak bilatu, kodea exekutatu, txartel bat sortu, erantzun bat idatzi). OpenAI funtzioen deitzeko gida
-
Behatu tresnaren irteera irakurtzen ari da .
-
Errepikapena da "hiztun" baten ordez "agentzia" sentiarazten duen zatia. LangChain "Agenteak" dokumentuak
Agente batzuk, funtsean, makro adimendunak dira. Beste batzuek, berriz, operadore gazte baten antzera jokatzen dute, zereginak kudeatu eta erroreetatik berreskuratu ditzaketenak. Biak balio dute.
Gainera, ez duzu autonomia osoa behar. Izan ere… ziurrenik ez duzu nahi izango 🙃
2) Noiz eraiki behar duzun agente bat (eta noiz ez) 🚦
Eraiki agente bat honako kasu hauetan:
-
Lana hainbat urratsez eta erdian gertatzen denaren arabera aldatzen da.
-
Lanak tresnen erabilera (datu-baseak, CRMak, kodearen exekuzioa, fitxategien sorrera, arakatzaileak, barne APIak). LangChain "Tresnak" dokumentuak
-
Emaitza errepikakorrak nahi dituzu babes-hesiekin, ez erantzun puntualak soilik.
-
"Eginda" defini dezakezu ordenagailuak egiaztatu dezakeen moduan, nahiz eta modu zabalagoan izan.
Ez sortu agente bat honako kasu hauetan:
-
Galdera + erantzun soil batek konpontzen du arazoa (ez egin gehiegi ingeniaritzarik, geroago gorroto izango diozu zeure buruari).
-
Determinismo perfektua behar duzu (agenteak koherenteak izan daitezke, baina ez robotikoak).
-
Ez duzu tresnarik edo daturik konektatzeko - orduan gehienbat bibrazioak besterik ez dira.
Izan gaitezen zintzoak: “IA agenteen proiektuen” erdia adarkatze-arau batzuekin lan-fluxu bat izan liteke. Baina tira, batzuetan giroak ere garrantzia du 🤷♂️
3) Zerk egiten du IA agente baten bertsio ona ✅
Hona hemen eskatu duzun "Zerk egiten du bertsio ona" atala, baina pixka bat zakarra izango naiz:
IA agente baten bertsio ona ez gogorren pentsatzen duena. Honako hauek egiten dituena da:
-
Badaki zer egin dezakeen (esparru-mugak)
-
Tresnak modu fidagarrian erabiltzen ditu (dei egituratuak, berriro saiakerak, denbora-mugak) OpenAI Funtzioen deien gida AWS "Denbora-mugak, berriro saiakerak eta atzera-egitea dardara batekin"
-
Egoera garbi mantentzen du (usteltzen ez den memoria) LangChain "Memoriaren ikuspegi orokorra"
-
Bere ekintzak azaltzen ditu (auditoria-aztarnak, ez arrazoiketa sekretuen biltegiratzeak) NIST AI RMF 1.0 (fidagarritasuna eta gardentasuna)
-
Behar bezala gelditzen da (osaketa-egiaztapenak, gehienezko urratsak, eskalatzea) LangChain "Agenteak" dokumentuak
-
Segurtasunez huts egiten du (laguntza eskatzen du, ez du autoritatearen haluzinaziorik egiten) NIST AI RMF 1.0
-
Probagarria da (eszenatoki aurrez prestatuetan exekutatu eta emaitzak puntuatu ditzakezu)
Zure agentea probatu ezin bada, funtsean oso ziurra den slot-makina bat da. Festetan dibertigarria, ekoizpenean izugarria 😬
4) Agente baten oinarrizko eraikuntza-blokeak ("anatomia" 🧩)
Agente solido gehienek pieza hauek dituzte:
A) Kontrolatzaile begizta 🔁
Hau da orkestratzailea:
-
gola hartu
-
galdetu ereduari hurrengo ekintzarako
-
exekutatu tresna
-
behaketa erantsi
-
errepikatu amaitu arte LangChain "Agenteak" dokumentuak
B) Tresnak (hau da, gaitasunak) 🧰
Tresnak dira agente bat eraginkorra egiten dutenak: LangChain-en "Tresnak" dokumentuak
-
datu-baseko kontsultak
-
mezu elektronikoak bidaltzea
-
fitxategiak ateratzea
-
exekutatzen ari den kodea
-
barneko APIak deitzea
-
kalkulu-orrietan edo CRMetan idaztea
C) Memoria 🗃️
Bi motatako garrantzia dute:
-
epe laburreko memoria : uneko lasterketaren testuingurua, azken urratsak, uneko plana
-
epe luzeko memoria : erabiltzailearen lehentasunak, proiektuaren testuingurua, berreskuratutako ezagutza (askotan txertatzeen bidez + bektore-biltegi baten bidez) RAG papera
D) Plangintza eta erabaki politika 🧭
“Plangintza” deitzen ez badiozu ere, metodo bat behar duzu:
-
kontrol-zerrendak
-
ReAct estiloko “pentsatu eta gero tresna” ReAct dokumentua
-
zereginen grafikoak
-
gainbegirale-langile ereduak
-
gainbegirale-langile ereduak Microsoft AutoGen (agente anitzeko esparrua)
E) Babes-hesiak eta ebaluazioa 🧯
-
baimenak
-
tresna eskema seguruak OpenAI egituratutako irteerak
-
irteeraren baliozkotzea
-
urrats mugak
-
erregistroa
-
NIST AI RMF 1.0 probak
Bai, ingeniaritza kontua da gehiago, bultzada ematea baino. Hori da... neurri batean kontua.
5) Konparazio taula: agente bat eraikitzeko modu ezagunak 🧾
Jarraian "Konparazio Taula" errealista bat dago - berezitasun batzuekin, benetako taldeak bereziak baitira 😄
| Tresna / Esparrua | Publikoa | Prezioa | Zergatik funtzionatzen duen | Oharrak (kaos txikia) | |
|---|---|---|---|---|---|
| LangChain | Lego estiloko osagaiak gustuko dituzten eraikitzaileak | doakoa + infra | tresnentzako, memoriarentzako eta kateentzako ekosistema handia | Gauzei argi izena jartzen ez badiezu, espagetiak azkar jan ditzakezu | |
| LlamaIndex | RAG-eko talde astunak | doakoa + infra | berreskuratze-eredu sendoak, indexazioa, konektoreak | bikaina zure agentea funtsean "bilatu + jardun" egiten duenean... eta hori ohikoa da | |
| OpenAI Assistants estiloko ikuspegia | konfigurazio azkarragoa nahi duten taldeek | erabileran oinarritutako | tresna-deitzeko eredu integratuak eta exekuzio-egoera | txoko batzuetan malgutasun gutxiagokoa, baina aplikazio askotarako garbia | OpenAI exekutatzen du APIa OpenAI laguntzaileen funtzio deiak |
| Nukleo semantikoa | egituratutako orkestrazioa nahi duten garatzaileak | doakoa | trebetasun/funtzioetarako abstrakzio garbia | "Enpresa txukun" baten itxura ematen du - batzuetan hori laudorio bat da 😉 | |
| AutoGen | agente anitzeko esperimentatzaileak | doakoa | agenteen arteko lankidetza-ereduak | gehiegi hitz egin dezake; kaleratzeko arau zorrotzak ezarri | |
| CrewAI | "Agente taldeak" zaleen | doakoa | rolak + zereginak + eskualdatzeak erraz adieraz daitezke | Hobekien funtzionatzen du zereginak garbiak direnean, ez bigunak | |
| Lasto-pila | bilaketa + jendea bideratzea | doakoa | hodi solidoak, berreskurapena, osagaiak | “agente-antzerki” gutxiago, “fabrika praktiko” gehiago | |
| Zeure burua biribildu (begizta pertsonalizatua) | kontrol zaleak (maitekorrak) | zure denbora | magia gutxieneko, argitasun maximoa | normalean epe luzerako onena... dena berrasmatu arte 😅 |
Ez dago irabazle bakar bat ere. Aukerarik onena zure agentearen lan nagusia berreskuratzea , tresnen exekuzioa , agente anitzeko koordinazioa edo lan-fluxuen automatizazioa den .
6) Nola eraiki IA agente bat pausoz pauso (benetako errezeta) 🍳🤖
Hau da jende gehienak saltatzen duen zatia, eta gero galdetzen dute zergatik jokatzen duen agenteak despentsa bateko mapache bat bezala.
1. urratsa: Definitu lana esaldi batean 🎯
Adibideak:
-
"Idatzi bezeroaren erantzun bat politika eta txartelaren testuingurua erabiliz, eta gero eskatu onarpena."
-
"Akatsen txosten bat ikertu, erreproduzitu eta konponketa bat proposatu."
-
"Bihurtu bilera-ohar inperfektuak zeregin, jabe eta epeak."
Ezin baduzu modu sinplean definitu, zure agenteak ere ezin du. Alegia, bai, baina inprobisatuko du, eta inprobisazioa da aurrekontuak hiltzen diren tokia.
2. urratsa: Erabaki autonomia maila (baxua, ertaina, pikantea) 🌶️
-
Autonomia baxua : urratsak iradokitzen ditu, gizakien klikak "onartu" egiten du
-
Ertaina : tresnak exekutatzen ditu, irteera zirriborratzen du, ziurgabetasuna areagotzen du
-
Altua : muturretik muturrera exekutatzen da, salbuespenetan gizakiei ping egiten die soilik
Hasi nahi baino baxuago. Beti igo dezakezu geroago.
3. urratsa: Aukeratu zure eredu estrategia 🧠
Normalean hau aukeratzen duzu:
-
eredu sendo bat denetarako (sinplea)
-
eredu sendo bat + eredu txikiagoa urrats merkeak lortzeko (sailkapena, bideratzea)
-
eredu espezializatuak (ikusmena, kodea, hizketa) behar izanez gero
Erabaki ere:
-
token maximoak
-
tenperatura
-
barnean arrazoiketa-aztarna luzeak baimentzen dituzun ala ez (bai, baina ez erakutsi pentsamendu-kate gordina azken erabiltzaileei)
4. urratsa: Definitu tresnak eskema zorrotzekin 🔩
Tresnak hauek izan beharko lirateke:
-
estu
-
idatzita
-
baimenduta
-
OpenAI egituratutako irteera balioztatuak
`do_anything(input: string)` izeneko tresnaren ordez , egin hau:
-
search_kb(kontsulta: string) -> emaitzak[] -
sortu_txartela(izenburua: katea, gorputza: katea, lehentasuna: enum) -> txartelaren_id -
send_mail(to: string, subject: string, body: string) -> statusOpenAI funtzioen deitzeko gida
Agenteari motozerra bat ematen badiozu, ez harritu hesia ere kenduz heskaia inausten duenean.
5. urratsa: Eraiki kontrolatzaile-begizta 🔁
Gutxieneko begizta:
-
Hasi helburuarekin + hasierako testuinguruarekin
-
Galdetu ereduari: "Hurrengo ekintza?"
-
Tresna deitzen bada - tresna exekutatu
-
Erantsi behaketa
-
Geldialdi egoera egiaztatu
-
Errepikatu (gehienezko urratsekin) LangChain "Agenteak" dokumentuak
Gehitu:
-
denbora-mugak
-
saiakerak (kontuz - saiakerak begizta egin dezakete) AWS "Denbora-mugak, saiakerak eta atzera-egitea dardararekin"
-
tresnaren errore formatua (argia, egituratua)
6. urratsa: Kontu handiz gehitu memoria 🗃️
Epe laburra: "egoeraren laburpen" trinkoa eguneratuta mantendu urrats bakoitzean. LangChain "Memoriaren ikuspegi orokorra".
Epe luzera: datu iraunkorrak gorde (erabiltzaileen lehentasunak, erakundearen arauak, dokumentu egonkorrak).
Arau orokorra:
-
maiz aldatzen bada - epe laburrean mantendu
-
egonkorra bada - epe luzerako gorde
-
Sentikorra bada - gutxien gorde (edo batere ez)
7. urratsa: Gehitu balidazioa eta "kritikari" baimena 🧪
Eredu merkea eta praktikoa:
-
agenteak emaitza sortzen du
-
Balidatzaileak egitura eta mugak egiaztatzen ditu
-
NIST AI RMF 1.0 urrats falta edo politika-urraketak egiteko aukerako kritiko-ereduen berrikuspenak
Ez da perfektua, baina zentzugabekeria kopuru harrigarri bat harrapatzen du.
8. urratsa: Damutuko zaren guztia erregistratu ez izanaz 📜
Erregistroa:
-
Tresna deiak + sarrerak + irteerak
-
hartutako erabakiak
-
erroreak
-
azken irteerak
-
tokenak eta latentzia OpenTelemetry behagarritasun-hasiera
Etorkizuna - eskerrak emango dizkizu. Oraina - ahaztu egingo duzu. Hori da bizitza, besterik gabe 😵💫
7) Arima hautsi ez dizun tresna deia 🧰😵
Tresna-deiak da “Nola eraiki IA agente bat” benetako software ingeniaritza bihurtzen den tokia.
Egin tresnak fidagarriak (fidagarria izatea ona da)
Tresna fidagarriak hauek dira:
-
determinista
-
esparru mugatuan
-
erraza probatzeko
-
Seguru berriro exekutatzea Stripe "Idempotent eskaerak"
Gehitu babes-hesiak tresna-geruzan, ez bakarrik gonbidapenak
Galderak iradokizun adeitsuak dira. Tresnen balidazioa ate itxi bat da. OpenAI egituratutako irteerak
Egin:
-
baimendutako zerrendak (zein tresnak exekutatu daitezkeen)
-
sarreraren baliozkotzea
-
Abiadura-mugak OpenAI Abiadura-mugen gida
-
erabiltzaile/erakunde bakoitzeko baimen-egiaztapenak
-
"Ekintza arriskutsuetarako exekuzio lehor modua"
Hutsune partzialerako diseinua
Tresnak huts egiten dute. Sareak dardarka daude. Baimena iraungitzen da. Agente batek honako hau egin behar du:
-
erroreak interpretatu
-
berriro saiatu atzerapenarekin, egokia denean Google Cloud-en berriro saiatzeko estrategia (atzerapen + dardara)
-
tresna alternatiboak aukeratu
-
trabatuta dagoenean areagotu
Trikimailu isila eta eraginkorra: errore egituratuak itzultzea, adibidez:
-
mota: auth_error -
mota: ez_aurkitu -
mota: rate_limited
Beraz, ereduak modu adimentsuan erantzun dezake izutu beharrean.
8) Jazarri beharrean laguntzen dizun oroitzapena 👻🗂️
Memoria boteretsua da, baina zabor-tirader bat ere bihur daiteke.
Epe laburreko memoria: trinkoa mantendu
Erabili:
-
azken N urratsak
-
laburpen bat (begizta bakoitzean eguneratzen da)
-
egungo plana
-
egungo mugak (aurrekontua, denbora, politikak)
Dena testuinguruan jartzen baduzu, hau lortuko duzu:
-
kostu handiagoa
-
latentzia motelagoa
-
nahasmen gehiago (bai, orduan ere)
Epe luzeko memoria: berreskurapena “betetzearen” gainetik
"Epe luzeko memoria" gehiena honelakoa da:
-
txertatzeak
-
bektore denda
-
Berreskuratze areagotuko belaunaldia (RAG) RAG papera
Agenteak ez du memorizatzen. Exekuzio-garaian zati garrantzitsuenak berreskuratzen ditu. LlamaIndex “RAG-ren sarrera”
Memoria praktikoaren arauak
-
Gorde "lehentasunak" datu esplizitu gisa: "Erabiltzaileari puntu laburpenak gustatzen zaizkio eta emojiak gorroto ditu" (kar, baina ez hemen 😄)
-
Gorde "erabakiak" denbora-zigiluekin edo bertsioekin (bestela, kontraesanak pilatzen dira)
-
Ez gorde sekreturik benetan beharrezkoa ez bazara behintzat
Eta hona hemen nire metafora inperfektua: memoria hozkailu bat bezalakoa da. Inoiz ez baduzu garbitzen, azkenean zure ogitartekoak tipula eta damu zaporea izango du.
9) Plangintza-ereduak (sinpleetatik dotoreetaraino) 🧭✨
Plangintza kontrolatutako deskonposizioa besterik ez da. Ez bihurtu mistikoa.
A eredua: Kontrol-zerrendaren planifikatzailea ✅
-
Modeloak urratsen zerrenda bat ematen du
-
Pausoz pauso exekutatzen du
-
Kontrol-zerrendaren egoera eguneratzen du
Bikaina hasierako urratsetarako. Sinplea, probagarria.
B eredua: Erreakzionatu begizta (arrazoimena + ekintza) 🧠→🧰
-
Modeloak hurrengo tresna deia erabakitzen du
-
irteera behatzen du
-
ReAct papera errepikatzen du
Hau da agente baten sentsazio klasikoa.
C eredua: Gainbegirale-langilea 👥
-
gainbegiraleak helburua zereginetan banatzen du
-
langileek zeregin espezializatuak egiten dituzte
-
gainbegiraleak emaitzak batzen ditu Microsoft AutoGen (agente anitzeko esparrua)
Baliotsua da hau zereginak paralelizagarriak direnean edo "rol" desberdinak nahi dituzunean, hala nola:
-
ikertzaile
-
kodetzaile
-
editore
-
QA egiaztatzailea
D eredua: Planifikatu-gero-exekutatu berriro planifikatuz 🔄
-
plana sortu
-
exekutatu
-
Tresnen emaitzek errealitatea aldatzen badute, berriro planifikatu
Horrek agenteari plan txar bat temati jarraitzea eragozten dio. Gizakiek ere gauza bera egiten dute, nekatuta ez badaude behintzat, eta kasu horretan plan txarrak ere jarraitzen dituzte.
10) Segurtasuna, fidagarritasuna eta kaleratuak ez izatea 🔐😅
Zure agenteak ekintzak egin ditzakeenez gero, segurtasun-diseinua behar duzu. Ez da "ona izatea". Beharrezkoa. NIST AI RMF 1.0
Muga zorrotzak
-
gehienezko urratsak korrika bakoitzeko
-
tresna dei maximoak minutuko
-
saio bakoitzeko gastu maximoa (token aurrekontua)
-
tresna mugatuak baimenduta
Datuen kudeaketa
-
ezabatu sarrera sentikorrak saioa hasi aurretik
-
ingurune bereiziak (garapena vs. ekoizpena)
-
gutxieneko pribilegioko tresnen baimenak
Portaera-mugak
-
behartu agentea barneko ebidentzia zatiak aipatzera (ez kanpoko estekak, barne erreferentziak bakarrik)
-
Ziurgabetasun banderak behar dira konfiantza baxua denean
-
Sarrerak anbiguoak badira, "argitzeko galdera egin" behar da
Agente fidagarria ez da ziurrena. Asmatzen ari denean dakiena da... eta hala esaten duena.
11) Probak eta ebaluazioa (denek saihesten duten zatia) 🧪📏
Ezin duzu neurtu ezin duzuna hobetu. Bai, esaldi hori txorakeria da, baina egia gogaikarria da.
Eszenatoki multzo bat eraiki
Sortu 30-100 proba kasu:
-
bide zoriontsuak
-
muturreko kasuak
-
"Tresna huts egiten" kasuak
-
eskaera anbiguoak
-
aurkaritzako galderak (injekzio saiakerak) OWASP Top 10 LLM aplikazioetarako OWASP LLM01 Injekzio Galdera
Puntuazio emaitzak
Erabili metrika hauek:
-
zereginaren arrakasta-tasa
-
osatzeko denbora
-
tresnaren erroreak berreskuratzeko tasa
-
haluzinazio-tasa (frogarik gabeko baieztapenak)
-
gizakien onespen-tasa (gainbegiratu moduan badago)
Erregresio probak gonbidapen eta tresnetarako
Aldatzen duzun bakoitzean:
-
tresna eskema
-
sistemaren argibideak
-
berreskuratze logika
-
memoria formatua
Exekutatu suitea berriro.
Agenteak piztia sentikorrak dira. Etxeko landareak bezala, baina garestiagoak.
12) Zure aurrekontua urtzen ez duten hedapen-ereduak 💸🔥
Zerbitzu bakar batekin hasi
-
agenteen kontrolatzaile APIa
-
atzean dauden tresna-zerbitzuak
-
erregistroa + monitorizazioa OpenTelemetry behagarritasun-hasiera
Gehitu kostuen kontrolak goiz
-
berreskuratze-emaitzak cachean gordetzea
-
elkarrizketaren egoera laburpenekin konprimitzea
-
bideratzeko eta erauzteko modelo txikiagoak erabiliz
-
"Pentsamendu sakonaren modua" urrats zailenetara mugatzea
Arkitektura aukera arrunta
-
kontrolatzaile egoerarik gabekoa + kanpoko egoera biltegia (DB/redis)
-
Tresna-deiak ahal den guztietan idempotenteak dira Stripe-ren "Idempotente eskaerak"
-
zeregin luzeetarako ilaran (web eskaera bat betiko irekita ez edukitzeko)
Era berean: eraiki "etengailu bat". Ez duzu beharko benetan, benetan behar izan arte 😬
13) Amaierako oharrak - IA agente bat nola eraiki buruzko bertsio laburra 🎁🤖
Beste ezer gogoratzen ez baduzu, gogoratu hau:
-
IA agente bat nola eraiki, batez ere eredu baten inguruan begizta seguru bat eraikitzea da kontua. LangChain "Agenteak" dokumentuak
-
Hasi helburu zehatz batekin, autonomia txiki batekin eta tresna zorrotzekin. OpenAI egituratutako irteerak
-
Gehitu memoria berreskurapenaren bidez, ez testuinguru-betetze amaigabearen bidez. RAG papera
-
Plangintza erraza izan daiteke: kontrol-zerrendek eta berriro planifikatzeak asko laguntzen dute.
-
Erregistroek eta probek agenteen kaosa bidal dezakezun zerbait bihurtzen dute. OpenTelemetry behaketa-gaitasunaren hastapenak
-
Babes-hesiak kodean egon behar dira, ez bakarrik aginduetan. OWASP LLM aplikazioetarako 10 onenak
Agente bat ez da magia. Baliotsua izateko bezainbeste erabaki onak hartzen dituen sistema bat da... eta kalteak eragin aurretik porrota onartzen duena. Isil-isilik lasaigarria, nolabait 😌
Eta bai, ondo eraikitzen baduzu, inoiz lo egiten ez duen, noizean behin izutzen den eta paper-lana maite duen praktikatzaile digital txiki bat kontratatzea bezala da. Beraz, funtsean, praktikatzaile bat.
Maiz egiten diren galderak
Zer da IA agente bat, modu sinplean esanda?
IA agente bat, funtsean, errepikatzen den begizta bat da: sarrera hartu, hurrengo urratsa erabaki, tresna bat erabili, emaitza irakurri eta amaitu arte errepikatu. "Agente" zatia jardutetik eta behatzetik dator, ez txateatzeaz bakarrik. Agente asko tresnetarako sarbidea duten automatizazio adimendunak besterik ez dira, eta beste batzuk, berriz, erroreetatik berreskuratu daitezkeen operadore junior baten antzera jokatzen dute.
Noiz eraiki behar dut IA agente bat gonbita bat erabili beharrean?
Eraiki agente bat lana urrats anitzekoa denean, tarteko emaitzetan oinarritutako aldaketak egiten direnean eta tresna fidagarriak behar direnean (APIak, datu-baseak, ticketing-a, kodearen exekuzioa). Agenteak ere erabilgarriak dira emaitza errepikagarriak nahi dituzunean, babes-hesiekin eta "eginda dagoela" egiaztatzeko modu batekin. Erantzun azkar eta sinple batek funtzionatzen badu, agente bat normalean gastu gehigarriak eta hutsegite moduak sortzen ditu.
Nola eraiki dezaket begiztetan trabatuta geratzen ez den IA agente bat?
Erabili gelditze-baldintza gogorrak: urrats maximoak, tresna-dei maximoak eta osatze-egiaztapen garbiak. Gehitu egituratutako tresna-eskemak, denbora-mugak eta betiko berriro saiatuko ez diren berriro saiatuko diren saiakerak. Erregistratu erabakiak eta tresnen irteerak, non huts egiten duen ikusteko. Segurtasun-balbula ohikoa eskalatzea da: agentea ziurgabe badago edo akatsak errepikatzen baditu, laguntza eskatu beharko luke inprobisatu beharrean.
Zein da IA agente bat nola eraiki libururako gutxieneko arkitektura?
Gutxienez, ereduari helburu eta testuinguru bat ematen dion, hurrengo ekintza eskatzen duen, eskatuz gero tresna bat exekutatzen duen, behaketa eransten duen eta errepikatzen duen kontrolatzaile-begizta bat behar duzu. Sarrera/irteera forma zorrotzak eta "egindako" egiaztapena duten tresnak ere behar dituzu. Zure burua sortzeko begizta batek ere ondo funtziona dezake egoera garbi mantentzen baduzu eta urratsen mugak betearazten badituzu.
Nola diseinatu behar dut tresnen deiak ekoizpenean fidagarriak izan daitezen?
Mantendu tresnak estu, idatzita, baimenduta eta balioztatuta — saihestu "edozer egin" tresna generiko bat. Hobetsi eskema zorrotzak (irteera egituratuak/funtzio deiak bezala) agenteak sarrerak eskuz ez manipulatzeko. Gehitu baimendutako zerrendak, abiadura mugak eta erabiltzaile/erakunde baimen egiaztapenak tresna geruzan. Diseinatu tresnak berriro exekutatzeko seguruak izan daitezen ahal den guztietan, idempotentzia ereduak erabiliz.
Zein da agentea okerrera egin gabe memoria gehitzeko modurik onena?
Memoria bi zatitan tratatu: epe laburreko exekuzio-egoera (azken urratsak, uneko plana, mugak) eta epe luzeko berreskurapena (lehentasunak, arau egonkorrak, dokumentu garrantzitsuak). Mantendu epe laburreko laburpen trinkoa, ez transkripzio osoekin. Epe luzeko memoriarako, berreskurapenak (txertatzeak + bektoreen biltegiratzea/RAG ereduak) normalean dena testuinguruan "sartzea" eta eredua nahastea baino hobea da.
Zein plangintza-eredu erabili behar dut: kontrol-zerrenda, ReAct edo gainbegirale-langilea?
Kontrol-zerrenda planifikatzailea bikaina da zereginak aurreikusgarriak direnean eta probatzeko erraza den zerbait nahi duzunean. ReAct estiloko begiztak bikainak dira tresnen emaitzek hurrengoan zer egiten duzun aldatzen dutenean. Gainbegirale-langile ereduak (AutoGen estiloko rolen bereizketa bezala) lagungarriak dira zereginak paraleloan jar daitezkeenean edo rol bereizietatik (ikertzailea, kodetzailea, QA) etekina atera daitekeenean. Planifikatu-gero exekutatu birplanifikazioarekin erdibide praktikoa da plan txar tematiak saihesteko.
Nola egin dezaket agente bat seguru ekintza errealak egin badezake?
Erabili pribilegio gutxieneko baimenak eta mugatu arrisku handiko tresnak onarpen edo "exekuzio lehor" moduen atzean. Gehitu aurrekontuak eta mugak: urrats maximoak, gastu maximoa eta minutuko tresnen deien mugak. Ezabatu datu sentikorrak saioa hasi aurretik, eta bereizi garapen-inguruneetatik. Eskatu ziurgabetasun-banderak edo argitzeko galderak sarrerak anbiguoak direnean, konfiantzak frogak ordezkatu beharrean.
Nola probatu eta ebaluatu dezaket IA agente bat denboran zehar hobetu dadin?
Eraiki eszenatoki multzo bat bide zoriontsuekin, ertzeko kasuekin, tresnen hutsegiteekin, eskaera anbiguoekin eta gonbite-injekzio saiakerekin (OWASP estilokoa). Emaitzak puntuatu, hala nola zereginaren arrakasta, osatzeko denbora, tresnen erroreetatik berreskuratzea eta frogarik gabeko erreklamazioak. Tresnen eskemak, gonbitak, berreskurapena edo memoriaren formatua aldatzen dituzun bakoitzean, berriro exekutatu multzoa. Probatu ezin baduzu, ezin duzu fidagarritasunez bidali.
Nola zabaldu dezaket agente bat latentzia eta kostuak handitu gabe?
Eredu ohikoena kanpoko egoera-biltegi batekin (DB/Redis), atzean tresna-zerbitzuekin eta erregistro/monitorizazio sendoarekin (askotan OpenTelemetry) kontrolatu kostuak berreskuratze-cachearekin, egoera-laburpen trinkoekin, bideratze/ateratzerako eredu txikiagoekin eta "pentsamendu sakona" urrats zailenetara mugatuz. Erabili ilarak zeregin luzeetarako, web eskaerak irekita ez edukitzeko. Sartu beti hiltzeko etengailu bat.
Erreferentziak
-
Estandar eta Teknologia Institutu Nazionala (NIST) - NIST AI RMF 1.0 (fidagarritasuna eta gardentasuna) - nvlpubs.nist.gov
-
OpenAI - Irteera egituratuak - platform.openai.com
-
OpenAI - Funtzioen deialdiaren gida - platform.openai.com
-
OpenAI - Tasa-mugen gida - platform.openai.com
-
OpenAI - APIa exekutatzen du - platform.openai.com
-
OpenAI - Laguntzaileen funtzioen deiak - platform.openai.com
-
LangChain - Agenteen dokumentuak (JavaScript) - docs.langchain.com
-
LangChain - Tresnen dokumentazioa (Python) - docs.langchain.com
-
LangChain - Memoriaren ikuspegi orokorra - docs.langchain.com
-
arXiv - ReAct artikulua (arrazoia + ekintza) - arxiv.org
-
arXiv - RAG artikulua - arxiv.org
-
Amazon Web Services (AWS) Builders' Library - Denbora-mugak, berriro saiakerak eta atzerapenak dardaradun - aws.amazon.com
-
OpenTelemetry - Behagarritasun hastapenak - opentelemetry.io
-
Stripe - Idempotente eskaerak - docs.stripe.com
-
Google Cloud - Berriro saiatzeko estrategia (atzerapena + dardara) - docs.cloud.google.com
-
OWASP - Hizkuntza Eredu Handiko Aplikazioetarako 10 Onenak - owasp.org
-
OWASP - LLM01 Injekzio Berehalakoa - genai.owasp.org
-
LlamaIndex - Sarrera RAG-era - developers.llamaindex.ai
-
Microsoft - Nukleo Semantikoa - learn.microsoft.com
-
Microsoft AutoGen - Agente anitzeko esparrua (dokumentazioa) - microsoft.github.io
-
CrewAI - Agenteen kontzeptuak - docs.crewai.com
-
Haystack (sakonera) - Berreskuratzaileen dokumentazioa - docs.haystack.deepset.ai