Kode irekiko IAri buruz hitz egiten da dena desblokeatzen duen giltza magiko bat balitz bezala. Ez da hala. Baina da ulertu, hobetu eta bidali ditzakezun IA sistemak eraikitzeko, saltzaile bati etengailu bat sakatu beharrik gabe. Zer den "irekia" dena, zer den marketina besterik ez eta nola erabili lanean galdetu badiozu zeure buruari, leku egokian zaude. Hartu kafe bat - baliagarria izango da, eta agian iritzi pixka bat emango dizu ☕🙂.
Honen ondoren irakurri nahi izango dituzun artikuluak:
🔗 Nola txertatu IA zure negozioan
Negozioen hazkunde adimentsuago bat lortzeko IA tresnak integratzeko urrats praktikoak.
🔗 Nola erabili IA produktiboagoa izateko
Ezagutu denbora aurrezten eta eraginkortasuna areagotzen duten IA lan-fluxu eraginkorrak.
🔗 Zer dira IA trebetasunak?
Ikasi etorkizunerako prestatutako profesionalentzat ezinbestekoak diren IA gaitasun nagusiak.
🔗 Zer da Google Vertex AI?
Ulertu Google-ren Vertex AI eta nola errazten duen ikaskuntza automatikoa.
Zer da kode irekiko adimen artifiziala? 🤖🔓
Bere sinpleenean, IA kode irekikoak esan nahi du IA sistema baten osagaiak —kodea, modeloen pisuak, datu-bideak, entrenamendu-gidoiak eta dokumentazioa— edonork erabili, aztertu, aldatu eta partekatzeko aukera ematen duten lizentzien pean kaleratzen direla, baldintza arrazoizkoen arabera. Askatasun-hizkuntza nagusia Kode Irekiaren Definiziotik eta erabiltzaile-askatasunaren printzipio zaharretatik dator [1]. IAren alde txarra da kodea baino osagai gehiago daudela.
Proiektu batzuek dena argitaratzen dute: kodea, entrenamendu datu iturriak, errezetak eta entrenatutako eredua. Beste batzuek pisuak bakarrik argitaratzen dituzte lizentzia pertsonalizatu batekin. Ekosistemak batzuetan laburdura nahasia erabiltzen du, beraz, hurrengo atalean txukunduko dugu.
Kode irekiko IA vs pisu irekiak vs sarbide irekia 😅
Hemen da jendeak elkarren gainetik hitz egiten duen lekua.
-
Kode Irekiko AI — Proiektuak kode irekiko printzipioak jarraitzen ditu bere multzo osoan. Kodea OSIk onartutako lizentzia baten pean dago, eta banaketa-baldintzek erabilera, aldaketa eta partekatze zabala ahalbidetzen dute. Hemen dagoen espirituak OSIk deskribatzen duena islatzen du: erabiltzailearen askatasuna lehenesten da [1][2].
-
Pisu irekiak — Entrenatutako eredu-pisuak deskargatu daitezke (askotan doan) baina neurrira egindako baldintzen pean. Erabilera-baldintzak, birbanaketa-mugak edo txosten-arauak ikusiko dituzu. Metaren Llama familiak hori erakusten du: kode-ekosistema nahiko irekia da, baina eredu-pisuak erabileran oinarritutako baldintzekin lizentzia espezifiko baten pean banatzen dira [4].
-
Sarbide irekia — API bat erabil dezakezu, agian doan, baina ez dituzu pisuak lortzen. Esperimentaziorako lagungarria da, baina ez da kode irekikoa.
Hau ez da semantika bakarrik. Zure eskubideak eta arriskuak kategoria hauetan zehar aldatzen dira. OSIren egungo IA eta irekitasunari buruzko lanak ñabardura horiek hizkuntza arruntean azaltzen ditu [2].
Zerk egiten du iturburu irekiko IA benetan ona ✅
Izan gaitezen azkar eta zintzo.
-
Auditagarritasuna — Kodea irakurri, datu-errezetak ikuskatu eta prestakuntza-urratsak jarrai ditzakezu. Horrek betetzearekin, segurtasun-berrikuspenekin eta jakin-min zaharrekoarekin laguntzen du. NIST AI Arriskuen Kudeaketa Esparruak dokumentazio- eta gardentasun-praktikak sustatzen ditu, proiektu irekiek errazago ase ditzaketenak [3].
-
Moldagarritasuna — Ez zaude saltzaile baten bide-orrian mugatuta. Bidali. Konpondu. Bidali. Lego, ez itsatsitako plastikoa.
-
Kostuen kontrola — Auto-ostatatu merkeagoa denean. Hodeira igo merkeagoa denean. Hardwarea nahastu eta konbinatu.
-
Komunitatearen abiadura — Akatsak konpontzen dira, ezaugarriak agertzen dira eta kideengandik ikasten duzu. Nahasia? Batzuetan. Produktiboa? Askotan.
-
Gobernantzaren argitasuna — Benetako lizentzia irekiak aurreikus daitezke. Konparatu hori astearteetan isilean aldatzen diren API Zerbitzu Baldintzekin.
Perfektua al da? Ez. Baina orekak irakurgarriak dira - kutxa beltzeko zerbitzu askotan lortzen duzuna baino gehiago.
Kode irekiko IA pila: kodea, pisuak, datuak eta itsasgarria 🧩
Pentsa ezazu IA proiektu bat lasagna berezi bat bezala. Geruzak nonahi.
-
Esparruak eta exekuzio-denborak — Modeloak definitzeko, entrenatzeko eta zerbitzatzeko tresnak (adibidez, PyTorch, TensorFlow). Komunitate eta dokumentu osasuntsuek marka-izenak baino garrantzi handiagoa dute.
-
Eredu arkitekturak — Planoa: transformadoreak, difusio ereduak, berreskuratze-handitutako konfigurazioak.
-
Pisuak — Entrenamenduan zehar ikasitako parametroak. "Irekia" hemen birbanaketa eta erabilera komertzialeko eskubideen araberakoa da, ez deskargatzeko gaitasunaren araberakoa soilik.
-
Datuak eta errezetak — Zaintza-gidoiak, iragazkiak, gehikuntzak, prestakuntza-egutegiak. Gardentasuna hemen urrezkoa da erreproduzigarritasunerako.
-
Tresnak eta orkestrazioa — Inferentzia zerbitzariak, bektore datu-baseak, ebaluazio-arnesak, behagarritasuna, CI/CD.
-
Lizentziak — Zer egin dezakezun erabakitzen duen bizkarrezurra. Informazio gehiago behean.
Kode irekiko IArako lizentziak 101 📜
Ez duzu abokatua izan beharrik. Patroiak antzeman behar dituzu, bai.
-
Kode lizentzia permisiboak — MIT, BSD, Apache-2.0. Apache-k patente-baimen esplizitua dauka, talde askok eskertzen dutena [1].
-
Copyleft — GPL familiak deribatuak lizentzia beraren pean irekita egotea eskatzen du. Indartsua, baina zure arkitekturan kontuan hartu.
-
Modelo espezifikoen lizentziak — Pisu eta datu-multzoetarako, lizentzia pertsonalizatuak ikusiko dituzu, hala nola, Arduratsu AI Lizentzia familia (OpenRAIL). Hauek erabileran oinarritutako baimenak eta murrizketak kodetzen dituzte; batzuek erabilera komertziala baimentzen dute zabalki, beste batzuek erabilera okerraren aurkako babes-hesiak gehitzen dituzte [5].
-
Creative Commons datuetarako — CC-BY edo CC0 ohikoak dira datu-multzo eta dokumentuetarako. Aitortza eskala txikian kudea daiteke; eraiki eredu bat goiz.
Aholku profesionala: orrialde bakarreko dokumentu bat gorde, mendekotasun bakoitza, lizentzia eta birbanaketa komertziala onartzen den ala ez zerrendatuz. Aspergarria? Bai. Beharrezkoa? Bai, gainera.
Konparazio taula: IA kode irekiko proiektu ezagunak eta non nabarmentzen diren 📊
nahita pixka bat nahasia - horrela ikusten dira benetako oharrak
| Tresna / Proiektua | Norentzat da? | Prezio gutxikoa | Zergatik funtzionatzen duen ondo |
|---|---|---|---|
| PyTorch | Ikertzaileak, ingeniariak | Doan | Grafiko dinamikoak, komunitate erraldoia, dokumentazio sendoa. Ekoizpenean probatutako borroka. |
| TensorFlow | Enpresa taldeak, ML eragiketak | Doan | Grafiko modua, TF-Zerbitzua, ekosistemaren sakontasuna. Batzuentzat ikaskuntza malkartsuagoa, oraindik sendoa. |
| Aurpegi Besarkatuen Transformatzaileak | Eraikitzaileak epeak dituztenak | Doan | Aurrez trebatutako ereduak, hodiak, datu-multzoak, doikuntza fin errazak. Egia esan, lasterbide bat. |
| vLLM | Azpi-pentsamenduko taldeak | Doan | LLM zerbitzatze azkarra, KV cache eraginkorra, GPU arruntetan errendimendu handia. |
| Llama.cpp | Brikolaje-egileak, ertzeko gailuak | Doan | Exekutatu modeloak lokalki ordenagailu eramangarrietan eta telefonoetan kuantizazioarekin. |
| LangChain | Aplikazioen garatzaileak, prototipoak | Doan | Kate konposagarriak, konektoreak, agenteak. Irabazi azkarrak, sinple mantentzen baduzu. |
| Difusio egonkorra | Sortzaileak, produktu taldeak | Pisu libreak | Irudien sorrera lokalean edo hodeian; inguruko lan-fluxu eta interfaze masiboak. |
| Ollama | Tokiko CLIak maite dituzten garatzaileak | Doan | Tokiko modeloak askatu eta exekutatu. Lizentziak modelo txartelaren arabera aldatzen dira; kontuz ibili horri. |
Bai, asko “Doan”. Ostatua, GPUak, biltegiratzea eta ordu-pertsona ez dira doakoak.
Nola erabiltzen duten enpresek kode irekiko adimen artifiziala lanean 🏢⚙️
Bi mutur entzungo dituzu: edo denek dena bere kabuz ostatatu beharko lukete, edo inork ez luke egin behar. Benetako bizitza bigunagoa da.
-
Prototipoak azkar egitea — Hasi eredu ireki permisiboekin UX eta eragina balioztatzeko. Berregituratu geroago.
-
Zerbitzu hibridoa — Pribatutasunarekiko sentikorrak diren deietarako, mantendu VPC batean ostatatutako edo tokiko eredu bat. Karga luze edo puntadunetarako, erabili ostatatutako API bat. Oso normala.
-
Zeregin estuetarako doikuntza fina — Domeinuaren egokitzapena askotan eskala gordinaren gainetik dago.
-
RAG nonahi — Berreskurapen bidezko sorkuntza areagotuak haluzinazioak murrizten ditu erantzunak zure datuetan oinarrituz. Bektore irekiko DB eta egokitzaileek hau eskuragarriagoa egiten dute.
-
Edge eta offline — Ordenagailu eramangarrietarako, telefonoetarako edo arakatzaileetarako konpilatutako modelo arinak produktuen gainazalak zabaltzen dituzte.
-
Betetzea eta auditoria — Barrunak ikuskatu ditzakezunez, auditoreek zerbait zehatza dute berrikusteko. Horri NISTen RMF kategoriekin eta dokumentazio-gidalerroekin bat datorren IA politika arduratsu bat gehitu [3].
Ohar txiki bat: Ikusi dudan SaaS talde pribatutasun-zale batek (merkatu ertaineko, EBko erabiltzaileak) konfigurazio hibridoa hartu du: eskaeren % 80rako VPC barruko eredu ireki txikia; testuinguru luzeko eskaera arraroetarako ostatatutako API batera igoera. Bide komunaren latentzia murriztu eta DPIA paper-lanak sinplifikatu dituzte, ozeanoa irakiten jarri gabe.
Aurreikusi beharreko arriskuak eta arazoak 🧨
Helduak izan gaitezen honen inguruan.
-
Lizentziaren desbideratzea — Biltegi batek MIT abiarazten du, eta gero pisuak lizentzia pertsonalizatu batera aldatzen dira. Mantendu zure barne erregistroa eguneratuta edo betetze-sorpresa bat bidaliko duzu [2][4][5].
-
Datuen jatorria — Eskubide lausoak dituzten entrenamendu-datuak modeloetara isur daitezke. Jarraitu iturriak eta jarraitu datu-multzoen lizentziak, ez bibrazioak [5].
-
Segurtasuna — Tratatu modeloaren artefaktuak beste edozein hornidura-kate bezala: kontrol-baturak, sinatutako askapena, SBOMak. SECURITY.md minimo batek ere isiltasuna gainditzen du.
-
Kalitate-aldakortasuna — Eredu irekiak asko aldatzen dira. Ebaluatu zure zereginekin, ez sailkapen-taulekin bakarrik.
-
Azpiegitura-kostu ezkutua — Inferentzia azkarrak GPUak, kuantizazioa, batch-a eta cachea behar ditu. Tresna irekiek laguntzen dute; zuk konputazioan ordaintzen jarraitzen duzu.
-
Gobernantza zorra — Modeloaren bizi-zikloaren jabea inork ez badu, konfigurazio-espagetiak izango dituzu. MLOps kontrol-zerrenda arin bat oso baliotsua da.
Zure erabilera kasurako irekitasun maila egokia aukeratzea 🧭
Erabakitzeko bide apur bat okerra:
-
azkar bidali behar duzu ? Hasi eredu ireki permisiboekin, doikuntza minimoekin eta hodeiko zerbitzuarekin.
-
Pribatutasun zorrotza edo lineaz kanpoko behar duzu ? Aukeratu ondo euskarritutako pila ireki bat, auto-ostatutako inferentzia bat eta berrikusi lizentziak arretaz.
-
Eskubide komertzial zabalak behar dituzu ? Hobe OSI lerrokatutako kodea gehi erabilera komertziala eta birbanaketa esplizituki baimentzen duten eredu-lizentziak [1][5].
-
Ikerketa-malgutasuna behar duzu ? Erabili permisibotasuna muturretik muturrera, datuak barne, erreproduzigarritasuna eta partekagarritasuna lortzeko.
-
Ez zaude ziur? Biak pilotatu. Bideetako bat, noski, hobeto sentituko zara astebete barru.
Nola ebaluatu kode irekiko adimen artifizialaren proiektu bat profesional baten moduan 🔍
Kontrol-zerrenda azkar bat gordetzen dut, batzuetan zapi batean.
-
Lizentziaren argitasuna — OSIk onartutako kodea? Eta pisuei eta datuei buruz? Ba al dago zure negozio eredua zapuzten duen erabilera murrizketarik [1][2][5]?
-
Dokumentazioa — Instalazioa, abiarazte azkarra, adibideak, arazoak konpontzea. Dokumentuak kulturaren adierazle dira.
-
Argitalpenen kadentzia — Etiketatutako argitalpenek eta aldaketa-erregistroek egonkortasuna iradokitzen dute; esporadiko bultzadek heroismoa.
-
Erreferentziak eta ebaluazioak — Zereginak errealistak? Ebaluazioak exekutagarriak?
-
Mantentze-lanak eta gobernantza — Kode-jabe argiak, arazoen sailkapena, harreman publikoen erantzun-gaitasuna.
-
Ekosistemaren egokitzapena — Zure hardwarearekin, datu-biltegiekin, erregistroarekin eta autentifikazioarekin ondo funtzionatzen du.
-
Segurtasun-jarrera — Sinatutako artefaktuak, mendekotasunen eskaneatzea, CVEren kudeaketa.
-
Komunitatearen seinalea — Eztabaidak, foroaren erantzunak, biltegien adibideak.
Praktika fidagarriekin lerrokatze zabalagoa lortzeko, mapatu zure prozesua NIST AI RMF kategorietara eta dokumentazio-artefaktuetara [3].
1. azterketa sakona: modelo lizentzien erdigune nahasia 🧪
Modelo gaienetako batzuk "baldintzak dituzten pisu irekiak" kategorian daude. Eskuragarriak dira, baina erabilera mugak edo birbanaketa arauak dituzte. Hori ondo egon daiteke zure produktuak modeloa berriro ontziratu edo bezeroen inguruneetara bidaltzearen mende ez badago. Hori behar baduzu , negoziatu edo beste oinarri bat aukeratu. Gakoa zure ondorengo planak benetako lizentzia testuarekin alderatzea da, ez blog argitalpenarekin [4][5].
OpenRAIL estiloko lizentziek oreka bat lortzen saiatzen dira: ikerketa irekia eta partekatzea sustatzen dituzte, eta erabilera okerra desanimatzen dute. Asmoa ona da; betebeharrak zureak dira oraindik. Irakurri baldintzak eta erabaki baldintzak zure arrisku-gogoarekin bat datozen ala ez [5].
2. azterketa sakona: datuen gardentasuna eta erreproduzigarritasunaren mitoa 🧬
«Datu-zati osorik gabe, IA kode irekikoa faltsua da». Ez guztiz. Datuen jatorriak eta errezetek gardentasun esanguratsua eman dezakete, datu-multzo gordin batzuk mugatuta daudenean ere. Iragazkiak, laginketa-erlazioak eta garbiketa-heuristikak nahikoa ondo dokumentatu ditzakezu beste talde batek emaitzak gutxi gorabehera kalkula ditzan. Erreproduzigarritasun perfektua ona da. Gardentasun ekintzailetza nahikoa da askotan [3][5].
Datu-multzoak irekita daudenean, CC-BY edo CC0 bezalako Creative Commons lizentziek ohikoak dira. Eskala handiko atribuzioa deserosoa izan daiteke, beraz, estandarizatu ezazu nola kudeatzen duzun hasieratik.
3. azterketa sakona: modelo irekietarako MLOp praktikoak 🚢
Modelo ireki bat bidaltzea edozein zerbitzu bidaltzea bezalakoa da, zenbait berezitasunekin batera.
-
Zerbitzatze-geruza — Inferentzia-zerbitzari espezializatuek batch-ak, KV-cache-aren kudeaketa eta token-streaming-a optimizatzen dituzte.
-
Kuantizazioa — Pisu txikiagoak → inferentzia merkeagoa eta ertz-hedapen errazagoa. Kalitate-konpromisoak aldatu egiten dira; neurtu zure zereginekin.
-
Behagarritasuna — Erregistratu eskaerak/irteerak pribatutasuna kontuan hartuta. Ebaluaziorako lagina. Gehitu desbideratze-egiaztapenak, ohiko MLrako egingo zenukeen bezala.
-
Eguneraketak — Modeloek portaera sotilki alda dezakete; kanarioak erabili eta artxibo bat gorde atzera egiteko eta auditorietarako.
-
Ebaluazio-arnesa — Mantendu zeregin espezifikoetarako ebaluazio-multzo bat, ez erreferentzia orokorrak soilik. Sartu aurkarientzako galderak eta latentzia-aurrekontuak.
Mini plano bat: zerotik pilotu erabilgarrira 10 urratsetan 🗺️
-
Definitu zeregin eta metrika zehatz bat. Oraindik ez dago plataforma handirik.
-
Aukeratu asko erabiltzen den eta ondo dokumentatutako oinarrizko eredu permisibo bat.
-
Tokiko inferentzia eta bilgarri meheko API bat mantendu. Aspergarria izan dadin.
-
Gehitu berreskurapena zure datuetako lurreko irteeretan.
-
Prestatu zure erabiltzaileak, alde onak eta guztiak islatzen dituen ebaluazio multzo txiki bat.
-
Ebaluatzaileak hala egin behar duzula esaten badu bakarrik egin doikuntza finak edo doikuntza azkarrak.
-
Kuantifikatu latentzia edo kostu-hozkadak badaude. Neurtu berriro kalitatea.
-
Gehitu erregistroa, talde gorrien gonbidapenak eta abusu politika.
-
Ezaugarri-banderarekin atea ireki eta kohorte txiki bati askatu.
-
Iterazioak egin. Bidali hobekuntza txikiak astero... edo benetan hobeak direnean.
Kode irekiko adimen artifizialari buruzko ohiko mitoak, apur bat gezurtatuak 🧱
-
Mitoa: eredu irekiak beti dira okerragoak. Errealitatea: datu egokiak dituzten zeregin zehatzetarako, doitutako eredu irekiek ostatatutako eredu handiagoek baino emaitza hobeak izan ditzakete.
-
Mitoa: irekiak segurtasun eza esan nahi du. Errealitatea: irekitasunak azterketa hobetu dezake. Segurtasuna praktiken mende dago, ez sekretuaren menpe [3].
-
Mitoa: lizentziak ez du axola doakoa bada. Errealitatea: doakoa denean da garrantzitsuena, doakoak erabilera eskalatzen duelako. Eskubide esplizituak nahi dituzu, ez bibrazioak [1][5] .
Kode irekiko IA 🧠✨
Kode irekiko IA ez da erlijio bat. Askatasun praktiko multzo bat da, kontrol gehiagorekin, gobernantza argiagoarekin eta iterazio azkarragoarekin eraikitzeko aukera ematen dizuna. Norbaitek eredu bat "irekia" dela esaten duenean, galdetu zein geruza diren irekiak: kodea, pisuak, datuak edo sarbidea besterik ez. Irakurri lizentzia. Konparatu zure erabilera kasuarekin. Eta gero, funtsezkoa dena, probatu zure benetako lan-kargarekin.
Bitxia bada ere, alderik onena kulturala da: proiektu irekiek ekarpenak eta azterketa gonbidatzen dituzte, eta horrek softwarea eta pertsonak hobetzen ditu. Baliteke mugimendu irabazlea ez izatea eredu handiena edo erreferentziazko erreferentzia deigarriena, baizik eta datorren astean ulertu, konpondu eta hobetu dezakezuna. Hori da Kode Irekiko AIren botere isila - ez da irtenbide miragarri bat, baizik eta eguna salbatzen jarraitzen duen tresna anitzeko bat bezalakoa.
Denbora gehiegi irakurri gabe 📝
Kode irekiko IA sistemak erabiltzeko, aztertzeko, aldatzeko eta partekatzeko askatasun esanguratsua da. Geruza guztietan agertzen da: esparruak, ereduak, datuak eta tresnak. Ez nahastu kode irekia pisu irekiekin edo sarbide irekiarekin. Egiaztatu lizentzia, ebaluatu zure benetako zereginekin eta diseinatu segurtasuna eta gobernantza lehen egunetik. Hori eginez gero, abiadura, kontrola eta bide-orri lasaiagoa lortuko dituzu. Harrigarriro arraroa, benetan preziorik gabekoa 🙃.
Erreferentziak
[1] Kode Irekiaren Ekimena - Kode Irekiaren Definizioa (OSD): irakurri gehiago
[2] OSI - IA eta Irekitasunari buruzko Azterketa Sakona: irakurri gehiago
[3] NIST - IA Arriskuen Kudeaketa Esparrua: irakurri gehiago
[4] Meta - Llama Eredu Lizentzia: irakurri gehiago
[5] IA Arduratsuaren Lizentziak (OpenRAIL): irakurri gehiago