IAren albisteen laburpena: 2026ko maiatzaren 29a

Scott Wuk, Cognition-eko arduradunak, dio IA kodeketa-agenteek ez luketela gizakiak ordezkatu behar ↗

Cognition-eko Scott Wuk ukatu egin zuen Devin programatzaileak erabat ordezkatzeko eraikita dagoela dioen ideia. Jarrera apur bat deserosoa da, konpainiak Devinek bere kodearen zati handi bat konprometitzen duela ere esaten duela kontuan hartuta.

Bere planteamendua “zure lana ordenagailu eramangarriko iratxo batek jan du” baino gehiago “IA kodeketa laguna” da. Hala ere, tentsioa zaila da oharkabean pasatzea: agente hobeak, ingeniaritza talde puztuentzat aitzakia gutxiago... edo hori dio argudioak.

Adimen artifizialaren startup honek zure etxea doan garbituko du etorkizuneko robotak entrenatzeko ↗

Shift-ek etxeak doan garbitzeko zerbitzua eskaintzen du, erabilgarria eta apur bat kezkagarria den koska batekin: garbitzaileek kameraz hornitutako "txapel magikoa" janzten dute enpresak roboten entrenamendu datuak bil ditzan.

Eskaintza sinplea da: zuk pisu garbi bat lortzen duzu, eta haiek etxeko lanen bideoa. Negozio polita, agian.

Shift-ek dio xehetasun sentikorrak lausotzen eta irudiak anonimo bihurtzen dituela, baina galdera zabalagoa oraindik ere hor dago sofaren azpian galtzerdi bat bezala: zenbat etxeko pribatutasun trukatzeko prest daude pertsonak erosotasunaren truke?

Anthropic-ek Claude Opus 4.8 kaleratu du ↗

Anthropic-ek Claude Opus 4.8 kaleratu zuen, kodeketa, lan-fluxu eragileak, arrazoiketa eta lan profesionala hobetzeko aukera emanez. Salmenta nagusia fidagarritasuna da: baieztapen gutxiago, tresnen erabilera hobea eta autoegiaztapen gehiago.

Claude Code-k lan-fluxu dinamikoak ere lortzen ditu, modeloari planifikatzen, azpiagente paraleloak abiarazten, irteerak egiaztatzen eta txostenak ematen uzten diotenak. Lehorra dirudi, funtsean, proiektuen kudeaketa gabardina batekin dela konturatzen zaren arte.

Prezioak modu estandarraren eta azkarren artean banatuta jarraitzen du, Anthropic-ek ahaleginaren kontrolak gehiago bultzatzen dituelarik, erabiltzaileek abiadura, kalitatea eta tokenen errekuntza orekatu ahal izan dezaten.

Foxconn-ek konfiantza handia du IAri esker hazkunde-bultzadan, presidenteak dioenez ↗

Foxconneko presidenteak esan zuen IAren eskaria konpainiaren ohiko erritmo sasoikoa aldatzen ari dela. Urte erdialdeko hornitzaileen beherakada zaharra? Antza denez, ez da jada normal jokatzen.

Arrazoia hodeiko erraldoien IA gastu izugarria da, Foxconnek bere merkatu aukera gisa ikusten duena. IA boomaren hardware aldea da hori, chatbot-ak baino distira gutxiagokoa, baina diru-hodiak zarata egiten ari diren tokia.

Foxconn dagoeneko Nvidia zerbitzarien fabrikatzaile garrantzitsua da, beraz, bere baikortasuna, funtsean, AI azpiegituren lasterketaren tenperatura-proba bat da.

Hirugarrenen ebaluazio fidagarrietarako gida partekatua ↗

OpenAI-k hirugarrenen IA ebaluazioei buruzko gidalerroak argitaratu zituen, argudiatuz probek xehetasun argiagoak behar dituztela zer ebaluatu den, nola probatu den eta emaitzek zer frogatu dezaketen azaltzeko.

Puntu nagusia harrigarriro praktikoa da: mugako IA ebaluazioak ezin dira sailkapen-taula itxurako asmakizun hutsak izan. Ebaluatzaileek probatutako sistema, argibideak, babes-neurriak, baliozkotasun-egiaztapenak eta erreklamazioak non amaitzen diren azaldu behar dituzte.

Hori garrantzitsua da, ereduak agenteagoak bihurtzen diren heinean, azaleko probek sistemak direna baino seguruagoak edo sendoagoak agerrarazi ditzaketelako. Paper-lan txikia, energia, ondorio handiak.

Maiz egiten diren galderak

Devin bezalako IA kodetze agenteek programatzaileak ordezkatzeko pentsatuta al daude?

Scott Wuk IA kodeketa-agenteak kodeketa-bazkide gisa aurkezten ditu, eta ez giza programatzaileen ordezko oso gisa. Hala ere, artikuluak tentsio bat adierazten du: Devin Cognition-en kodearen zati handi bat laguntzen duela ere deskribatzen da. Praktikan, ondorioa da tresna hauek ohiko ingeniaritza-lan batzuk murriztu ditzaketela, gizakien epaia, norabidea eta erantzukizuna lortzeko menpe egon arren.

Zergatik eskaintzen du Shiftek doako etxeko garbiketa AI prestakuntza datuetarako?

Shift-ek doako etxeak garbitzeko zerbitzua eskaintzen du, etxeko lanen bideo-datuak etorkizuneko robotak entrenatzeko behar dituelako. Garbitzaileek "txapel magikoa" daramate kameraz hornituta lanean ari diren bitartean, eta horrela, adimen artifizialaren sistemek etxeko lanak ulertzen lagun dezaketen irudiak sortzen dituzte. Trukea argia da: bezeroek etxe garbia lortzen dute, eta enpresak, berriz, bizileku pribatuetatik datuak lortzen ditu.

Nola kudeatzen du Shiftek pribatutasuna etxeko garbiketa-irudiak biltzerakoan?

Artikuluak dio Shift-ek xehetasun sentikorrak lausotzen eta grabazioak anonimizatzen dituela dioela. Horrek pribatutasun-arrisku batzuk murriztu ditzake, baina ez du kentzen etxe barruan grabatzearen kezka orokorra. Erabiltzaileentzat, galdera nagusia da doako garbiketaren erosotasunak datu-bilketa maila hori merezi duen ala ez.

Zer da berria Claude Opus 4.8-n?

Claude Opus 4.8-k kodeketa, agenteen lan-fluxuak, arrazoiketa eta lan profesionala hobetzen dituela deskribatzen da. Eguneratzeak fidagarritasunean jartzen du arreta, besteak beste, erreklamazio babesgabe gutxiago, tresnen erabilera sendoagoa eta autoegiaztapen handiagoa. Claude Code-k lan-fluxu dinamikoak ere lortzen ditu, non ereduak planifikatu, azpiagente paraleloak exekutatu, irteerak egiaztatu eta emaitzak jakinarazi ditzakeen.

Zergatik da garrantzitsua Foxconnen IAren boomaren baikortasuna?

Foxconnen konfiantza garrantzitsua da, IAren boomaren hardware aldea islatzen duelako. Konpainiaren presidenteak esan zuen IAren eskaria bere ohiko sasoiko eredua aldatzen ari dela, hodeiko erraldoien azpiegituren gastuak merkatu aukera garrantzitsua sortzen duelako. Foxconn dagoeneko Nvidia zerbitzarien fabrikatzaile nagusia denez, haren iruzkinak IA azpiegituren eskariaren seinale sendoa dira.

Zer dio OpenAI-k hirugarrenen IA ebaluazioak fidagarri bihurtzen dituena?

OpenAI-k argudiatzen du IA ebaluazioek azalpen argiagoak behar dituztela zein sistema probatu den, nola probatu den eta emaitzek benetan zer erakusten duten azaltzeko. Horrek barne hartzen ditu xehetasunak galderak, babes-neurriak, baliozkotasun-egiaztapenak eta edozein baieztapenen mugak. Puntu hau bereziki garrantzitsua da eredu eragileagoetarako, non proba azalekoek sistemak direna baino seguruagoak edo gaiagoak agerrarazi ditzaketen.

Elementua zure saskira gehitu da