🧠 Txinako ByteDance-k Doubao 2.0 AI eredua kaleratu du 'agenteen arorako' ↗
ByteDance-k Doubao 2.0 abiarazi zuen "erantzuten duen txat"-etik "gauzak egiten dituen IA"-ra igarotzeko - urrats anitzeko zereginak, arrazoiketa sendoagoa eta agenteetan oinarritutako lan-fluxu gehiago (antza denez, denek agenteak eraikitzen ari dira orain).
Baieztapen zorrotz bat ere egiten ari dira: goi-mailako modeloen gaitasun konparagarria, baina merkeagoa erabiltzeko. Kostu horren ikuspegia da istorioa... edo elikagaien erreferentziazko borroka baten hasiera.
🎆 Txinako IA modeloek Udaberriko Jaialdia ospatu dute DeepSeek-en ezustekoaren urtebetera ↗
Txinako IA eszenak "oporretako aurkezpen pilaketa handi" hori egiten ari da: modeloen eguneratze asko, momentuaren atzetik asko eta inork berriro harritu nahi ez duelako sentsazio nabarmena.
Nahasketa zabala da: chatbot-ak, testuinguru luzeko eguneraketak, mugikorretarako egokitutako eredu konprimituak, kode irekiko bertsioak eta bideoen sorkuntza, Txinatik kanpo ere arreta erakarriz. Suziri ikuskizun bat bezala irakurtzen da, non suziri guztiak "ni hurrengoa, ni hurrengoa" oihukatzen ari diren
🪙 IA burbuilaren beldurrak deribatu berriak sortzen ari dira ↗
Zorraren inbertitzaileak urduri jartzen ari dira teknologiako jokalari handienek IAren arma-lasterketa finantzatzeko zenbat maileguan har dezaketen jakiteko; beraz, merkatua, noski, antsietate hori estaltzeko modu berriak asmatzen ari da.
Oso “beldurrik baldin badago, norbaitek segurizatuko du” esaera zaharra da, eta hori, aldi berean, azkarra eta madarikatua da... ekaitz-hodeiak botilaratu eta harpidetza bidez saltzea bezala.
🪖 AEBetako armadak Anthropic-en Claude IA modeloa erabili zuen Venezuelako eraso batean, txosten baten arabera ↗
Txosten batek dio Claude Venezuelako operazio ezkutu batean erabili zutela lankidetza-kanal baten bidez - eta horrek "eredu-politika"-ren argudioak laborategitik eta operazio-eremura azkar eramaten ditu.
Xehetasunak titularrak baino estuagoak izan arren (askotan gertatzen da), puntu garrantzitsuena hor dago: modeloak defentsako lan-fluxuetan sartzen direnean, "nork zer kontrolatzen duen" nahasten da, eta ez modu polit eta startup batean.
🇮🇳 🧩 Nvidiako zuzendari nagusi Huangek ez du Indiako AI gailurrera joango datorren astean, konpainiak dioenez ↗
Nvidiak dioenez, Jensen Huang ez da Indiako AI Impact Summit-era joango "aurreikusi gabeko egoerengatik", eta goi mailako ordezkaritza bat joango da haren ordez. Aldaketa nabarmena da, bere presentzia, funtsean, albistegietako erakargarria izan baitzen.
Ekitaldia oraindik ere pila bat dirudi, bai - baina profil handiko bertan behera uzteek beti aldatzen dute gelako tenperatura, denek ez dutela egiten itxurak egin arren.
Maiz egiten diren galderak
ByteDance-ren Doubao 2.0 eta “agenteen aroaren” aldaketa
Doubao 2.0 "erantzuten duen txat"-etik "gauzak egiten dituen IA"-rako aldaketa gisa planteatzen da, urrats anitzeko zereginetan eta agenteetan oinarritutako lan-fluxuetan arreta jarriz. Praktikan, erantzun bakarra eman beharrean, planifikatzen, sekuentzien bidez arrazoitzen eta zeregin bat hainbat etapatan zehar eramaten indartsuagoa dela aurkezten da. "Agenteen aroa" etiketak eredu zabalago bat islatzen du: gero eta talde gehiagok eraikitzen dituzte jarduten duten sistemak, ez hitz egiten bakarrik.
Nolakoa den "agente-oinarritutako lan-fluxu" batek Doubao 2.0 erabilera kasuetan
Hainbat bidetan, agente estiloko konfigurazio batek helburu bat urratsetan banatzen du, tarteko emaitzak egiaztatzen ditu eta amaitu arte iterazioak egiten ditu. Horrek askotan esan nahi du plan bat zirriborratzea, azpi-zereginak sortzea eta erantzun bakarreko emaitza baino egituratuagoa den azken emaitza lortzea. Hori ebaluatzeko modu ohiko bat erabaki anitz behar dituzten zereginak egitea da; adibidez, kontrol-zerrenda bat idaztea, fintzea eta gero emaitza garbi bihurtzea.
Nola probatu Doubao 2.0 "maila goreneko modeloekin" bat datorren kostu txikiagoan
Produktuaren ebaluazio bat bezala hartu, ez izenburu bat bezala. Konparatu Doubao 2.0 zure intereseko zeregin espezifikoetan - zehaztasuna, koherentzia, huts egiteko moduak eta zenbat saiakera behar dituen - latentzia eta erabilera kostuekin batera. "Merkeagoa" alda daiteke gonbidapen gehiago, babes-hesi astunagoak edo berrikuspen gehiago behar badituzu. Benchmarking-ean, adi egon benetako lan-fluxuen antzekoak ez diren proba hautatuekin.
Zergatik abiarazten dira hain oldarkor Txinako IA ereduak Udaberriko Jaialdiaren garaian
Txostenak "jaurtiketa pila" gisa aurkezten du: eguneraketak oporretako une garrantzitsu baten inguruan multzokatuta, momentu nabarmena sortuz. Lehiaren presioa ere kontrolatzen du: inork ez du nahi ustekabean harrapatuta egon arloan aurreko "kolpe" baten ondoren. Emaitza jaurtiketa eta hobekuntzen nahasketa su artifiziala da, taldeek arreta azkar erakartzen saiatzen direlarik.
Zer aldatzen dute eraikitzaileentzat testuinguru luzeko eguneratzeek, konprimitutako mugikorretarako ereduek eta kode irekiko bertsioek?
Testuinguru luzeko eguneratzeek, oro har, testu edo historia gehiago saio bakarrean kudeatzea dute helburu, eta horrek sarrera handiagoetan analisia edo jarraitutasuna hobetu dezake. Eredu konprimituak askotan IA praktikoagoa egitea dute helburu, kalkulu-aurrekontu estuagoak dituzten gailuetan. Kode irekiko bertsioek esperimentazio-kostuak murriztu eta adopzioa zabaldu dezakete, baina baita hedapenaren, segurtasun-kontrolen eta mantentze-lanen ardurak erabiltzailearen gain jartzen dituzte.
Zer dakarren gobernantzarako eta arriskuen plangintzarako “IA burbuila” babes-neurriek eta IA erabilera militarraren berri emanek
Deribatuen ikuspuntuak IAren arma-lasterketa zenbat zorrek finantzatu dezakeenaren inguruko finantza-antsietatea adierazten du, eta horrek merkatuak ziurgabetasun horretarako babes-neurriak asmatzera bultzatzen ditu. Bestalde, Claude bezalako eredu baten erabilera militarraren berri eman da, eta horrek azpimarratzen du zein azkar bihur daitezkeen "eredu-politika" eztabaidak galdera operatiboetan. Buruzagientzat, inplikazio pragmatikoa gobernantza sendoagoa da: erabilera-muga argiak, saltzaileen eta bazkideen kontrolak, auditoria-aztarnak eta eskalatze-bideak arrisku handiko hedapena agertzen denean.