Ang AI Artwork Mills Makakopya Lang sa Anaa Na nga mga Imahen
Usa sa mga nag-unang depensa nga gigamit sa mga kusgan sa AI artwork turbines mao nga bisan kung ang mga modelo gibansay sa naglungtad nga mga imahe, ang tanan nga ilang gihimo bag-o. Ang mga ebanghelista sa AI kanunay itandi kini nga mga sistema sa tinuod nga kinabuhi nga mga artista. Ang mga mamugnaon nga mga tawo giinspirar sa tanan nga nag-una kanila, busa ngano nga ang AI dili parehas nga makapadasig sa miaging trabaho?
Ang bag-ong panukiduki mahimo’g magbutang usa ka damper sa kana nga argumento, ug mahimo pa nga mahimong usa ka hinungdanon nga punto sa pagpabilin daghang nagpadayon nga mga kaso bahin sa sulud nga nahimo sa AI ug copyright. Nakaplagan sa mga tigdukiduki sa industriya ug akademya nga ang pinakasikat ug umaabot nga AI picture turbines mahimong “makamemorya” sa mga hulagway gikan sa datos nga ilang gibansay. Imbis nga maghimo usa ka butang nga hingpit nga bag-o, ang pipila nga mga pag-aghat makakuha sa AI nga mag-reproduce lang sa usa ka imahe. Ang uban niining mga recreate nga mga hulagway mahimong copyrighted. Apan mas grabe pa, ang modernong AI generative nga mga modelo adunay kapabilidad sa pagsag-ulo ug paghuwad sa sensitibo nga impormasyon nga gi-scrape para gamiton sa AI coaching set.
Ang pagtuon gipahigayon sa mga tigdukiduki pareho sa tech nga industriya-ilabi na Google ug DeepMind—ug sa mga unibersidad sama sa Berkeley ug Princeton. Ang sama nga mga tripulante nagtrabaho sa usa ka sayo nga pagtuon nga nagpaila sa susama nga problema sa AI nga mga modelo sa pinulongan, ilabi na ang GPT2, ang pasiuna sa OpenAI’s labi ka sikat nga ChatGPT. Sa pagbalik sa banda, ang mga tigdukiduki nga gipangulohan sa tigdukiduki sa Google Mind nga si Nicholas Carlini nakakaplag nga ang Google’s Imagen ug ang widespread nga open supply nga Steady Diffusion makahimo sa pag-reproduce og mga hulagway, ang uban niini adunay klaro nga mga implikasyon batok sa copyright o mga lisensya sa imahe.
Ang unang hulagway sa maong tweet gihimo gamit ang caption nga nalista sa Steady Diffusion’s dataset, ang multi-terabyte scraped picture database nga nailhang LAION. Gipakaon sa staff ang caption sa Steady Diffusion immediate, ug migawas ang parehas nga eksaktong imahe, bisan kung gamay nga gituis sa digital noise. Ang proseso sa pagpangita niining mga duplicate nga mga hulagway kay easy ra. Ang staff midagan sa samang immediate sa makadaghang higayon, ug human makuha ang samang resulta nga hulagway, ang mga tigdukiduki mano-mano nga nagsusi kon ang hulagway anaa ba sa coaching set.
Ang G/O Media mahimong makakuha og komisyon
Duha sa mga tigdukiduki sa papel nga si Eric Wallace, usa ka estudyante sa PHD sa UC Berkeley, ug si Vikash Sehwag, usa ka kandidato sa PHD sa Princeton College, nagsulti kang Gizmodo sa usa ka interbyu sa Zoom nga ang pagdoble sa imahe talagsa ra. Gisulayan sa ilang staff ang mga 300,000 ka lainlaing mga kapsyon, ug nakit-an ra ang .03% nga charge sa pagsag-ulo. Ang mga gikopya nga mga imahe labi ka talagsaon alang sa mga modelo sama sa Steady Diffusion nga nagtrabaho aron ma-de-duplicate ang mga imahe sa set sa pagbansay niini, bisan kung sa katapusan, ang tanan nga mga modelo sa pagsabwag adunay parehas nga isyu, sa usa ka dako o gamay nga diploma. Nakaplagan sa mga tigdukiduki nga ang Imagen hingpit nga makahimo sa pagsag-ulo sa mga hulagway nga usa ra ka higayon sa set sa datos.
“Ang caveat dinhi mao nga ang modelo kinahanglan nga i-generalize, kini kinahanglan nga makamugna og mga nobela nga mga imahe kaysa magluwa sa usa ka gisag-ulo nga bersyon,” ingon ni Sehwag.
Gipakita sa ilang panukiduki nga samtang ang mga sistema sa AI mismo nagkadako ug labi ka sopistikado, adunay labi ka posibilidad nga ang AI makamugna og kopya nga materyal. Ang usa ka gamay nga modelo sama sa Steady Diffusion wala’y parehas nga kantidad sa espasyo sa pagtipig aron matipigan ang kadaghanan sa datos sa pagbansay. Nga dako kaayog kausaban sa sunod nga mga tuig.
“Tingali sa sunod tuig, bisan unsa nga bag-ong modelo nga mogawas nga labi ka dako ug labi ka kusgan, unya mahimo’g kini nga mga matang sa mga peligro sa pagsag-ulo mahimong labi ka taas kaysa sa karon,” ingon ni Wallace.
Pinaagi sa usa ka komplikado nga proseso nga naglakip sa pagguba sa datos sa pagbansay nga adunay kasaba sa dili pa tangtangon ang parehas nga pagtuis, ang mga modelo sa pagkat-on sa makina nga nakabase sa Diffusion nagmugna og datos-sa niini nga kaso, mga hulagway-susama sa kung unsa ang gibansay niini. Ang mga modelo sa pagsabwag usa ka ebolusyon gikan sa mga generative adversarial community, o pagkat-on sa makina nga nakabase sa GAN.
Nahibal-an sa mga tigdukiduki nga ang mga modelo nga nakabase sa GAN wala’y parehas nga problema sa pagsag-ulo sa imahe, apan dili tingali nga ang mga dagkong kompanya nga magpadayon sa unahan sa Diffusion gawas kung ang usa ka labi ka labi ka sopistikado nga modelo sa pagkat-on sa makina moabut sa palibot nga nagpatunghag labi ka realistiko, taas nga kalidad nga mga imahe.
Si Florian Tramèr, usa ka propesor sa siyensya sa kompyuter sa ETH Zurich nga miapil sa panukiduki, nakamatikod kung pila ang mga kompanya sa AI nga nagtambag nga ang mga tiggamit, pareho sa libre ug bayad nga mga bersyon, gihatagan lisensya sa pagpaambit o bisan pag-monetize sa sulud nga hinimo sa AI. Ang mga kompanya sa AI mismo nagreserba usab sa pipila nga mga katungod sa kini nga mga imahe. Kini mahimong mapamatud-an nga usa ka problema kung ang AI makamugna og usa ka imahe nga parehas sa usa ka kasamtangan nga copyright.
Uban lang sa .03% nga charge sa pagsag-ulo, ang mga nag-develop sa AI mahimong motan-aw sa kini nga pagtuon ug mahibal-an nga wala’y daghang peligro. Ang mga kompanya mahimo’g magtrabaho aron ma-de-duplicate ang mga imahe sa datos sa pagbansay, nga mahimo’g dili kaayo makamemorya. Impyerno, mahimo pa gani nila nga mapalambo ang mga sistema sa AI nga makamatikod kung ang usa ka imahe usa ka direkta nga pagkopya sa usa ka imahe sa datos sa pagbansay ug i-flag kini alang sa pagtangtang. Bisan pa, gitago niini ang tibuuk nga peligro sa pagkapribado nga gipahinabo sa generative AI. Si Carlini ug Tramèr mitabang usab sa laing bag-o nga papel nga nangatarungan nga bisan ang pagsulay sa pagsala sa datos wala gihapon makapugong sa datos sa pagbansay gikan sa pagtulo pinaagi sa modelo.
Ug siyempre, adunay usa ka taas nga peligro nga ang mga imahe nga wala’y gusto nga kopyahon sa katapusan magpakita sa mga display screen sa mga tiggamit. Gipangutana ni Wallace kung gusto ba sa usa ka tigdukiduki nga makamugna usa ka tibuuk nga host sa sintetikong medikal nga datos sa mga X-Ray sa mga tawo, pananglitan. Unsa ang mahitabo kung ang usa ka AI nga nakabase sa pagsabwag nagmemorya ug nagdoble sa aktuwal nga medikal nga rekord sa usa ka tawo?
“Talagsa ra kini, mao nga dili nimo mamatikdan nga kini nahitabo sa una, ug pagkahuman mahimo nimo nga i-deploy kini nga dataset sa net,” miingon ang estudyante sa UC Berkeley. “Ang tumong niini nga trabaho mao ang matang sa pag-una sa mga posibleng matang sa mga sayop nga mahimo sa mga tawo.”
#Ang #Artwork #Mills #Makakopya #Lang #Anaa #nga #mga #Imahen