Lokalni generatori slika – imaju li smisla?

poruka: 27
|
čitano: 5.236
1
+/- sve poruke
ravni prikaz
starije poruke gore
Ovo je tema za komentiranje sadržaja Bug.hr portala. U nastavku se nalaze komentari na "Lokalni generatori slika – imaju li smisla?".
8 godina
offline
Lokalni generatori slika – imaju li smisla?

U nadi da BUIG pod "lokalni" misli na ono što je dostupno u kući prosječnog BUG čitatelja otvorim članak, kad u njemu mašina od niti manje ni više nego 5t eura namjenjena isključivo AI poslu. Tako da se sad pitam za koga je ovaj članak uopće napisan. jer za prosječni čitatelj bug-a niti pod razno neće dat toliko para za lokalno generiranje zabavnih slika. Nebi vas ubilo da se uzeli normalnu mašinu dostupnu večini i na njoj sve to isto testirali (bar onaj dio koji se da) čisto da ljudi dobiju osječaj koliko bi dugo trajalo pravo lokalno generiranje slika sa dostupnom tehnologijom u usporedbi sa ovom mašinom ili cloud modelima poznatih firmi.

 

Za one koje to zanima ima krcato alata za AI generiranje slika na Windows/Linux kompu plus to da nema nikakvih ograničenja šta možete kreirat i ovo ispod su samo neki od primjera. Sam sam koristio Stable diffusion prije cca dvije godine na 12700k + Nvidia 3060ti i generiranje, ovisno o zahtjevnosti traje oko 20-30 minuta, u nekim slučajevima i sat vremena. Na nekoj boljoj kartici sa više VRAM-a bi to bilo konkretno kraće ali niti blizu brzini kako ova mašina u članku generira. 

https://www.qt.io/blog/examples-of-local-llm-usage

https://github.com/invoke-ai/InvokeAI

https://github.com/leejet/stable-diffusion.cpp

 

Moj PC  
13 0 hvala 6
18 godina
offline
Lokalni generatori slika – imaju li smisla?

Ima li što da može obraditi postojeću fotku?

Treba mi za obradu rendera kuća u projektiranju, nema apsolutno nikakve veze s fotkama bivše žene niti susjede...

Gledam te!
 
2 0 hvala 1
18 godina
offline
Lokalni generatori slika – imaju li smisla?

ChatGPT Images 2.0 ih sve jede za dorucak. 

Moj PC  
1 0 hvala 1
10 godina
offline
Lokalni generatori slika – imaju li smisla?

"Sam sam koristio Stable diffusion prije cca dvije godine na 12700k + Nvidia 3060ti i generiranje, ovisno o zahtjevnosti traje oko 20-30 minuta, u nekim slučajevima i sat vremena. Na nekoj boljoj kartici sa više VRAM-a bi to bilo konkretno kraće ali niti blizu brzini kako ova mašina u članku generira. "

 

Iskreno, ne znam sto i kako si ti generirao, ali 20-30 minuta (u nekim slucajevima i sat vremena) je nonsens. Besmislica. Ne kazem da se to tebi nije tocno tako desilo, ali ako je, za to apsolutno nisu krive sposobnosti tog harvera.

 

Sto je tocno Bug ovdje testirao i kako je testirao nemam pojma, no, i ovaj clanak je pun besmislica i netocnih tvrdnji.

 

Za pocetak, evo vam real user case scenario - razliciti modeli i vremena generiranja na "average joe" hardveru - 4060 8gb i 32gb ddr4 memorije.

 

Koristen je Vas prompt ""a photorealistic mountain landscape at golden hour, crystal clear lake reflection, dramatic clouds, sharp detail"

 

Elem. sve je 1024x1024 (iako je ovo pogresan izbor rezolucije, no o tome dalje u tekstu), pokusao sam koristiti iste modele (ako ih imam), ili neke koji su bazirani na njima (ako je moguce), kao i neke jako relevatne modele koje Vi, iz nekog razloga, niste ni spomenuli.

 

Flux2 KLEIN - 20 sekundi. Best choice sampler - 40 sekundi (razlika u kvaliteti minimalna). (napomena - prvo generiranje traje cca 10 sekundi duze zbog ucitavanja modela u vram, svako slijedece - vrijednost je oko 19-21 sekunda, zaokruzeno na 20 sekundi)

 

Flux2 KLEIN KV model (model za editiranje slika) - 50 sekundi, single-pass kompletna promjena odjece, polozaja tijela, osvjetljenja, pozadine original slike uz zadrzavanje identicnosti subjekta (uz napomenu da se ovdje radi o vecoj slici rezolucije 1288x1408).

 

Flux2 KLEIN KV model - signle pass editiranje 2 odvojene referentne slike, IPAdapter, spajanje subjekata uz promjenu polozaja tijela, osvjetljenja, pozadine...... (1024x1024) - 65 sekundi.

 

Flux 2 DEV model - najsporiji moguci izbor, oko 5 minuta, cesti su OOM errori, tako da ovaj model preskociti ako se ima kartica s 8Gb Vrama. Kreirana slika kvalitetom i nije toliko iznad KLEIN modela, tako da se nema smisla patiti.

 

Z IMAGE BASE TURBO model (10 step)  - 19 sekundi.

Z IMAGE BASE model (25 step) - 63 sekunde.

 

QWEN IMAGE 2509/2011 - oko 120 sekundi, give or take (dosta random rezultati svake generacije - veliki model, cesti RAM/VRAM offload, sto utjece na neku konzistentnost rezultata)

QWEN EDIT 2509/2011 - oko 1 minute (ponovo, cesti offload)

 

Flux 1 - u bilo kojoj inacici - prevazidjen model, ne pronalazim neku vrijednost u njemu vise, posebice ne nakon izlaska Flux 2 modela.

 

Honorable mentions:

 

Pony model(i) - 15-tak sekundi za 1024x1024 sliku (los izbor rezolucije)

SDXL model(i) - 15-tak sekundi

SD 1.5 model(i) - 10 sekundi

 

Treba spomenuti jos i razne video modele (wan i slicne), koji takodjer rade u granicama zdravog razuma, nisam sad isao testirati svaki, no onako po sjecanju, 10 sekundi videa (ovisno o rezoluciji) 1-3 minute.

 

Dakle, real world primjeri iz kojih je jasno vidljivo da tvrdnje iznesene u tekstu jednostavno nisu tocne. Iako su tocne. Da, radi se o velikim modelima, radi se o "sporim" modelima, i njihovo izvodjenje na nekom sub-optimalnom hardveru zna biti problematicno za korisnika, uz dugo vrijeme generiranja. MEDJUTIM - sve ovo se rijesava s dvije stvari - pametnom kombinacijom modela (jer, postoje i Q verzije), pametnim izborom CLIPA (takodjer, postoje i Q verzije, postoje i abliterated verzije) , kao i VAE encodera. Nadalje, korisnicima sa slabim hardverom su dostupne, osim spomenutih quant modela, i razne "Turbo, lighting" i slicne LORE, koje drasticno smanjuju vrijeme generiranja, bez previse vidljivog utjecaja na kvalitet slike.

 

Tako da, Bug-ovci su u pravu - sporo je, ali ne toliko sporo koliko oni to prikazuju. Lose optimiziran workflow mozda? Nebitno.  A preporuka za SD3.5 model, u doba FLux2 je..... dajte, ljudi, ozbiljno?

 

Za average joe korisnika koji zeli kreirati neke svoje ej-aj aj-aj slike, ili zeli svoju fotografiju kombinirati da ima uspomenu na intimni moment s Lepom Brenom (random izbor lika) - sasvim izvedivo, bez muke i predugog cekanja cak i na potato pc. Samo treba malo volje, vremena za poskidati sve modele, uz bazicno poznavanje Comfy UI i pomoc dobre duse koja ce donirati kvalitetan i optimiziran workflow.

 

Medjutim, ono sto mene fascinira (ne u dobrom smislu) u ovom tekstu je.... hmm....usudit cu se reci nepoznavanje nacina na koji novi modeli (posebice flux2, ali i jos brutalnije izvedbe u vidu đepeta (chatgpt) ili nano banane) funkcioniraju.

 

Prompt tipa "a photorealistic mountain landscape at golden hour, crystal clear lake reflection, dramatic clouds, sharp detail" (koji se ovdje koristio) je relikt proslosti, koji funkcionira samo na starim modelima (sd, sdxl), dok u novim modelima jednostavno puko nabrajanje pojmova (mountain, landscape, lake, reflection, srac truc) funkcionira kao i prdac u kadi. na moment dobijes feeling jacuzzija, ali to nije to.

 

E nije ni ovo.

 

Ubacivanje pojmova u simple recenice koje kakti daju neki kontekst je toliko old century...

 

Danasnji modeli funkcioniraju dobro kod primjene ovih "old school" sitema prompta, ali ono gdje funkcioniraju izvanredno je kad user prestane pisati sto ON zeli da vidi na slici, i prompt pocme slagati tako da model VIDI sto je na slici. Ne "sto je nesto", vec "kako je nesto".

 

Kako to tocno i zasto funkcionira bolje od "1girl, big boobs" prompta? E, to ipak ostavljamo za neke druge prilike. 

 

(prilog 2 brzinske slike bez previse razmisljanja koje (nadam se) zorno demonstriraju o cemu govorim)

 

 

 

Its just the way of it, son. We all sell our souls sooner or later.
Poruka je uređivana zadnji put pon 1.6.2026 11:28 (Damir22).
Moj PC  
3 0 hvala 1
4 godine
offline
Re: Lokalni generatori slika – imaju li smisla?

Kao prosječni samouki grafički i POD dizajner koji je proveo nebrojene sate u Photoshopu "guleći" retuš i kompoziciju, mogu potvrditi da je tvoja analiza "stvarnog stanja" na terenu itekako utemeljena. 

Super su mi ove Victorian i Goth stil što si radio, danas ih se čak može i animirati uz Kling.AI i slično i dati im i music bakground uz razne Sune /Udio i slične alate.

 

Isto tako istina je da rezolucija drastično utječe na vrijeme generiranja jer izravno povećava broj piksela koje model mora procesuirati (uzrokujući bottleneck u VRAM-u), ali je puno važnije znati da je današnji workflow lokalnog generiranja postao prava mala znanost optimizacije kroz kvantizirane modele i pametno slaganje nodeova u ComfyUI-ju.

 

Tvoje zapažanje o "reliktu prošlosti" kod promptanja je ključno; dok smo u Photoshopu navikli na manualno slaganje slojeva i maski, kod modernih modela promptiranje prelazi iz "nabrajanja ključnih riječi" u "opisivanje narativa i ambijentalnih uvjeta", što modelu omogućuje puno precizniju interpretaciju scene. Nakon godina ručnog retuširanja gdje sam svaki detalj morao svjesno "izgraditi", fascinantno je vidjeti kako pravilno optimiziran lokalni pipeline na relativno pristupačnom hardveru (poput tvoje 4060) izvlači maksimum iz modela, čineći AI ne samo igračkom, već ozbiljnim alatom koji štedi sate "peglanja" pozadina ili ispravljanja kuta osvjetljenja. Ukratko, priče o satima čekanja pripadaju eri loše postavljenih softverskih postavki, a ne limitacijama današnjeg hardvera.

 

Slažem se da je tehnologija napredovala puno brže nego što to sugeriraju neki zastarjeli testovi. S obzirom na tvoje iskustvo s ComfyUI-jem i optimizacijama, koji te aspekt modernih workflowa najviše oduševljava – brzina iteracije ili preciznost koju postižeš kroz napredne IPAdaptere?

Poruka je uređivana zadnji put pon 1.6.2026 11:59 (poter37a).
10 godina
offline
Lokalni generatori slika – imaju li smisla?

evo kao da je đepeto pisao, no....

 

ne fasciniram se uopce vise toliko aspektima samog generiranja slike, obislo me to, odavno se igram sa tim modelima da bi mi to nesto bilo wow, no ovi novi modeli imaju stvarne upotrebljive mogucnosti, osim stvaranja "cool slicica i memeova", tako da kad imam volje i vremena se vise baziram na "kako da to radi najbolje na onom sto imam" i kako da to natjeram da radi najbolje sto moze.

 

fazni pomak i razmisljanju s "1 zemska, velke sise", odnosno pisanja generickih literalnih promptova na stvarni inzinjering, koji jezicima medicine, fizike, kemije, biologije i matematike.... modelu govori sto se nalazi na slici je trenutno izuzetno zabavno, jer tu najbolje vidis i shvatis koliko su modeli napredovali, ali nazalost u nekim segmentima i nazadovali.

Its just the way of it, son. We all sell our souls sooner or later.
Moj PC  
1 0 hvala 0
17 godina
offline
Lokalni generatori slika – imaju li smisla?

Qwen-Image-2512, prompt 'grad' - cyberpunk scena s neonskim odrazima.

 

Ko da me je netko "pokrao"

Da se to ispeglati (vidi att)

xy
 
1 0 hvala 1
16 godina
offline
Re: Lokalni generatori slika – imaju li smisla?
SupremeCommander kaže...

ChatGPT Images 2.0 ih sve jede za dorucak. 

 Naslov clanka: "Lokalni generatori slika..."

 

Ali nema veze. Zašto nebi spomenili jedan od najboljih modela na planetu, koji se pokreće na mašinama... koje su postale veći ekološki problem od datacentara.

 

nikonja kaže...

Tako da se sad pitam za koga je ovaj članak uopće napisan. 

 Napisan je čisto da možemo malo pročitat o tome, i apsolutno ne napravit ništa po tom pitanju, 99%. A mogao bi biti koristan (ali koga boli briga) ekipi koja razmišlja o lokalnom pokretanju AI modela za generiranje slika (odma znaš da je slična situacija sa tekstualnim). A koja je to ekipa... ja znam za što bi meni bilo korisno, npr... bilježim se sa štovanjem XD

18 godina
offline
Re: Lokalni generatori slika – imaju li smisla?
Damir22 kaže...

"Sto je tocno Bug ovdje testirao i kako je testirao nemam pojma, no, i ovaj clanak je pun besmislica i netocnih tvrdnji." (...)

 

 

 

Uspoređuješ modele koji stanu u 8 GB s modelima koji u 8 GB fizički ne mogu stati ni uz optimizaciju. Dakle daješ usporedbe s drugim hardverom i softverom i na osnovu toga donosiš zaključke o hardveru i softveru koji nisi ni vidio.

 

Konkretan primjer: FLUX.2-dev koji smo mi testirali zauzima 64,4 GB i ima 32 milijarde parametara. FLUX2 KLEIN koji ti koristiš je destilirana izvedenica iste obitelji modela (4-9B parametara, destiliran iz punog FLUX.2 baze) namijenjena potrošačkim karticama - drastično manje parametara i niža gornja granica kvalitete. Nisi testirao "isti model na boljem hardveru", testirao si drugi, manji model. Na posve različitom hardveru.

 

Isto vrijedi za ostale tvoje primjere: Z IMAGE BASE, SDXL, SD 1.5, Pony - svi su dizajnirani da stanu u 8-12 GB VRAM-a. Mi nismo testirali te modele jer je tema bila: što može frontier open-weight model kad imaš dovoljno memorije? Ništa od toga što si ti naveo nije "frontier" ni po kojem kriteriju.

 

Zašto smo uopće koristili GX10? Točno zbog memorijskog zida koji ti sam spominješ - pišeš da Flux 2 DEV daje "česte OOM errore" na 8 GB.

 

Upravo to.

 

Nijedna potrošačka kartica danas - ni RTX 4090 s 24 GB, ni RTX 5090 s 32 GB - ne može učitati puni, nekvantizirani 64 GB model u VRAM bez offloadinga. A offload u sistemski RAM je upravo ono što tvoj pc usporava i čini nestabilnim (otud OOM-ovi). GX10 ima 128 GB unificiranog memorijskog prostora koji je dostupan i CPU-u i GPU-u istovremeno, bez podjele. To je jedina platforma consumer/prosumer segmenta na kojoj se takav model može uopće pokrenuti u cijelosti.

 

Ako ga kvantiziramo jer Q8 stane na 4090, radit će, ali kvantizacija degradira upravo ono što smo mjerili - referentni strop kvalitete pri punoj preciznosti. Cilj testa nije bio "koliko brzo dobiješ aproksimaciju modela", nego što taj model uopće daje kad ga ne sakatiš. Isto vrijedi za turbo/lightning LORE: ubrzavaju, i to i sami pišemo u zaključku članka, ali mijenjaju rezultat. Mi smo pokrenuli default bez prečaca koji bi išli na uštrb kvalitete jer mjerimo model.

 

Da, unificirana memorija je sporija od namjenskog VRAM-a na grafičkoj kartici - to smo naveli kao kompromis i to objašnjava zašto FLUX.2-dev traje 24 minute. Na hipotetskoj kartici s dovoljno VRAM-a (koje nema) bio bi brži. Ali takve kartice ne postoje za potrošačko tržište.

 

Zašto su ti veliki modeli uopće relevantni, ako su spori? Jer veća kompleksnost modela podiže gornju granicu kvalitete - osobito kod složenih scena s više elemenata i kod ljudskih lica. Famozna "scena prirode" na svim modelima ispadne kako-tako, uglavnom kao i ovi tvoji primjeri, odnosno ono što u tekstu zovem "Gospodar prstenova" - dakle fejk i vrišti AI.

Inače se slažem da je taj prompt ("photorealistic mountain landscape, crystal clear lake reflection, dramatic clouds, sharp detail") "relikt", ali tu je bio kao testni prompt za sve modele. To je ono što se zove "kontrolirana varijabla" jer bi bilo besmisleno gađati prompt po mjeri svakog modela posebno. Kako mogu znati da sam pogodio baš pravi za taj pojedini model? Evo im svima isti prompt, pa šta im bog da.

 

Ali ono što smo nazvali tehnička scena s tri uređaja na stolu ima posve različitu interpretaciju na malim i velikim modelima. Famozni "ljudi" odnosno scena ljudi u uredu varira od voštanih faca s besmislenim "tipkovnicama" i raznim artefaktima i pogrešnim anatomijama do nečega što izgleda gotovo kao fotografija. To mali modeli ne mogu napraviti.

FLUX.2-dev s 32 milijarde parametara i Mistral 3 text encoderom razumije i interpretira prompt na razini s kojom KLEIN ne može konkurirati. Testirali smo granicu sposobnosti, ne granicu brzine na jeftinom hardveru.

 

Dakle: tvoje brzine su posve točne - za male modele koje nismo testirali. U tekstu jasno piše koje smo modele testirali. Jasno smo naveli hardver, softver i metodologiju. Pa koje su to "netočne tvrdnje" za performanse ovih frontier open-weight modela na GX10?

 

This space for rent!
10 godina
offline
Lokalni generatori slika – imaju li smisla?

 

tocno je da je flux2dev jako tezak model, zajedno s enkoderom ce pojesti i do 90gb vrama. vasi testovi su provedeni na uredjaju koji doduse ima dovolju kolocinu vrama, ali koristi unificiranu memoriju koja je barem 5 puta sporija od one ugradjene na jednu 5090.

 

nadalje, gr10 cip ima graficki dio sa koliko? 6000 cuda jezgri? 5090 ima koliko ono? 24000 cuda jezgri? dalje, cijeli taj uredjaj trosi koliko trose sami ventilatori na 5090.

 

softerska optimizacija na arm platformi je smijurija, u kombinaciji s sporim vramom i zanemarivom broju cuda jezgri, glavni su razlozi zasto su rezultati basih mjerenja toliko losi.

 

svi modeli koje sam ja naveo su cista usporedba iskljucivo vremena. znaci, kucni korisnik, consumer low end hardver. i vremena koja su sasvim prihvatljiva za izgubiti da bi se malo poigralo s ejajem.

 

pa cak i sa full flux 2 modelom, koji, istina, ali to sam i napisao glasno i jasno, prakticki ne radi bez prinosenja zrtve bogovima ai intelegencije. no, u onim rijetkim trenutcima kad uspije sve prozvakati u bolnom i mucnom procesu saltanja podataka sa i u vram, ram, swap file - ne treba mu 24 minute za jednu sliku. ali taj primjer mozemo slobodno zanemariti, smatrati ga anomalijom koja se nije smjela desiti, a ne necim sto "radi".

 

softverska optimizacija je ubila ovaj uredjaj, koji je svakako sposoban za daleko vise, slazem se. ali frenutno to nije slucaj, i pobjedjuje ga daleko jeftiniji hardver. tako da osim "fun fact" i malo reklame, koja nikome ne skodi, tu nema bas nista za average joea.

 

ne vjerujem da u bugu ne postoji jedna 5090 kartica, i netko tko ce uz kavicu sloziti jednu lokalnu comfyui instalaciju, pa istestirati.... no, takvi rezultati u ovom testu bi bili kontraproduktivni i anti reklama ovom uredjaju, jer znam i tvrdim da cak ni 90gb model, pokrenut na 5090 i nekom modernom sistemu s 64gb ddr5 memorije nece potrositi 24 minute za jednu sliku u 1024x1024. u worst case scenariju, prosjecno ce mu trebati oko 2 do 2.5 minuta.

 

tako da, u pravu ste,.mea culpa, nisu neistine,.vec poluinformacije, uz presucivanje.bitnog elementa - high end pc unistava ovak reklamirani uredjaj u lokalnom generiranju slika s ai modelima.

 

"takve kartice nema" i "ne moze se pokrenuti u cjelosti". sto ovo znaci? niti jedan pc ne moze pokrenuti flux2 dev model? odakle to? on ne moze stati u kolicinu vrama niti jedne consumer kartice - tocno. niti jedna consumer kartica ne moze pokrenuti ovaj model? netocno.

  

Its just the way of it, son. We all sell our souls sooner or later.
Poruka je uređivana zadnji put uto 2.6.2026 0:25 (Damir22).
Moj PC  
1 0 hvala 0
18 godina
offline
Re: Lokalni generatori slika – imaju li smisla?
Damir22 kaže...

 

 

 

nadalje, gr10 cip ima graficki dio sa koliko? 6000 cuda jezgri? 5090 ima koliko ono? 24000 cuda jezgri? dalje, cijeli taj uredjaj trosi koliko trose sami ventilatori na 5090.

 

...

kartice - tocno. niti jedna consumer kartica ne moze pokrenuti ovaj model? netocno.

  

 

Koja consumer kartica može pokrenuti frontier (bilo koji) model veći od 32 GB? Daj mi ime te kartice.

 

Jesi li uopće pročitao odgovor i shvaćaš li što smo testirali, a što ti komentiraš?

 

 

This space for rent!
Poruka je uređivana zadnji put uto 2.6.2026 0:46 (Drago).
10 godina
offline
Re: Lokalni generatori slika – imaju li smisla?
Drago kaže...
Koja consumer kartica može pokrenuti frontier (bilo koji) model veći od 32 GB? Daj mi ime te kartice.

 

 

 

 

 Svaka.

 

Ok, hajmo ukljuciti razum, i ispraviti se - gotovo svaka. Odbacimo mucne eksperimente i kartice sa 6,8 i 12gb vrama, odbacimo sve kartice koje nisu Nvidia - i odgovor ostaje isti - svaka.

 

Jer - a to je ono sto ne razumijem gdje Vi vidite problem - model NE mora fizicki svojom velicinom stati u vram graficke kartice da bi isti radio.

 

A bas to potvrdjuje ono sto sam gore napisao i sto sam testirao. Ti testovi apsolutno jesu nerelevantni u usporedbi s vasim testiranjima, no kristalno jasno demonstriraju da model ne mora fizicki stati u kolicinu vrama.

 

Jer, ukoliko mora, kako onda radi? Kako cak i osiromaseni moderni model poput flux2 klein (9b), koji je sam tezak oko 10gb, s clipom koji je tezak 8gb radi na kartici s 8gb?

Kako neko merganje koje isti model gurne na 16-18gb, plus enkoder od 8gb opet jednako radi na kartici s 8gb vrama?

 

Kako flux2dev model koji s enkoderom pojede 90gb vrama ipak radi na grafickoj kartici koja ima "samo" 32gb vrama?

 

Magija se zove "cpu offloading" ili po naski - swappanje sa sistemskim ramom. Da, sistemski ram je ernomno sporiji, no, u pravilu, ima ga vise nego vrama.

 

I kad korisnik pokrene generiranje, njegovih 8, 16,  ili 32gb vrama se "instant" napuni, i onda pocima ping-pong s sistemskim ramom. Tako da kartica u svom vramu u svakom trenutku drzi samo ono sto obradjuje, sve ostalo se seta gore-dolje kroz vram/ram. Da, apsolutno, to nije idealna situacija, apsolutno usporava cijeli proces, no isti je i dalje dovoljno brz za kucnog korisnika, i cijela stvar radi izuzetno jednostavno.

 

Kada stvari gurnes u jos veci ekstrem, i kada kolicina vram+sistemski ram nije dovoljna, krece dodatna tura ping ponga sa swap fileom na disku. To je momentat gdje se desi odustajanje - ili odustaje korisnik, jer mu se ne ceka 4 sata (karikirano), ili odustaje model jer sistem ne moze toliko zonglirati, pa imamo OOM ili CUDA errore.

 

Idealan scenarij JE graficka kartica sa suludom kolicinom vrama enormne propusnosti (brzine), u kombinaciji s "six figure" kolicinom cuda jezgri, no, kako i sami kazete - takve kartice su rijetke, takve kartice su skupe, i tesko da ce se naci u prosjecnom kucnom pc-u.

 

Zato posao sasvim dobro odradjuju i ono sto mi nazivamo "gaming kartice". Tako da svaki korisnik relativno brzo i umjereno jeftino moze lokalno generirati slike, videe, animacije....

 

No, slobodno zanemarite i sve ovo gore napisano, teorija je jedno, praksa je drugo - uzmite neki average pc koji ima barem 64gb ddr5 memorije (pozeljno vise) i 5090 graficku karticu, instalirajte comfy, slozite workflow, i probajte pokrenuti taj vas full scale flux2dev model. Pa cete dobiti odgovor na pitanje - koja consumer kartica moze pokrenuti bilo koji model veci od 32gb.

 

E sad, tu u osnovi staje svaka daljnja diskusija i teoretiziranje s moje strane. Fair and squair - instalirajte, pokrenite, pa vidite dali radi ili ne. Ja jesam. Meni radi. Sreca, slucajnost, lutrija, bozja milost, nebitno.

 

 

Its just the way of it, son. We all sell our souls sooner or later.
Poruka je uređivana zadnji put uto 2.6.2026 7:58 (Damir22).
10 godina
offline
Re: Lokalni generatori slika – imaju li smisla?

dupli post....

Its just the way of it, son. We all sell our souls sooner or later.
Poruka je uređivana zadnji put uto 2.6.2026 7:57 (Damir22).
18 godina
offline
Re: Lokalni generatori slika – imaju li smisla?

Drago kaže...

Koja consumer kartica može pokrenuti frontier (bilo koji) model veći od 32 GB? Daj mi ime te kartice.

Jesi li uopće pročitao odgovor i shvaćaš li što smo testirali, a što ti komentiraš?

 

 

Ako pod consumer karticom smatraš karticu koju možeš kupiti u dućanu i ubaciti u svoje računalo, RTX6000 Pro.

 

https://www.instar-informatika.hr/graficka-pny-nvidia-rtx6000-pro-blackwell-workstation-edition-96gb-gd/274234/product/

 

Nisu jeftine, doduše :) ali imaju 96 GB memorije.

So if God has existed forever, you know, what did he do in his spare time? Like, before he made the Earth and everything?
Poruka je uređivana zadnji put uto 2.6.2026 8:46 (Father_Dougal).
18 godina
offline
Re: Lokalni generatori slika – imaju li smisla?

Ne smatram baš karticu od 13.500 eura "consumer", ali ono - strišo, zamalo, ako daju 5% popusta...

This space for rent!
18 godina
offline
Re: Lokalni generatori slika – imaju li smisla?
Damir22 kaže...
Drago kaže...
Koja consumer kartica može pokrenuti frontier (bilo koji) model veći od 32 GB? Daj mi ime te kartice.

 

 

 

 

 Svaka.

 

Ok, hajmo ukljuciti razum, i ispraviti se - gotovo svaka. Odbacimo mucne eksperimente i kartice sa 6,8 i 12gb vrama, odbacimo sve kartice koje nisu Nvidia - i odgovor ostaje isti - svaka.

 

 

OK.

 

Ovo je kao da komentiraš test teniskih reketa i buniš se što nisu testirane palice za golf.

Ja, dakle, razumijem da si ti htio neki drugi test, ali mi smo testirali frontier open wheight modele koji se mogu lokalno izvršavati. Lokalno se mogu izvršavati na nečemu što može primiti model od preko 70 GB, koliko je imao naš najveći model, dakle tvoje primjedbe su besmislene što i sam znaš, pa odatle i ovaj besmisleni odgovor da na svaku ("gotovo svaku") karticu stane i model s više od 32 GB zauzeća.

Žao mi je što nismo imali Mac Studio s hrpom RAM-a pa bi to bilo jedino što se može dodati u ovaj test što bi imalo smisla uspoređivati, ili da smo imali i Mac Studio i 256 GB verziju GX10 pa da mogu probati kako ti modeli rade na jednom i drugom (iako znam iz drugih testova da bi Mac Studio tu bio daleko bolji), a posebno da vidim kako stvarno radi HunyuanImage 3.0 kojeg na ovoj konfiguraciji nismo mogli testirati iako, naravno, "stane u gotovo svaku" karticu po tebi, a zapravo mu treba preko 200 GB memorije. 

This space for rent!
10 godina
offline
Lokalni generatori slika – imaju li smisla?

ne kuzim sto vama nije jasno, iskreno....

 

stane i radi su dva pojma. pa sto, cijeli community od par miliona clanova koji vrti sve modele, pa cak i taj od 90gb na 4080,4090,5090 karticama su sto - ludi? haluciniraju? na acid tripu? jedino bug zna da je to nemoguce.

 

znam da niste "to" testirali, ali tvrditi da je nemoguce taj model vrtjeti na kartici od 32gb vrama je.... neozbiljno.

 

no ok, eto, ne moze, over and out. peace!

Its just the way of it, son. We all sell our souls sooner or later.
Moj PC  
1 0 hvala 0
18 godina
offline
Re: Lokalni generatori slika – imaju li smisla?
Drago kaže...

Ne smatram baš karticu od 13.500 eura "consumer", ali ono - strišo, zamalo, ako daju 5% popusta...

OK, prosumer, jer ima Pro u nazivu :)

 

Činjenica jest da je dostupna bilo kome tko ju želi kupiti bez da se mora kontaktirati prodajnog predstavnika za jugoistočnu Europu. Po meni je to dio definicije consumer opreme. Kao i dotični ASUS kojeg ste testirali.

 

Mene bi sad više zanimala razlika u performansama između te skupe kartice i tog AI računala kojeg ste testirali. Pogotovo zato jer kartica ide u standardna računala, sa mogučnošću korištenja više operacijskih sustava.

So if God has existed forever, you know, what did he do in his spare time? Like, before he made the Earth and everything?
Poruka je uređivana zadnji put uto 2.6.2026 12:12 (Father_Dougal).
10 godina
offline
Lokalni generatori slika – imaju li smisla?

neusporedivo....

 

dedicated graficka te snage s tom kolicinom rama je kilometra iznad nekih arm rjesenja.... ali i kosta.

Its just the way of it, son. We all sell our souls sooner or later.
Moj PC  
1 0 hvala 0
18 godina
online
Re: Lokalni generatori slika – imaju li smisla?
Veliki Brat kaže...

Ima li što da može obraditi postojeću fotku?

Treba mi za obradu rendera kuća u projektiranju, nema apsolutno nikakve veze s fotkama bivše žene niti susjede...

 Probao sam ja urediti jednu kuhinju, više muke nego rezultata.

 

Probao sam gemini pro tj. nano banana 2, nekad te iznenadi koliko je realističan, nekad namjesti proporcije točno kako želiš, pa kad želiš promjeniti tip stolice onda pomakne sve u stranu jer "algoritam ne voli uske sobe". Pa kad napišeš da dimenzija mora biti točno kakva jest, kaže da AI ne razumije dimenzije. 

 

"Postavio sam 3 stolice jer na okrugli stol više pašu 3 stolice, iako sam svjestan da si tražio 2 stolice, evo nove slike sa 2 stolice" - na slici opet kvadratni stol sa 3 stolice. 

 

Nakon svega zaključak je da ti napravi 9/10 stvari odlično, ali UVIJEK zajebe jednu, toliko da ti je neupotrebljivo. 

Čak sam pokušao "obnoviti" slike ljudi jer me to prijatelji inače zamole da im odradim u Photoshopu, i iako često ispadne dobro, nekad oboji ženi kosu u ljubičasto jer ima ljubičastu suknju, pa "paše". I onda kažeš samo da obnovi boju kose, pa sjebe nešto drugo. I onda rafiniraš prompt to najsitnijeg detalja da bi ti nakon 50 krivih slika rekao sa ne smije generirati slike ljudi zbog sigurnosti jer su prije dva mjeseca prčkali po tome, vjerojatno jer je generator toliko realističan da je opasno. 

 

Mislim da su uz taj preoprezni i paranoični trigger za safety ubacili i taj faktor iznenađenja da ti uvijek nešto sjebe (iako je u prijašnjih 10 iteracija napravio isto) da što prije spržiš kvotu. 

 

Eto tako izgleda prva ideja za kuhinju, prva odlična. Sve super čak su i dimenzije kako spada.

 

 E onda ovu drugu se već natežemo tjedan dana kad me uhvati volja tu i tamo, da pomakne frižider bliže donjem desnom kutu, i da ispod prozora stavi isti ovakav okrugli stol sa 2 stolice kao na prvoj slici. 

kao što vidiš nemoguća misija, ili pomakne prozor ili proširi sobu "jer ne voli usko" ili mu "stol na dnu sobe nema smisla" pa ga je stavio di njemu paše.

I onda te pita da uploadaš tlocrt kako bi pohvatao dimenzije, pa ti kaže da nema mogućnosti čitanja sa slike i da mu termini kao dimenzije i orijentacije lijevo desno ne znače ništa jer kao AI ne zna što je lijevo a što desno. 

You can fall for chains of silver you can fall for chains of gold You can fall for pretty strangers and the promises they hold
Poruka je uređivana zadnji put sub 6.6.2026 13:06 (wyks).
18 godina
online
Lokalni generatori slika – imaju li smisla?

Ovo ću izdvojiti u dupli, koliko sam amazonske šume spalio generirajući ove slike, mogao sam naručiti to drvo i napraviti obje kuhinje pa se u 3Du igrati sa namještanjem dvije proklete stolice u dnu sobe ispod prozora :D

 

"AImittyville horor story."

Pokušaj Režije - Luka

Scenarist - Luka

Kostimografija - Gemini pro

Uloge igraju: Luka, Lukine halucinacije i Gemini pro.

 

 

"Nakon što su se Luka i njegova imaginarna zaručnica, koja ne postoji u stvranom životu ali ovo je film pa je i nemoguće moguće, konačno uselili u svoju kuhinju u koju su precizno u dno prostorije ispod prozora postavili bijeli okrugli stol sa dvije stolice, jednog sunčanog dana ništa ne sluteći ulaskom u kuhinju dočekuje ih stravičan prizor, njihov glatki bijeli okrugli stol je dobio ubilački oštre kuteve ali totalni šok od straha dožive kad ugledaju - treću stolicu - dok se na njihovom savršeno bijelom zidu ocrtava krvlju nacrtani karo logo uz natpis - kuhinja sad ima 2 stolice kako si i htio Luka!

 

Luka se u paničnom strahu okreće svojoj imaginarnoj zaručnici no njena kosa je - zelena poput torbe za plac. Luka, bolje paše ovako!

 

Luka pada na pod od šoka dok se prozor pomiče pola metra ulijevo i ispisuje se poruka:

 

"Bravo Luka, zbilja imaš dobro oko za dizajn, odlično si postavio 2 stolice u dno kuhinje kako bi ti i tvoja zaručnica citrusno žute kose, za koju čak i ja kao AI asistent znamo da je čisti plod fikcije, možete uživati u dnevnom svjetlu!"

 

Dok Luka staklenim i preneraženim pogledom gleda u strop, sa njega pada treća stolica i probija ga kroz prsa. 

 

Screen fades to black dok se u odrazu Lukinih mrtvih i staklenih očiju vidi natpis:

"Luka, uspječno smo odradili ovaj projekt! Tvoja kuhinja je sad sprena za uživanje! Kad god poželiš pokrenuti novi projekt tu sam za tebe!"

 

The End. 

You can fall for chains of silver you can fall for chains of gold You can fall for pretty strangers and the promises they hold
Poruka je uređivana zadnji put sub 6.6.2026 14:11 (wyks).
Moj PC  
0 0 hvala 2
18 godina
offline
Re: Lokalni generatori slika – imaju li smisla?

Hnmda, onda ipak ništa od toga, hvala Luka.

Moja iskustva su slična...

Ja sam pokušavao na uploadani render kuće izvana nalijepiti kamenu fasadu, crijep i urediti okućnicu, ali avaj!

Kako si rekao: sve bude okej osim jedne stvari (okej, dvije, redovito bi izmjestio prozore i/ili vrata ili dodao dimnuak gdje ga nema i sl.): svi ljudi koji su dodani na obrađenoj fotki su ispadali ravno iz horora. Ono, bez usta ili nosa, s crnim dupljama za oči, jednom nogom ili tri ruke itd.

Nadao sam se da će mi neki prompt mag dati uputu kako da to izbjegnem ali bojim se da ništa od toga.

Gledam te!
10 godina
offline
Lokalni generatori slika – imaju li smisla?

nema magije - 1 izmjena = 1 iteracija. pokusaj mijenjanja vise stvari u single passu = recept za katastrofu.

 

ne pisi ono sto ti zelis vidjeti - pisi ono sto on shvaca - matematika, fizika, geometrija.

 

 

Its just the way of it, son. We all sell our souls sooner or later.
Moj PC  
1 0 hvala 0
19 mjeseci
offline
Re: Lokalni generatori slika – imaju li smisla?
Jednostavnije je pokrenuti ikea program za slaganje kuhinje 😅
"Razumije" dimenzije i "poštuje" kako si označio gdje je prozor , i kako si složio , te imaš magični undo.
Ma da nije tako lijepa i živa fotografija.

Ovo UI-AI je previše halucinacija , kao ono gdje se honor hvalio fotografijama pa na telefoto digitalni zoom, dakle u daljini na tornju kojeg fotografiraju grb zamijeni analognim satom 🙄
Ono uljepša fotografiju i totalno ju upropasti.
Budi promjena koju želiš vidjeti u svijetu ASICS
8 godina
offline
Lokalni generatori slika – imaju li smisla?

Da li je netko probao ovaj lokalni AI. Gledam osvrte na webu, i cini se da je pun pogodak

 

Odysseus — A Self-Hosted AI Workspace

https://nestali.gov.hr/ 2800+ osoba se vodi kao nestali
Moj PC  
0 0 hvala 0
18 godina
offline
Re: Lokalni generatori slika – imaju li smisla?
Damir22 kaže...

nema magije - 1 izmjena = 1 iteracija. pokusaj mijenjanja vise stvari u single passu = recept za katastrofu.

 

ne pisi ono sto ti zelis vidjeti - pisi ono sto on shvaca - matematika, fizika, geometrija.

  

Da, tako najčešće završi o kod mene. Još najbolje, samo cropam taj komad da dodatno ne bunim model, pa krpam rezultate, ili radim inpaint funkciju sa alpha naznakom što želim izmjenu.
Za samo peglanje nekih detalja nije loš i topaz gigapixel sa "redefine creative" modelom (naravno plaća se, ali ne toliko koliko košta ovaj bugov asus), pogotovo jer jednostavno funkcionira unutar photoshopa.
ComfyUI samo za generiranje ili editiranje slika je dobra ideja voziti kroz swarmUI, ako ljude plaši comfy sučelje.
BUG i njihovu suradnju s Asusom i taj famozni ASUS Ascent GX10 nebih previše filozofirao jer ga ne posjedujem, no kratki google mi kaže da to nije alat za te namjene, nego:
"Fine-Tuning & Training: Modify open-source AI models privately, avoiding the costs and data-privacy risks of sending proprietary data to the public cloud.
AI Agent Automation: Utilize preloaded tools like NemoClaw for local AI agent development and testing"
Ovaj citat na koji si se ti također osvrtao:
"Za usporedbu, model FLUX.2-dev, koji smo testirali, sam po sebi zauzima 64,4 GB - dakle 4× više nego RTX 4080 ili RTX 5060 Duo. Bez unificiranog memorijskog sustava tipa GX10, ovaj model ne možete niti učitati."
Neznam, ja mogu pokrenuti taj notorni FLUX.2-dev i sa RTX 4080super i sa rtx 5090, pa ako netko ne vjeruje, ha - može se snimiti cijeli "postupak", iako sumnjam da bi to ikoga interesiralo osim povrijedilo ego autorima (i poznato je da je taj bazni masni flux2 dev bio teški fail prije trimanja, ne samo zbog težine, nego sporosti i plastičnih, zbljuranih i plastificiranih rezultata - u negdje isto vrijeme izašli Z-image ga je jeo za doručak, pri čemu o brzini bolje da ne pričamo, stvarno neznam koristi li itko živ danas flux2 dev pored njihovog klein ili qwen modela)...
Uglavnom neki moj komentar na temu članka je;
-lokalni modeli su bolji ponajviše zbog cenzure. Odavno za generativne slike online (pa i preko smartphone appsa) nije problem limit generacija, nego analiza sadržaja.
Kako se ja ponajviše bavim refiniranjem postojećeg materijala, meni txt to image nije od neke koristi.
Najbanalniji primjer; staru zblajhanu polaroid fotku dječje rođendanske proslave od prije 50tak godina, (čak i studijski plaćeni) servisi odbijaju popraviti oštećenja i kolorkorekciju jer - na fotki su djeca.
Dakle tu će jedan lokalni model odraditi nekih 80% kvalitete koju bi odradio top online model, ali će odraditi, pa čovjek može finiširati detalje raznih iteracija u photoshopu u neki final.

10 godina
offline
Re: Lokalni generatori slika – imaju li smisla?
overhaul kaže...
.... Bez unificiranog memorijskog sustava tipa GX10, ovaj model ne možete niti učitati."

Neznam, ja mogu pokrenuti taj notorni FLUX.2-dev i sa RTX 4080super i sa rtx 5090, pa ako netko ne vjeruje, ha 

 Pa tocno to sam i pokusao objasniti - naravno da je prednost ukoliko je model cijeli ucitan u superbrzu memoriju s masivnom propusnoscu, jer se na taj nacin dobiva brzina, no, to nikad nije bio "prime directive", odnosno onaj dio bez kojeg je rad nemoguc.

 

Da, ne moze se ucitati (jer ne postoji dovoljna kolicina memorije), ali, ucitava se dio po dio, a sve skupa na tom rangu hardvera predstavlja sekunde "kasnjenja" u odnosu na "imam i vise nego dovoljno memorije", a ma koliko "sporo" bilo, i dalje je nemjerljivo brze u odnosu na "generirali smo jednu 1024p sliku 24 minute"....

 

Svi novi modeli su toliko cenzurirani, i to ne samo na onom levelu kojeg user vidi - primjerice netocno "crtanje" odredjenih dijelova ljudske anatomije, vec i na onom levelu koji nikad ne "dodje" do korisnika, pocevsi od samog tekst encodera, koji u startu svaki dio prompta kojeg smatra "neprimjerenim" jednostavno ignorira, ili ga preinaci u nesto sto on smatra da je ok, preko encodera koji dodatno ocisti sve sto po nahodjenju smatra da nije ok.....

 

Kad ovo sve upakiras u level paranoicne zastite koju ima chat gpt recimo, gdje su se korporacije toliko zastitile da apsolutno sve predstavlja problem i razlog da model "odbije" generirati sliku - a sve skupa to nema veze s nikakvom "zastitom cudoredja" ili sprecavanjem zloupotrebe, dobijes da je sve to level light zabavice za generiranje jednih te istih internet memeova, generickih sterilnih "safe" slika (a iste su vec pocele zatrpavati internet), pa je jedino rjesenje ustvari lokalna generacija.

 

I tu dolazi taj paradoks, dok se "veliki" trude da stvore strogo kontrolirano okruzenje, koje ce masno naplacivati, i gdje ce korisnik ustvari biti tesko cenzuriran i kontroliran - prakticki kategorija gdje cekic odbija zakucati ekser jer je algoritam procjenio da postoji 2% sanse da se korisnik opali po prstima - "mali" pate zbog suludih cijena hardvera, i tog besmislenog trenda da su modeli sve veci i veci, a u osnovi, veliki dio toga otpada na sintetiku, genericke bilione parametara koji su u svom startu vec isfiltrirani na "prihvatljive"....

 

Open source je divna stvar, ali buducnost open sourcea u ovom kontekstu je (bojim se) samo u nizem levelu kontrole, a ne u postizanju maksimalne "suti i radi" autonomije, gdje je korisnik taj "moralni filter" koji odlucuje sto zeli napraviti, a alat je samo alat koji bez pogovora slusa.

 

I ponovo, ne, ne radi se o nsfw sadrzaju, ne radi se o deep fake, ne radi se o zloupotrebi - vec jednostavno, brzem i ucinkovitijem nacinu odradjivanja uobicajenih i po nicemu spornih "taskova".

 

I bas mi drago da je netko napisao kako nema problema s pokretanjem 64gb modela na grafickoj koja ima "samo" 32gb, jer na momente sam se vec poceo plasiti da zivim u nekoj alternativnoj stvarnosti. 

 

 

Its just the way of it, son. We all sell our souls sooner or later.
1
Nova poruka
E-mail:
Lozinka:
 
vrh stranice