Cini se da izvorni materijal na kojem je treniran ai treba skrivati kao zmija noge, jer bi inace netko zbog takve vrste transparentnosti mogao uputiti argumentiranu kritiku, a to onda nije fora.
"Najgluplji" napad na ChatGPT natjerao ga na otkri
- poruka: 4
- |
- čitano: 5.538
- |
- moderatori:
vincimus
- +/- sve poruke
- ravni prikaz
- starije poruke gore
I sto tocno imaju od tih podataka? Vjerojatno im se takodjer moze pristupiti google trazilicom, ali tamo negdje 389. stranica
sad si postavljam pitanje, ako je chat gpt javno dostupan, zasto bi podaci na kojima je trenirao trebali biti tajni? Nije da openAI ima ikakvu ekskluzivu na njih. Nije da su sami pisali znanstvene radove i trenirali ga s njima.
Jedan od razloga tajnosti je copyright i sl. Ako znaš da ChatGPT vuče podatke sa tvoje stranice mogao bi tražiti kompenzaciju (kao što to već traže neki mediji). Ako imaš stranicu s određenim informacijama i zarađuješ od reklama na istoj onda bi mogao tužiti kompaniju iza ChatGTP-a za "web scraping" jer ti uzima zaradu, slično kao što su news portali tužili Google. To je vjerojatno glavni razlog zašto skrivaju podatke. A i razlog da se ne trude implementirati prikaz izvora podataka.