Obrada audio datoteke, text to speech... (Audio i video alati) @ Bug.hr Forum

14 godina

neaktivan

offline

uto 10.5.2016 10:38

Odgovori Citiraj

Obrada audio datoteke, text to speech...

Pozz...

imam jedan problemcic...

Ugl, radi se o zvucnim zapisima na racunalu. Ukoliko imam dva zvucna zapisa, koje su kreirale dvije razlicite osobe, znaci svaki od njih ima odredjenu "boju". Postoji li neki "filtar", nesto u tom obliku, kroz koji mogu provuci jedan od ta dva zvucna zapisa, da bi onda on poprimio zeljenu "boju" tj slicio na drugi zvucni zapis. Znaci, ideja mi je da npr 2 osobe snime svoj zvucni zapis, jedan od ta dva zapisa provucem kroz filtar, i dobijem zvucni zapis koji je isti/slican po "boji" kao drugi zapis koji nisam filtrirao.

Da jos malo pojasnim na sto tocno mislim:

Ukratko, ako npr neki Ivan Horvat osobno snimi neku zvucnu datoteku, i ja osobno snimim neku zvucnu datoteku. Na koji nacin bi izjednacili te dvije datoteke? Znaci, zvucnu datoteku koju sam ja nasnimio, provucemo kroz filtar, a ona je nakon izlaska obradjena, te onaj tko ju slusa stjece dojam da je to glas Ivana Horvata i da ju je on nasnimio. Znaci, da jednu provucemo kroz preddefinirani filtar, i da ona nakon prolaska kroz filtar slici onoj drugoj.

Eto, nesto u tom stilu... bilo sta na tragu moguceg/pribliznog rijsenja... postoji li?!

Kako pretpostavljam da je ovo gore navedeno znanstvena fantastika ... pa je shodno tome u nastavku malo "realnija" opcija

Onda ovako, druga kombinacija.

Snimim tekstualnu datoteku odredjenog sadrzaja. Koristenjem nekog "text to speech" mehanizma netko od vas napravi jednu svoju datoteku. Da li je sada moguce da te dvije datoteke budu "iste" po "boji" itd? Znaci taj "text to speech" bude "isprogramiran/konfiguriran" na taj nacin da "boja" datoteke koja se kreirala odgovara svojstvima datoteke koju sam ja nasnimo. Da li je u ovom slucaju lakse dobiti nesto zadovoljavajuce kvalitete.

Sto se tice "text to speech" tehnologije znam da je daleko od idealne, i da ne zvuci prirodno. Da li je netko imao iskustva sa "text to speech" tehnologijom, kakvi su dojmovi, tj najbolja iskustva? Takodjer, sto je sa cijenom i slicno?

Meni je potrebno samo kroz "text to speech" provuci jednu rijec, znaci vi bi napisali samo jednu rijec koja bi se onda obradila sa "text to speech" mehanizmom. Ukoliko bi zahtjev bio da to obvezno bude ime, da li text to speech sam "prepoznaje" imena, pa ih u tom slucaju onda i bolje/prirodnije "izgovara"? Znam naravno, da "text to speech" paket mora biti lokaliziran, takodjer i zbog imena...

Eto, puno pitanja...

(MODERATOR stavio sam temu na vise mjesta, posto se drugaciji profil ljudi okuplja na razlicitim podforumima, te sama tema sadrzi elemente vise podrucja.)

trajni link

0 0 hvala 0

mbaksa

18 godina

moderator

offline

uto 10.5.2016 14:15

Odgovori Citiraj

Re: Obrada audio datoteke, text to speech...

Nisam čuo za tako neki program. "Boja" zvuka je posljedica različitog udjela frekvencija, odnosno različitih amplituda konkretnih frekvencija.

Ručno bi se to radilo parametarskim EQ-om, pri čemu bi ti mogli pomoći dodaci za vizualizaciju frekvencija, recimo dodatak poput ovog. Znači, trebao bi dignuti amplitude raspona frekvencija koje su preniske, spustiti one koje su previsoke u odnosu na željenu zvučnu datoteku - drugim riječima, "izjednačiti" (doslovce što EQ znači).

Rekoh prije da nisam čuo, ali sam išao malo izguglati - treba guglati match EQ. I onda vidiš da postoje neki programi/pluginovi koji pomažu u tome, npr. ovo, ovo, ovo, ovo. Sad, kolika je uspješnost - to ćeš morati sam provjeriti. Brijem da bi trebalo identični zvuk snimiti na dva načina (u različitim prostorijama, s različitim mikrofonima), onda napraviti match EQ i onda taj "match" koristiti za konkretne snimke.

Kad se gugla automatic EQ, također se nekad može dobiti slično:

Poruka je uređivana zadnji put uto 10.5.2016 14:20 (mbaksa).

trajni link nadporuka

0 0 hvala 0

lord051

14 godina

neaktivan

offline

sri 11.5.2016 12:18

Odgovori Citiraj

Obrada audio datoteke, text to speech...

hvala ti definitivno cu pregledat sve ovo! napravit testove!

Ideja je bila, da se glas "text to speech" mehanizna prilagodi boji glasa datoteke koju sam ja vec unaprijed nasnimo. Recimo da je datoteka koju sam vec prije nasnimio fiksna, jedino sta se mijenja je "text to speech" input.

Pa kad se radi/programira/konfigurira "text to speech" mehanizam, pa tamo se isto na neki nacin bira/podesava neka "boja" glasa. E pa onda je moguce namjestit da je ta "boja" jednaka boji glasa vec unaprijed snimljene datoteke, u ovom slucaju mom glasu.

Znam da ne moze bit idealno, ali nesto sto ce dat priblizno rijesnje. Tada kada dobijem "text to speech" priblizno dobre kvalitete, onda mogu i nasnimljenu moju zvucnu datoteku digitalno obradit, da se jos priblizim "text to speech" boji. Bitno je samo da je sto slicnije...

Znaci, u principu, sto me zanima, da li je, tj kako je moguce napraviti/iskonfigurirat "text to speech" mehanizam na neku zeljenu "boju", npr na nesto sta je priblizno mom glasu... kako doc do toga?!

trajni link

0 0 hvala 0