html parser

poruka: 8
|
čitano: 2.745
|
moderatori: Lazarus Long, XXX-Man, vincimus
1
+/- sve poruke
ravni prikaz
starije poruke gore
16 godina
neaktivan
offline
html parser
pitanje

Da li neko ima gotov kod za pronalazak jedne odredjene rijeci ili stringa unutar html koda  ? Tj. od gomile teksta na nekoj stranici zelim da mi isparsa tako da mi na kraju prikaze samo jednu zeljenu rijec  od gomile rijeci na toj istoj stranici

 
0 0 hvala 0
17 godina
offline
RE: html parser

Uffff... ja san si sam pisao vremensku prognozu, konvertor valuta i pars 2. HNL tablice  pars preko XML-a, malo zaebancije ali kad jednom napravis imas sta hoces...

I'm going woo woo
16 godina
neaktivan
offline
RE: html parser
autorov komentar

i ?

17 godina
offline
html parser

Daj konkretan primjer... i koji jezik (i biblioteke) koristiš?

 
0 0 hvala 0
17 godina
offline
html parser

MSXML i ASP.Net...

 

:)

 

nema ti druge nego preko XML-a parsat kompletan kod stranice sa koje zelis vuc i onda samo napravis algoritam koji ce ti rastavljat npr. tablicu na redove, pa onda iz toga vadit td-ove pa iz toga vadit konkretnu informaciju...

 

Javi se na PM pa cu ti poslat kod za vremensku, mozda ti pomogne...

I'm going woo woo
 
0 0 hvala 0
17 godina
offline
html parser

Jesi probao sa Regexom?

Nedavno sam morao napraviti parsiranje meteo.hr stranice, i na kraju se sve svelo na nekoliko regex izraza koji mi hvataju podatke ispisane na stranic. Takodzer, svi crawleri za web stranice koje sam vidio koriste regex.

"A developer is a machine that converts coffee into code"
Poruka je uređivana zadnji put sri 17.9.2008 9:30 (hudo).
Moj PC  
0 0 hvala 0
17 godina
offline
html parser

Lol ja za to nisam zna...

 

Ali sam se satrsa sa instr("<td>")... mid(...) milijun komandi u funkciji koju koristim lol...

 

Hvala na tom :)

I'm going woo woo
 
0 0 hvala 0
17 godina
offline
RE: html parser
hudo kaže...

Jesi probao sa Regexom?

Nedavno sam morao napraviti parsiranje meteo.hr stranice, i na kraju se sve svelo na nekoliko regex izraza koji mi hvataju podatke ispisane na stranic. Takodzer, svi crawleri za web stranice koje sam vidio koriste regex.

 Jep Slažem se. Regular Expression. Moćan alat u bilo kojem pogramskom jeziku
Pozdrav Svi smo mi ovce
1
Nova poruka
E-mail:
Lozinka:
 
vrh stranice