Apache Spark zadatak

poruka: 1
|
čitano: 7.423
|
moderatori: Lazarus Long, XXX-Man, vincimus
1
+/- sve poruke
ravni prikaz
starije poruke gore
8 godina
offline
Apache Spark zadatak

Pozz, imam jedan problem kod sparka. Zna li netko kako li mogu navedeni postgresql query napisati uz pomoc RDD operacija tako da konacni rezultat bude isti kao kad ga pokrenem u postgresu. Znam da ponajprije moram koristiti transformations ali neznam kako napraviti join, dali je isto kao u postgresu ili. Rjesenje sam mislio napisati u pysparku.

 

SELECT Tournaments.TYear,Countries.Name,Max(Matches.MatchDate)- Min(Matches.MatchDate)AS LENGTH

FROM Tournaments,Countries,Hosts,Teams,Matches

WHERE Tournaments.TYear = Hosts.TYear AND Countries.Cid = Hosts.Cid AND(Teams.Tid = Matches.HomeTid OR Teams.Tid = Matches.VisitTid)AND date_part('year', Matches.MatchDate)::text LIKE(Tournaments.TYear ||'%')

GROUPBY Tournaments.TYear,Countries.Name

ORDERBY LENGTH,Tournaments.TYear ASC

Moj PC  
0 0 hvala 0
1
Nova poruka
E-mail:
Lozinka:
 
vrh stranice