| 1 | = Applications = |
| 2 | |
| 3 | [available/unavailable se refera probabil la tipul resursei care a generat fault-ul (eg cpu availability 60% sau o resursa unavailable)] |
| 4 | |
| 5 | * care dintre motivele de fault apare cel mai des in event-uri event_trace.event_end_reason - claudiu |
| 6 | * care este durata medie a event-urilor - cristina |
| 7 | * MapReduce DONE |
| 8 | * Pig DONE |
| 9 | * ce componenta apare cel mai des in fault event-uri component.component_type code - claudiu |
| 10 | * avand event-urile impartite pe categorii dupa durata, care este cauza de fault cea mai intalnita pe fiecare categ event_trace.event_end_reason - cristina [-> sch in enumerarea pe fiecare categ a numarului de joburi terminate din fiecare cauza frecventa (>1000 failed)] |
| 11 | * MapReduce DONE |
| 12 | * Pig DONE |
| 13 | * pt fiecare categ din event_trace.event_end_reason code ranges, care dintre event_trace.event_end_reason code definitions apare cel mai des (numarul de dati cat apare fiecare..) - claudiu |
| 14 | * in ce locatie geografica sunt nodurile pe care se inregistreaza cele mai multe failure-uri (node_location luat uitandu-ne dupa node_id din event_trace) - cristina |
| 15 | * MapReduce DONE |
| 16 | * Pig DONE |
| 17 | |
| 18 | Obs: pt Pig, comment-urile din input, desi nu afecteaza functionarea script-ului, nu sunt ignorate iar rezultatele ce implica un COUNT (precum media) nu vor fi corecte |
| 19 | Sol: o functie custom de citire sau scoaterea comment-urilor din fisierul de input |