ece-auth-knn-mpi

School of Electrical and Computer Engineering, Aristotle University of Thessaloniki

This is the second assignment for the course "Parallel and Distributed Systems" for the 2019-2020 academic year.

Files description:

knnring.h: Header file for the 3 different implementations.
knnring_mpi_async.c: Source file for the MPI with asynchronous communication implementation.
knnring_mpi_sync.c: Source file for the MPI with synchronous communication implmentation.
knnring_sequential.c: Source file for the sequential implementation.
mpi_async.sh: Bash script for the MPI with asynchronous communication deployment.
mpi_sync.sh: Bash script for the MPI with synchronous communication deployment.
tester.c: Source file for the code correctness tester for the sequantial implementation provided by the professors.
tester_helper.h: Header file for the tester provided by the professors.
tester_mpi.c: Source file for the code correctness tester for the MPI implementation provided by the professors.
Assignment.pdf: The assignment.
Report.pdf: The assignment's report.

Περιγραφή του προβλήματος:

Ζητούμενο της εργασίας ήταν η δημιουργία ενός αλγορίθμου ο οποίος για κάθε σημείο ενός συνόλου Χ βρίσκει τους k πλησιέστερους γείτονες (σημεία) και τις αντίστοιχες αποστάσεις στο σύνολο αυτό.

Σημαντικό: Η υλοποίησή μου είναι της λογικής Row Major.

Σειριακή υλοποίηση:

Η συνάρτηση kNN() βρίσκει τους k πλησιέστερους γείτονες (σημεία) που ανήκουν σε ένα σύνολο X και τις αντίστοιχες αποστάσεις για κάθε σημείο του συνόλου Y. Υπάρχουν αναλυτικά σχόλια μέσα στον κώδικα που επεξηγούν επακριβώς τη συνάρτηση.

Για την ταξινόμηση των πλησιέστερων αποστάσεων χρησιμοποιήθηκε μια συνάρτηση quickSort() με τις βοηθητικές της partition() και swap().

MPI-σύγχρονη υλοποίηση:

Η συνάρτηση distrAllkNN() καλείται από όλες τις MPI διαδικασίες με διαφορετικό κομμάτι της διαμέρισης Χ του ολικού συνόλου και φροντίζει για την εύρεση των πλησιέστερων γειτόνων από όλα τα υποσύνολα Χ’ που έχουν διαμοιραστεί στις MPI διαδικασίες και των αντίστοιχων αποστάσεων για κάθε σημείο του αρχικού συνόλου της Χ. Υπάρχουν αναλυτικά σχόλια μέσα στον κώδικα που επεξηγούν επακριβώς τη συνάρτηση.

Αυτό που αξίζει να σημειωθεί είναι ο τρόπος επικοινωνίας μεταξύ των MPI διεργασιών για ανταλλαγή των σημείων τους και υπολογισμό όλων των αποστάσεων. Οι διεργασίες οργανώνονται σε ένα «δαχτυλίδι». Έτσι μετά από κάθε υπολογισμό των αποστάσεων μεταξύ του αρχικού συνόλου Χ και ενός άλλου υποσυνόλου Χ’ που δέχτηκαν από την ακριβώς προηγούμενη διεργασία, καλούνται να δώσουν το σύνολο σημείων Χ’ που προηγουμένως έλαβαν στην αμέσως επόμενη διεργασία και να παραλάβουν ένα καινούργιο σύνολο σημείων από την αμέσως προηγούμενη διαδικασία. Ο υπολογισμός τελειώνει μετά από n-1 ανταλλαγές σημείων, δηλαδή όταν όλα τα σύνολα σημείων περάσουν από όλες τις MPI διεργασίες.

Επειδή εδώ χρησιμοποιείται σύγχρονη επικοινωνία με τις συναρτήσεις MPI_Send() και MPI_Recv(), μια διεργασία δε γίνεται να στέλνει και να λαμβάνει σημεία ταυτόχρονα. Έτσι, κάθε ανταλλαγή έχει δύο φάσεις: στην πρώτη φάση οι διεργασίες με ζυγό αριθμό ταυτότητας στέλνουν σημεία και οι διεργασίες με μονό αριθμό ταυτότητας λαμβάνουν, ενώ στην επόμενη φάση γίνεται το ανάποδο.

MPI-ασύγχρονη υλοποίηση:

Εδώ η συνάρτηση distrAllkNN() λειτουργεί με τον ίδιο τρόπο όπως η αντίστοιχη στη σύγχρονη υλοποίηση, με μόνη διαφορά το κομμάτι της επικοινωνίας μεταξύ των διεργασιών για ανταλλαγή των συνόλων σημείων τους. Εδώ χρησιμοποιείται ασύγχρονη επικοινωνία με τις συναρτήσεις MPI_Isend() και MPI_IRecv(). Έτσι μια διεργασία μπορεί να στέλνει και να λαμβάνει πληροφορίες, καθώς και να συνεχίζει τους υπολογισμούς της. Έτσι, πριν από κάθε νέο υπολογισμό οι διεργασίες MPI φροντίζουν να έχουν ήδη αρχίσει την ανταλλαγή των απαραίτητων νέων σημείων πριν την εκκίνηση του προηγούμενο υπολογισμού. Σε περίπτωση που δεν έχουν προλάβει, αναγκάζονται να περιμένουν μέχρι να ολοκληρωθεί η προηγούμενη ανταλλαγή. Στόχος είναι να «κρυφτεί» το κόστος της επικοινωνίας.

Compile:

Για να κάνετε compile τον κώδικα ανοίγετε ένα terminal στον φάκελο που κατεβάσατε από το github link στο τέλος της αναφοράς και πληκτρολογείτε την εντολή:

gcc knnring_sequential.c tester.c -O3 -lm -lopenblas -o knnring_sequential για τη σειριακή υλοποίηση, την
mpicc knnring_sequential.c knnring_mpi_sync.c tester_mpi.c -O3 -lm -lopenblas -o knnring_mpi_sync για την MPI_σύγχρονη υλοποίηση και την
mpicc knnring_sequential.c knnring_mpi_async.c tester_mpi.c -O3 -lm -lopenblas -o knnring_mpi_async για την MPI_ασύγχρονη υλοποίηση.

Επικύρωση ορθότητας:

Η εργασία τρέχει κανονικά στους testers (προ 28/11 και τωρινούς) τοπικά. Στο elearning τρέχει κανονικά το knnring_sequential κομμάτι, ωστόσο το knnring_mpi εμφανίζει segmentation fault χωρίς να μπορώ να βρω το λόγο που συμβαίνει αυτό.

Αποτελέσματα:

Το HPC IT AUTh ακόμη δεν έχει λύσει το πρόβλημά μου με Illegal Instruction, παρόλο που τους έχω ενημερώσει από το βράδυ της Τετάρτης 27/11. Έχω ψάξει και δοκιμάσει πάρα πολλά πράγματα, ωστόσο μάλλον έχω καταλήξει ότι είναι θέμα του openblas module του hpc/pdlabs. Περιμένω την απάντησή τους.

Αναμενόμενα αποτελέσματα είναι η γρηγορότερη εκτέλεση του knnring_mpi_async, καθώς κρύβει το κόστος της επικοινωνίας κατά τη διάρκεια των υπολογισμών. Θέλω να δοκιμάσω αν χρειάζεται ποτέ αναμονή για τα προηγούμενα δεδομένα και κατά πόσο το 1Gbit δίκτυο του cluster είναι bottleneck. Λογικά λόγω του 1Gbit δε θα φανεί εύκολα διαφορά, το κόστος επικοινωνίας θα είναι ήδη μικρό. Μένει να το επιβεβαιώσω με πραγματικά test και δεδομένα. Ίσως αρχίσουν να φαίνονται διαφορές αν αυξήσω κατά πολύ τα σημεία του Χ και τις διαστάσεις τους.

Τοπικά μετρήθηκε ο χρόνος επικοινωνίας και υπολογισμών. Ο πρώτος είναι πραγματικά ελάχιστος μπροστά στο δεύτερο, γι’ αυτό και απουσιάζουν τα οποιαδήποτε αποτελέσματα.

UPDATE: Επιτέλους λειτουργεί κανονικά το cluster, αυτή τη φορά χρησιμοποιούμε τη βιβλιοθήκη netlib για το cblas. Οι δοκιμές έγιναν με πλησιέστερους-γείτονες-k=10 και MPI ρυθμίσεις 4 nodes και 1 task ανά node, έτσι ώστε οι επικοινωνίες να μην είναι εσωτερικές, αλλά να μεσολαβεί το Ethernet δίκτυο. Παρακάτω φαίνονται τα αποτελέσματα:

MPI - Σύγχρονη (δευτερόλεπτα)	Μέσος χρόνος επικοινωνίας (node2node)	Μέσος χρόνος υπολογισμών (ανά node)	Συνολικός χρόνος εκτέλεσης
N = 1000 D = 100	0.191101	2.462014	10.48296
N = 1000 D = 1000	0.261627	4.72877	19.84508
N = 1000 D = 2000	0.51093	7.192621	30.7433
N = 1000 D = 4000	0.871462	12.7537	54.14556
N = 1000 D = 8000	1.525818	23.16828	98.09934
N = 1000 D = 10000	1.967815	28.37235	120.4636
N = 2000 D = 100	0.825952	21.15492	87.93721
N = 2000 D = 1000	0.980878	30.1525	124.3443
N = 2000 D = 2000	1.429897	40.04982	165.4467

MPI - Ασύγχρονη (δευτερόλεπτα)	Μέσος χρόνος καθυστέρησης λόγω επικοινωνίας (node2node)	Μέσος χρόνος υπολογισμών (ανά node)	Συνολικός χρόνος εκτέλεσης
N = 1000 D = 100	0.092451	2.527258	10.59146
N = 1000 D = 1000	0.164443	4.752694	19.71357
N = 1000 D = 2000	0.267662	7.208123	30.05296
N = 1000 D = 4000	0.621664	12.75198	53.38731
N = 1000 D = 8000	0.978412	23.19955	96.64185
N = 1000 D = 10000	1.124576	28.32867	118.0231
N = 2000 D = 100	0.265974	21.22395	86.24951
N = 2000 D = 1000	0.664569	30.29356	124.1224
N = 2000 D = 2000	1.179835	39.96057	164.7665

Συμπέρασμα: Οι χρόνοι υπολογισμών στη σύγχρονη και ασύγχρονη υλοποίηση είναι σχεδόν ίδιοι, όπως αναμενόταν. Επίσης, από τα δεδομένα είναι ξεκάθαρο ότι ο μέσος χρόνος καθυστέρησης λόγω επικοινωνίας είναι χαμηλότερος στην ασύγχρονη υλοποίηση του MPI. Τα κέρδη στο συνολικό χρόνο εκτέλεσης είναι εμφανή μόνο για μεγάλες διαστάσεις, όμως και πάλι λόγω των εκτενών υπολογισμών και των σχετικά λίγων δεδομένων που απαιτούνται, το κέρδος δε γίνεται ποτέ μεγαλύτερο από 3% επί του συνολικού χρόνου εκτέλεσης του προγράμματος.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ece-auth-knn-mpi

Files description:

Περιγραφή του προβλήματος:

Σειριακή υλοποίηση:

MPI-σύγχρονη υλοποίηση:

MPI-ασύγχρονη υλοποίηση:

Compile:

Επικύρωση ορθότητας:

Αποτελέσματα:

About

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 21 Commits
Assignment.pdf		Assignment.pdf
LICENSE		LICENSE
README.md		README.md
Report.pdf		Report.pdf
knnring.h		knnring.h
knnring_mpi_async.c		knnring_mpi_async.c
knnring_mpi_sync.c		knnring_mpi_sync.c
knnring_sequential.c		knnring_sequential.c
mpi_async.sh		mpi_async.sh
mpi_sync.sh		mpi_sync.sh
tester.c		tester.c
tester_helper.h		tester_helper.h
tester_mpi.c		tester_mpi.c

License

LambisElef/ece-auth-knn-mpi

Folders and files

Latest commit

History

Repository files navigation

ece-auth-knn-mpi

Files description:

Περιγραφή του προβλήματος:

Σειριακή υλοποίηση:

MPI-σύγχρονη υλοποίηση:

MPI-ασύγχρονη υλοποίηση:

Compile:

Επικύρωση ορθότητας:

Αποτελέσματα:

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages