
Συσχέτιση: δύο μεταβλητές τείνουν να ποικίλουν μαζί. Για μια θετική συσχέτιση, αν μια μεταβλητή αυξάνεται, η άλλη αυξάνει και στα δεδομένα δεδομένα.
Αιτία: μία μεταβλητή προκαλεί τις αλλαγές σε μια άλλη μεταβλητή.
Σημαντική διαφορά: Η συσχέτιση μπορεί να είναι απλώς σύμπτωση. Ή ίσως κάποια τρίτη μεταβλητή αλλάζει τα δύο.
Για παράδειγμα: Υπάρχει συσχέτιση μεταξύ του "ύπνου που φορούσε τα παπούτσια" και του "ξύπνημα με πονοκέφαλο". Αλλά αυτή η σχέση δεν είναι αιτιακή, επειδή ο πραγματικός λόγος για αυτή τη σύμπτωση είναι (πολύ) αλκοόλ.
"Υπάρχουν τρία είδη ψεύδους: ψέματα, καταραμένα ή λευκά ψέματα και στατιστικά στοιχεία" - εξηγήστε;

Η φράση αποδόθηκε στην αυτοβιογραφία του Mark Twain στον Μπέντζαμιν Ντιραμέλι, βρετανό πρωθυπουργό κατά τη δεκαετία του 1800. Ο Twain ήταν επίσης υπεύθυνος για τη διαδεδομένη χρήση της φράσης, αν και μπορεί να είχε χρησιμοποιηθεί πολύ νωρίτερα από τον Sir Charles Dilke και άλλους. Στην ουσία, η φράση εκφράζει σαρκαστικά την αμφιβολία των στατιστικών στοιχείων, συγκρίνοντάς την με τα ψέματα, υποδηλώνοντας ότι συχνά αλλοιώνονται παραπλανητικά ή χρησιμοποιούνται εκτός πλαισίου. Για τους σκοπούς της παρούσας φράσης, ως «στατιστικά στοιχεία» νοούνται τα «δεδομένα».
Γιατί μια τιμή R-Squared δεν δείχνει τίποτα για την αιτιώδη συνάφεια;

Ένα R-τετράγωνο υποδεικνύει πόσο καλά τα παρατηρούμενα δεδομένα ταιριάζουν με τα αναμενόμενα δεδομένα, αλλά μόνο σας δίνει πληροφορίες σχετικά με τη συσχέτιση. Μια τιμή R-τετράγωνο υποδεικνύει πόσο καλά τα παρατηρούμενα δεδομένα σας, ή τα δεδομένα που συλλέξατε, ταιριάζουν με μια αναμενόμενη τάση. Αυτή η τιμή σας λέει τη δύναμη της σχέσης αλλά, όπως όλες οι στατιστικές δοκιμές, δεν υπάρχει τίποτα δεδομένο που να σας λέει την αιτία πίσω από τη σχέση ή τη δύναμή της. Στο παρακάτω παράδειγμα, μπορούμε να δούμε ότι το γράφημα στα αριστερά δεν έχει καμία σχέση, όπως υποδεικνύεται από την χαμηλή τιμή R-τετραγώνων. Το γράφημα στα
Πώς μπορώ να υπολογίσω τα ακόλουθα στατιστικά στοιχεία του χρόνου ζωής του κινητήρα; (στατιστικά στοιχεία, θα εκτιμούσα πραγματικά τη βοήθεια με αυτό)

"a)" 4 "b) 0.150158" "c) 0.133705" "Σημειώστε ότι μια πιθανότητα δεν μπορεί να είναι αρνητική, επομένως υποθέτω ότι πρέπει να υποθέσουμε ότι το x μεταβαίνει από 0 σε 10." "Πρώτα απ 'όλα πρέπει να καθορίσουμε το c έτσι ώστε το άθροισμα όλων των πιθανοτήτων να είναι 1:" int_0 ^ 10 cx ^ 2 (10 - x) "" dx = c int_0 ^ 10 x ^ 2 (10 - "dx = 10c int_0 ^ 10x ^ 2dx-c int_0 ^ 10x ^ 3dx = 10c [x ^ 3/3] _0 ^ 10- c [x ^ 4 / 3 - 10000 c / 4 = 10000 c (1/3 - 1/4) = 10000 c (4 - 3) / 12 = 10000 c / 12 = 1 = Ε (Χ ^ 2) - (Ε (Χ)) ^ 2Ε (Χ) = int_0 ^ 10 0,0012 χ ^ 3 (10χ) dx =