Semalt: Ένας έξοχος οδηγός για τον αποκλεισμό ανεπιθύμητων παραπομπών στο Google Analytics

Ο Nik Chaykovskiy, ο ειδικός από την Semalt , διαβεβαιώνει ότι το spam παραπομπής είναι ένα από τα προβλήματα που αντιμετωπίζουν σήμερα οι webmaster. Η κατάσταση επιδεινώνεται με την πάροδο των ετών, πράγμα που σημαίνει ότι κάποιος κάπου βγάζει πολλά χρήματα από τη δημιουργία ανεπιθύμητων μηνυμάτων παραπομπής.

Ghost και παραπομπή Spam

Το Spam έχει πλέον φτάσει στις αναφορές του Google Analytics. Οι spammers αναζητούν ευπάθειες στο σύστημα έτσι ώστε να εμφανίζονται στις αναφορές δεδομένων του ιστότοπου. Το κάνουν με την ελπίδα ότι προκαλούν αρκετή περιέργεια στο σημείο που ο webmaster επισκέπτεται τον ιστότοπό του για να δει γιατί βρίσκονται στην αναφορά. Το πρόβλημα είναι ότι δεν αυξάνουν την κυκλοφορία. Δεν το κάνουν ακόμη και αφού είναι bots. Χρησιμοποιούν τον κώδικα παρακολούθησης JavaScrip που χρησιμοποιείται από το Google Analytics για να δημιουργήσουν μια ειδοποίηση ότι υπήρχε επίσκεψη. Καταλήγουν να παρακάμπτουν ζωτικά στατιστικά στοιχεία, όπως τα ποσοστά εγκατάλειψης και άλλα στοιχεία που χρησιμοποιούνται για την ανάλυση της αφοσίωσης. Είναι επιτακτική ανάγκη να αποκλείσετε τα ανεπιθύμητα μηνύματα παραπομπής, εάν κάποιος χρειάζεται ακριβή δεδομένα, ειδικά εάν το βασίζεται για να λάβει αποφάσεις μάρκετινγκ.

Γίνεται δύσκολο να μπλοκάρουμε τα ανεπιθύμητα μηνύματα παραπομπής ειδικά επειδή οι spammers λειτουργούν πολύ γρήγορα, αυξάνοντας το ποσοστό των ανεπιθύμητων ανεπιθύμητων μηνυμάτων καθώς και τις πηγές. Αυτό σημαίνει ότι οι webmaster πρέπει να βελτιώσουν την προσπάθεια που καταβάλλουν για την εξάλειψη και τη μαύρη λίστα αυτών των πηγών. Είναι ιδιαίτερα ενοχλητικό για άτομα που έχουν νέους ιστότοπους που δεν λαμβάνουν πολύ νόμιμη κίνηση. Η αύξηση των ποσοστών ανεπιθύμητων μηνυμάτων σε αυτούς τους ιστότοπους θα παρουσίαζε περισσότερη ασυμφωνία που θα μπορούσε να είναι ακόμη και μεγαλύτερη από τις καθημερινές επισκέψεις που λαμβάνει.

Πόσο εύκολο είναι;

Μία σελίδα φορτώνει εγγραφές ως μία επίσκεψη. Οι Ghost spammers χρησιμοποιούν τον κώδικα παρακολούθησης του Google Analytics και στέλνουν δεδομένα επισκεψιμότητας απευθείας στις αναφορές, δημιουργώντας έτσι μια επίσκεψη. Μπορεί να χρειαστούν 0,001 δευτερόλεπτα για να φορτωθεί μια σελίδα σε έναν διακομιστή κάπου. Ωστόσο, μπορεί να έχουν αναγκάσει πάνω από 100 από αυτές τις πλαστογραφημένες επισκέψεις στους λογαριασμούς Google πολλών άλλων ιστότοπων παντού. Είναι πολύ εύκολο να αγοράσετε έναν μόνο οικοδεσπότη. Όσο οι spammers είναι σίγουροι για την απόδοση επένδυσης (ROI), υπάρχει μεγάλη ζημιά που μπορούν να κάνουν μαζί τους.

Λύσεις που έρχονται σύντομα

Μερικές τεχνικές είναι μερικές φορές τόσο προηγμένες ώστε οι λύσεις που χρησιμοποιούνται για τον αποκλεισμό ανεπιθύμητων μηνυμάτων παραπομπής δεν λειτουργούν. Ένα από αυτά είναι η μυστηριώδης διαδικτυακή υπηρεσία που ονομάζεται Darodar. Οι ακόλουθες μέθοδοι δεν το διαγράφουν από το GA.

  • Το αρχείο .htaccess Δεν λειτουργεί αφού το spam Ghost δεν αγγίζει τον ιστότοπο
  • Η λίστα αποκλεισμού παραπομπών. Δεν διαθέτει ενημερώσεις.
  • Φίλτρα αποκλεισμού. Είναι ξεπερασμένη μέθοδος, δεδομένου ότι επικεντρώνεται μόνο σε μελλοντικά ανεπιθύμητα μηνύματα και όχι αναδρομικά σε προηγούμενες βάσεις δεδομένων spam.

Το φίλτρο αποκλεισμού σχεδόν πλησίασε για την εξάλειψη των ανεπιθύμητων μηνυμάτων Darodar. Ο μόνος περιορισμός του ήταν ότι δεν έχει μια συνεχή και συνεκτικά ενημερωμένη λίστα παραπομπών spammer.

Το κομμάτι παζλ που λείπει

Μια ενεργή λύση για τον εντοπισμό και τον αποκλεισμό παραπομπών και φανταστικών δεδομένων θα πρέπει να είναι πολύ ενημερωμένη, να προέρχεται από μια ευρύτερη βάση δεδομένων και να έχει αναδρομική ισχύ σε προηγούμενες πληροφορίες. Με βάση τα τρία στοιχεία για μια βέλτιστη λύση, εδώ είναι ένα που λειτουργεί.

Βήμα 1: Χρήση τμημάτων για εξαίρεση ανεπιθύμητων μηνυμάτων

Είναι καλύτερα να χρησιμοποιείτε τμήματα, δεδομένου ότι δεν αλλάζουν δεδομένα μόνιμα. Εάν κάποιος φιλτράρει κατά λάθος πραγματικούς παραπομπείς κατά τη χρήση φίλτρων, δεν υπάρχει τρόπος να τα επιστρέψετε. Είναι δυνατό να βασιστείτε σε παλιά δεδομένα χρησιμοποιώντας τμήματα, παρά το πόσο καιρό ήταν εκεί. Κάποιος μπορεί επίσης να τα εφαρμόσει αναδρομικά.

Βήμα 2: Διατήρηση της λίστας αποκλεισμού

Το Slack είναι ένα εργαλείο που μπορούν να χρησιμοποιήσουν οι webmaster για την παρακολούθηση των πηγών παραπομπής. Ειδοποιεί τον χρήστη σχετικά με τυχόν νέες παραπομπές και του δίνει μια ερώτηση: εάν θα επιτραπεί ή θα συμπεριλάβει στη μαύρη λίστα μια ύποπτη πηγή παραπομπής.

1. Το Slack λαμβάνει όλες τις παραπομπές και

2. Χρησιμοποιεί ένα PHP για να ταξινομήσει όλα τα αποτελέσματα κατά σειρά μέτρησης και, στη συνέχεια, βάζει τον τελικό κατάλογο στον webmaster για να δει αν φαίνεται κάτι οικείο. Αν όχι,

3. Προωθεί όλα τα ύποπτα ανεπιθύμητα μηνύματα σε ένα χαλαρό κανάλι που προσφέρει στον χρήστη τη δυνατότητα επιλογής μεταξύ λευκής λίστας ή μαύρης λίστας. Όποια και αν είναι η επιλογή, οδηγεί στο βήμα 4,

4. Ανακατευθύνει σε μια σελίδα που επαληθεύει την ετυμηγορία ως επιβεβαίωση επιλογής.

5. Το Slack αποθηκεύει και κλειδώνει όλους τους αναγνωρισμένους spammers στη βάση δεδομένων

6. Η τελική εμφάνιση καθαρών δεδομένων θα είναι σε μορφή regex. Αντιγράψτε και επικολλήστε το στο Google Analytics.

Το Slack επιτρέπει στους webmasters να ενημερώνουν τη λίστα αποκλεισμών τουλάχιστον πέντε φορές την ημέρα.

Στην πραγματικότητα, πολλές λύσεις μπορούν να λειτουργήσουν:

Παρόλο που αυτή είναι μια αποδεδειγμένη μέθοδος, θα λειτουργούσε ακόμα καλύτερα αν ο webmaster το συμπληρώσει με άλλες τεχνικές, απλώς για να βεβαιωθείτε ότι καλύπτουν όλες τις βάσεις. Εκτός από την εν λόγω λύση:

  • Κάντε κλικ στο πλαίσιο ελέγχου που ζητά από το Google Analytics να εξαιρέσει γνωστά bots και αράχνες,
  • Εφαρμόστε ένα "συμπερίληψη φίλτρου ονόματος κεντρικού υπολογιστή"
  • Χρησιμοποιήστε cookies

Το ενσωματωμένο φίλτρο που αναφέρθηκε παραπάνω είναι αποτελεσματικό μερικές φορές, αλλά όχι η καλύτερη λύση μακροπρόθεσμα επειδή:

  • Η πλαστογράφηση ονόματος κεντρικού υπολογιστή δεν είναι δύσκολο να γίνει, και τα spammers αναλυτικών στοιχείων το χρησιμοποιούν όλο και περισσότερο ως ευάλωτο.
  • Εάν η ρύθμιση είναι λανθασμένη, ενδέχεται να καταλήξει να φιλτράρει πραγματικούς παραπομπείς.