Το Yandex ως μηχανή αναζήτησης. Μηχανές αναζήτησης στο Διαδίκτυο: Yandex, Google, Rambler, Yahoo. Σύνθεση, λειτουργίες, αρχή λειτουργίας. Σύνθεση και αρχές λειτουργίας του συστήματος αναζήτησης

Σήμερα ξεκινήσαμε ένα άλλο μακρύ ταξίδι ταξιδιού στα περίτεχνα μονοπάτια της ανάπτυξης μηχανών αναζήτησης ( Yandex, Yandex). Νομίζω ότι ο εγχώριος γίγαντας της διαδικτυακής αναζήτησης έχει προ πολλού αναπτυχθεί σε τέτοιο επίπεδο που δεν χρειάζεται να τεμπελιάζουμε και να σκάβουμε σε όλες τις γωνιές και τις γωνιές του, να θυμάστε πώς αναπτύχθηκε η μηχανή αναζήτησης Yandex και τι ήταν ενδιαφέρον σε όλη τη διάρκεια τα χρόνια της ύπαρξής του.

Επιπλέον, δέχεται πολλούς επισκέπτες από τη μηχανή αναζήτησης Yandex. Πολλοί από αυτούς φεύγουν μέσω της διαφήμισης με βάση τα συμφραζόμενα, πρόσφατα ανέλαβα το ιστολόγιο, οπότε πιστεύω ότι αυτή η εταιρεία αξίζει κάτι παραπάνω από μια μεγάλη δημοσίευση που γράφεται γι' αυτήν.

Αν λάβουμε υπόψη το ρωσικό Διαδίκτυο, τότε η Yandex είναι ο αδιαμφισβήτητος ηγέτης. Στη Ρωσία είναι η πρώτη πιο σημαντική μηχανή αναζήτησης. Υπάρχουν περιφερειακές μηχανές αναζήτησης, ένα είδος υποκαταστημάτων στη Λευκορωσία, την Ουκρανία και το Καζακστάν. Το Yandex είναι πολύ δημοφιλές στους κατοίκους αυτών των χωρών. Μπορώ να το κρίνω αυτό τουλάχιστον από στατιστικά στοιχεία, βλέποντας ότι πολλοί επισκέπτες προέρχονται από άλλες περιοχές.

Επί του παρόντος, το Yandex δεν είναι μόνο μια μηχανή αναζήτησης, είναι επίσης πολλές υπηρεσίες στις οποίες μπορούν να έχουν πρόσβαση όλοι οι χρήστες αυτής της μηχανής αναζήτησης. Εδώ μπορείτε να βρείτε και απαραίτητες πληροφορίεςκαι περιηγηθείτε στις δραστηριότητες αναψυχής που έχετε επιλέξει, βρείτε φωτογραφίες, προϊόντα, συγκρίνετε τιμές, δείτε τον καιρό, επικοινωνήστε σε ένα κοινωνικό δίκτυο, παρακολουθήστε τηλεόραση και δρομολόγια. Υπάρχουν πολλές επιχειρηματικές λύσεις. Μπορείτε ακόμη και να πάτε στο Narod.ru. Υλοποιήθηκε στο Yandex βολικό σύστημα, όπου εφαρμόζεται η λειτουργικότητα για την εργασία με τους ιστότοπούς σας. Μεταξύ των πιο πρόσφατων διαθέσιμων καινοτομιών της υπηρεσίας είναι, η οποία παρέμεινε πληρωμένη για αρκετό καιρό, αλλά τον Δεκέμβριο του 2011 αυτή η υπηρεσία έγινε διαθέσιμη σε όλους.

Θα μπορούσα να συνεχίσω για τις υπέροχες τεχνολογίες και τις χρήσιμες υπηρεσίες της Yandex για πολύ, πάρα πολύ καιρό. Επομένως, για ευκολία αντίληψης των πληροφοριών, θα σπάσω το ταξίδι μας σε στοιχεία. Θα περιγράψω ολόκληρη τη διαδρομή της μηχανής αναζήτησης με χρονολογική σειρά ανά έτος - από τη δημιουργία μέχρι σήμερα.

Ιστορία της ανάπτυξης του Yandex

Δεκαετίες 1980 - 1990

Ιστορία της ανάπτυξης του Yandexπαίρνει τις ρίζες του πίσω στη μακρινή πια δεκαετία του '80, την εποχή της ΕΣΣΔ. Τότε ήταν που ξεκίνησε για πρώτη φορά η ανάπτυξη λογισμικού αναζήτησης στην Αρκαδία. Το έργο πραγματοποιήθηκε υπό την ηγεσία των Arkady Borkovsky και Arkady Volozh. Αυτό είναι το πρώτο τεχνολογία αναζήτησηςέλαβε το όνομα "Yandex". Και ο ίδιος ο ιστότοπος Yandex, αυτός που μπορούμε να δούμε σήμερα, εμφανίστηκε το 1996. Οι εξελίξεις που πραγματοποιούνταν εκείνη την εποχή αναγνωρίστηκαν ως ελπιδοφόρες, με αποτέλεσμα η διαχείριση της CompTek (πωλήσεις υπολογιστών και εξαρτημάτων) και οι προγραμματιστές συστημάτων να αποφασίσουν τη σκοπιμότητα περαιτέρω ανάπτυξης της τεχνολογίας και την εισαγωγή της στο μάζες. Στο πλαίσιο αυτό, εκπονήθηκε μια ιδέα ανάπτυξης έργου, που απευθύνεται σε ένα ευρύ κοινό.

Το Yandex ανακοινώθηκε επίσημα μόλις στις 23 Σεπτεμβρίου 1997. Και μάλιστα, στην αρχή ήταν ένα από τα τμήματα της CompTek International. Δηλαδή δεν υπήρχε καθόλου ανεξαρτησία εκεί. Και μόνο το 2000 η Yandex έγινε η εταιρεία που μπορεί να δει σήμερα. Με την έννοια ότι η εταιρεία έχει ήδη γίνει εντελώς ανεξάρτητη. Ανεξάρτητο Yandex.

Παρεμπιπτόντως, πολύ πριν από την ανακοίνωση της μηχανής αναζήτησης Yandex, η εταιρεία βρήκε ένα όνομα. Yandex - σημαίνει "Ευρετήριο γλώσσας". Αν μεταφραστεί από τα Αγγλικά, βγαίνει "Ένας άλλος δείκτης". Είναι αλήθεια, λοιπόν, καθώς αναπτύχθηκε η μηχανή αναζήτησης, άρχισαν να εμφανίζονται και άλλες ερμηνείες. Για παράδειγμα, εάν στο αγγλικό ευρετήριο μεταφράσετε το πρώτο γράμμα (I – Z) από τα αγγλικά στα ρωσικά, θα λάβετε το "Yandex".

Το όνομα "Yandex" επινοήθηκε από τον Ilya Segalovich (σημερινό διευθυντή τεχνολογίας) και τον Arkady Volozh

Ένα χρόνο πριν από την επίσημη κυκλοφορία της εταιρείας, στις 18 Οκτωβρίου 1996, πραγματοποιήθηκε η έκθεση Netcom’96, στην οποία η CompTek παρουσίασε τα πρώτα προϊόντα της αναπτυσσόμενης μηχανής αναζήτησης. Αυτά ήταν τα Yandex.Site και Yandex.Dict. Στη συνέχεια, έξι μήνες αργότερα, εμφανίστηκε το Yandex.CD - αναζήτηση εγγράφων σε CD ROM και στη συνέχεια ξεκίνησε το έργο Yandex.Lib. Ήταν μια βιβλιοθήκη πακέτων Yandex, η οποία προοριζόταν για ενσωμάτωση σε κάθε είδους εφαρμογές και βάσεις δεδομένων.

Την εποχή που το Yandex.ru παρουσιάστηκε επίσημα στο κοινό, τα ακόλουθα θα μπορούσαν να επισημανθούν ως ενδιαφέροντα:

    Αξιολόγηση της συνάφειας των εγγράφων. Εκείνη την εποχή, η Yandex ήταν αρκετά καλή στο να βρίσκει αντίγραφα και να τα αποκλείει. Παράλληλα, έγινε αναζήτηση εγγράφων σε διάφορες κωδικοποιήσεις

    Αναζήτηση με ακριβή μορφή λέξης. Ο Yashka ήξερε πώς να ψάχνει λαμβάνοντας υπόψη τη μορφολογία

    Αναζήτηση με βάση την απόσταση. Το Yandex μπορούσε να αναζητήσει μέσα σε μια παράγραφο χρησιμοποιώντας ακριβείς φράσεις

    Ο πυρήνας για την αξιολόγηση της συνάφειας των σελίδων λειτουργούσε. Για κάθε αίτημα, επιλέχθηκαν έγγραφα λαμβάνοντας υπόψη τη συμμόρφωση (συνάφεια) με το αίτημα. Επιπλέον, κατά την επιλογή εγγράφων για τα αποτελέσματα αναζήτησης, ελήφθη υπόψη η συχνότητα (πυκνότητα) της λέξης-κλειδιού στη σελίδα. Παρεμπιπτόντως, ακριβώς λόγω της ατέλειας (τότε) αυτού του αλγορίθμου, σελίδες γεμάτες με λέξεις-κλειδιά, ουσιαστικά χωρίς νόημα, εμφανίστηκαν στα κορυφαία αποτελέσματα αναζήτησης.

    Επίσης κατά την αναζήτηση λήφθηκε υπόψη η απόσταση μεταξύ των λέξεων και ο τρόπος με τον οποίο βρίσκονται οι λέξεις στο έγγραφο

Σχεδιασμός ιστότοπου Yandex

Ο πρώτος σχεδιασμός για τον ιστότοπο Yandex ήταν αρκετά πρωτόγονος και ατελής. Αναπτύχθηκε από τον γνωστό Artemy Lebedev. Έμοιαζε έτσι

Παρεμπιπτόντως, το φόρουμ Yandex άνοιξε την ίδια χρονιά. Προορίζεται για επικοινωνία μεταξύ χρηστών του συστήματος και προγραμματιστών. Η ιδέα ήταν καλή και το φόρουμ λειτούργησε κανονικά. Είναι αλήθεια ότι υπήρχε μέχρι το 2008. Στη συνέχεια, υπήρξε μια μικρή αναδιάταξη προτεραιοτήτων. Από όσο μπορώ να πω, προτιμήθηκε η κοινωνικοποίηση. Το Yandex άρχισε επίσης να αναπτύσσει ενεργά το δικό του κοινωνικό δίκτυο, βάσει του οποίου εμφανίστηκε το τρέχον ιστολόγιο, όπου δημοσιεύονται όλες οι ανακοινώσεις του Yandex και όπου, στην πραγματικότητα, οι χρήστες επικοινωνούν με τους προγραμματιστές. Μπορείτε να δείτε μόνοι σας, την παλιά διεύθυνση URL του φόρουμ ( http://forum.yandex.ru/yandex/) σήμερα μια ανακατεύθυνση είναι γνωστή σε όλους http://webmaster.ya.ru/.

1998

Το έργο, που ξεκίνησε, έδειξε καλές δυνατότητες και συνέχισαν να εργάζονται πάνω σε αυτό. Το 1998, η μηχανή αναζήτησης βελτιώθηκε και πολλές άλλες λειτουργίες εισήχθησαν για τους χρήστες. Συγκεκριμένα, κατέστη δυνατή η αναζήτηση μέσω αυτού που βρέθηκε, η αναζήτηση για παρόμοια έγγραφα και πολλά άλλα. Γίνονται επίσης εργασίες για το σχεδιασμό της αρχικής σελίδας του Yandex. Τώρα έχει αλλάξει λίγο

Όπως μπορείτε να δείτε, εξωτερικά τίποτα δεν έχει αλλάξει πολύ. Έγιναν κυρίως τεχνικές εργασίες

1999

Κατά τη διάρκεια του έτους, το κοινό του ρωσικού μεριδίου του Διαδικτύου έχει αυξηθεί σημαντικά. Μαζί με αυτό, η ποιότητα και η τεχνολογία του Yandex έχουν αυξηθεί και οι προγραμματιστές έχουν εισαγάγει πολλές βελτιώσεις. Η μηχανή αναζήτησης Yandex παρουσίασε ένα νέο bot αναζήτησης, το οποίο έχει αυξήσει σημαντικά την ταχύτητα ανίχνευσης εγγράφων στο δίκτυο.

Οι καινοτομίες που επηρέασαν τα μέρη των χρηστών της λειτουργικότητας ήταν οι εξής:

    Είναι πλέον δυνατή η αναζήτηση πιο συγκεκριμένα - με σχολιασμούς, λεζάντες, εικόνες, τίτλους

    Εισάγαμε έναν περιορισμό αναζήτησης σε μια ομάδα ιστότοπων

    Τα έγγραφα στα ρωσικά επισημάνθηκαν ξεχωριστά

Παρεμπιπτόντως, ήταν το 1999 που παρουσιάστηκε για πρώτη φορά σε όλους σήμερα γνωστές έννοιες(ευρετήριο αναφοράς θέματος). Είναι αλήθεια ότι τότε υπολογίστηκε αρκετά πρωτόγονα. Η εξουσία του ιστότοπου (γνωστός και ως TIC) εξαρτιόταν σε μεγάλο βαθμό από τον αριθμό των τοποθεσιών που συνδέονταν με τον τομέα που μας ενδιαφέρει.

Ο σχεδιασμός της κύριας σελίδας, παρεμπιπτόντως, έχει επίσης αλλάξει. Τώρα έχει γίνει κάτι πιο παρόμοιο με το σημερινό

Υπήρξε ένα άλλο σημαντικό γεγονός το 1999. Τότε εμφανίστηκε ένας δωρεάν δημιουργός ιστοσελίδων, πιο γνωστός σε όλους μας ως Narod.ru (δωρεάν υπηρεσία φιλοξενίας και κοινής χρήσης αρχείων). Παρεμπιπτόντως, αυτό το έργο υπάρχει ακόμα. Το μότο αυτού του έργου ήταν: σε 60 δευτερόλεπτα.

2000

Ίσως ήταν η εισαγωγή νέων υπηρεσιών που επέτρεψε στην Yandex να φτάσει σε ένα θεμελιωδώς νέο επίπεδο ανάπτυξης. Με την πάροδο του χρόνου, η μηχανή αναζήτησης καθιέρωσε σταθερά την κατάστασή της, γεγονός που κατέστησε δυνατό να γίνει σημαντικά Στην πραγματικότητα, αυτό ήταν ένα νέο έργο, όχι αυτό που ξεκίνησε υπό την αιγίδα της CompTek.

Το 1999, ο Arkady Volozh, συνειδητοποιώντας τις προοπτικές για την ανάπτυξη του έργου, άρχισε να εστιάζει μόνο στην προώθηση του Yandex. Αλλά η δυσκολία ήταν ότι ήταν απαραίτητο να βρεθούν έμπειροι συνεργάτες με εταιρικές κατασκευαστικές δεξιότητες. Η μόνη δυσκολία ήταν ότι ήταν απαραίτητο να βρεθούν εταίροι που θα επένδυαν στην ανάπτυξη του έργου, αλλά δεν θα απαιτούσαν πλήρη μεταφορά της διοίκησης υπό την ηγεσία τους.

Και ένας τέτοιος συνεργάτης βρέθηκε. Ήταν μια εταιρεία ru-Net Holdings. Την άνοιξη του 2000 συνήφθη επενδυτική συμφωνία με την εταιρεία αυτή. Εδώ όμως υπήρξαν θύματα. Ωστόσο, έπρεπε να εγκαταλείψω ένα συγκεκριμένο μερίδιο της μηχανής αναζήτησης. Σύμφωνα με τη συμφωνία, η εταιρεία έλαβε το 1/3 της μηχανής αναζήτησης. Δηλαδή, από εκείνη τη στιγμή, η Yandex έπαψε να είναι δομικό τμήμα της CompTek, αλλά έγινε μια ανεξάρτητη εταιρεία που είχε τα δικά της γραφεία, τη δική της διαχείριση, τον δικό της προϋπολογισμό κ.λπ. Ο Arkady Volozh έγινε ο γενικός διευθυντής της εταιρείας.

Νομίζω ότι η Yandex ήταν πολύ τυχερή με τον πρώτο της ηγέτη, επειδή ο Volozh αποδείχθηκε όχι μόνο ειδικός στην εύρεση πιθανών συνεργατών, αλλά και καλός καινοτόμος. Μετά την έναρξη της ανεξάρτητης «κολύμβησης», άρχισαν τεράστιες αλλαγές στην εταιρεία. Το προσωπικό έχει αναπληρωθεί σημαντικά και ο ίδιος ο πόρος έχει λάβει νέα κλωτσιά από τους ηγέτες του.

Συνολικά, η ru-Net Holdings επένδυσε περίπου $5 εκατομμύρια. Αυτό είναι στην πιο συντηρητική εκτίμηση.

Το έτος 2000 ήταν επίσης σημαντικό για τον λόγο ότι αυτό το έτος άρχισε να αναδεικνύεται πιο καθαρά η πολλαπλή πύλη του Yandex, επειδή άρχισαν να εμφανίζονται πολλές υπηρεσίες που δεν συνδέονταν άμεσα με την αναζήτηση. Τέτοιες υπηρεσίες ήταν τα Yandex.News, Yandex.Mail, Postcards και η γραμμή αναζήτησης στο ya.ru. Επιπλέον, υπήρχαν πολλές υπηρεσίες που στη συνέχεια συγχωνεύτηκαν, και έγιναν αυτό που γνωρίζουμε σήμερα ως Yandex.Market. Επιπλέον, μια άλλη σημαντική καινοτομία ήταν η εισαγωγή εξειδικευμένου λογισμικού για ενσωμάτωση σε προγράμματα περιήγησης χρηστών - Yandex Bar.

2001

Φέτος ήταν ένα σημείο καμπής, γιατί το 2001 η Yandex έγινε ο ηγέτης του Runet όσον αφορά την κίνηση. Επιπλέον, ο όγκος των πληροφοριών που αποθηκεύονται στους διακομιστές της εταιρείας έχει επίσης αυξηθεί. Το μέγεθός του ήταν 1 terabyte. Παρεμπιπτόντως, το Yandex.Images εμφανίστηκε επίσης φέτος. Επιπλέον, εμφανίστηκε το σύστημα ηλεκτρονικών πληρωμών Yandex.Money

Επιπλέον, ο σχεδιασμός της αρχικής σελίδας του Yandex έχει βελτιωθεί σημαντικά. Ακολουθούν σύνδεσμοι για νέες υπηρεσίες και νέα. Μπορούμε να πούμε ότι γενικά τα περιγράμματα του σημερινού Yandex έχουν ήδη εμφανιστεί

2002

Φέτος, οι προγραμματιστές εργάζονται ενεργά για τη βελτίωση της υπηρεσίας επικοινωνίας - Yandex.Mail. Έχει γίνει πολλή δουλειά για το φιλτράρισμα της αλληλογραφίας. Το 2002 ήταν η χρονιά της συγχώνευσης τριών υπηρεσιών - Products, Guru και Select σε ένα - Yandex.Market. Παρεμπιπτόντως, μπορείτε να δείτε μόνοι σας ότι αυτή η υπηρεσία είναι πολύ σχετική ακόμη και σήμερα. Ίσως για πρώτη φορά σε όλα τα χρόνια της επένδυσης, ένας στόχος εμφανίστηκε το 2002 - να επιτευχθεί αυτάρκεια. Ήταν απαραίτητο να αναπτυχθεί ένα στρατηγικό σύστημα για τη δημιουργία εσόδων από το έργο. Επιπλέον, ένα που θα έφερνε σταθερά και μεγάλα κέρδη στο μέλλον. Έγινε ένα τέτοιο μοντέλο και ήταν ακριβώς το εισόδημα που άρχισε να λαμβάνει η εταιρεία από αυτό το μοντέλο διαφήμισης που κατέστησε δυνατή την επίτευξη αυτάρκειας πολύ νωρίτερα από το αναμενόμενο. Ως εκ τούτου, μπορούμε να πούμε ότι το 2002 ήταν μια καμπή όσον αφορά την είσοδο σε ένα επιχειρηματικό μοντέλο, το οποίο, εξάλλου, έχει ήδη αρχίσει να αποδίδει καρπούς.

2003

Φέτος, η ενεργή εργασία στην υπηρεσία Yandex.Mail συνεχίστηκε. Εδώ, εισήχθησαν οι επόμενες μαζικές αλλαγές, που επηρεάζουν όλους τους χρήστες του συστήματος. Φυσικά, το Ya.Mail έχει γίνει πιο λειτουργικό και βολικό. Κοιτάζοντας μπροστά, θέλω να πω ότι στο μέλλον η υπηρεσία έχει επίσης αναπτυχθεί πολύ ενεργά και οι χρήστες της έχουν δει πολλές νέες ενδιαφέρουσες λειτουργίες περισσότερες από μία φορές. Συγκεκριμένα, οι χρήστες έλαβαν απεριόριστο μέγεθος γραμματοκιβωτίου και ένα νέο φίλτρο ανεπιθύμητης αλληλογραφίας «Προστασία ανεπιθύμητων μηνυμάτων». Το 2003, ο σχεδιασμός της Yandex ενημερώθηκε ξανά.

Παρεμπιπτόντως, κάθε σχέδιο αντιστοιχούσε σε μια συγκεκριμένη έκδοση. Η έκδοση του 2003 του σχεδίου ήταν η όγδοη στη σειρά και έμοιαζε έτσι

Οποιαδήποτε διάθεση νέα έκδοσηΟ σχεδιασμός υποβάλλεται αρχικά σε μια περίοδο δοκιμής beta. Και αν πριν από αυτό οι δοκιμές beta πραγματοποιούνταν σε κλειστή λειτουργία, τότε αυτή τη φορά, κατά τη διάρκεια δύο εβδομάδων δοκιμαστικής δοκιμής της νέας διεπαφής, ο καθένας θα μπορούσε να αποκτήσει πρόσβαση στη νέα διεπαφή. Είναι αλήθεια ότι ένα χρόνο αργότερα το κύριο αναβαθμίστηκε ξανά, αλλά με μεγαλύτερη επιτυχία. Και υπήρχε με αυτή τη μορφή μέχρι το 2007.

Ακόμη και εκείνη την εποχή, η Yandex ήταν ήδη μια αρκετά αξιόπιστη εταιρεία, επειδή ήδη το 2003 η μηχανή αναζήτησης Yandex εφαρμόστηκε με επιτυχία στον προεδρικό ιστότοπο. Το φθινόπωρο του 2003, οι προγραμματιστές κυκλοφόρησαν τις επόμενες ενημερώσεις προϊόντων: Yandex.Publisher, Yandex.Server (Yandex.Server), που έγινε η κληρονομιά του Yandex.Site.

2004

Το επιχειρηματικό μοντέλο που καταλαμβάνει η νούμερο ένα μηχανή αναζήτησης στο RuNet λειτούργησε πολύ καλά, με αποτέλεσμα το κέρδος που έλαβε η εταιρεία το 2004 ήδη να ανέρχεται σε δεκάδες εκατομμύρια δολάρια. Αυτό έδωσε ώθηση στην ανάπτυξη νέων υπηρεσιών, για παράδειγμα, μια υπηρεσία αναζήτησης σε χάρτη, ιστολόγια και φόρουμ. Το έτος 2004 είναι επίσης αξιοσημείωτο για το γεγονός ότι ήταν τότε ρωσική αγοράεμφανίστηκε ένας σοβαρός ανταγωνιστής στο Google. Υπήρξε επείγουσα ανάγκη να μπει στον αγώνα για ηγεσία, με αποτέλεσμα η διοίκηση της Yandex αποφάσισε να δεκαπλασιάσει το προσωπικό της. Αρχικά ήταν 200, μετά την ενημέρωση του προσωπικού υπήρχαν 2.000 εργαζόμενοι. Το κυριότερο όμως είναι ότι μετά την ανανέωση του προσωπικού τίποτα δεν άλλαξε προς το χειρότερο. Οι παραδόσεις παρέμειναν, οι τεχνολογίες ήταν επίσης επίκαιρες. Και γενικά, μπορούμε να πούμε ότι η Yasha δεν έχει μετατραπεί σε στεγνή εταιρεία.

Μάχη τεχνολογιών: Yandex εναντίον Google

2005

Η φετινή χρονιά πέρασε με το σύνθημα της γεωγραφικής επέκτασης του γραφείου αντιπροσωπείας της εταιρείας. Επειδή εμφανίστηκε το ουκρανικό γραφείο αντιπροσωπείας της Yandex - Yandex.Ukraine. Παρεμπιπτόντως, ο διευθυντής αυτού του γραφείου αντιπροσωπείας είναι ο Sergey Petrenko, ο ιδρυτής της γνωστής αναζήτησης και ο συγγραφέας του ενδιαφέροντος ιστολογίου BloGnot

Το 2005 ήταν επίσης σημαντικό γιατί άνοιξε το αγαπημένο μου. Αυτή είναι μια υπηρεσία που βασίζεται στην αρχή του "kolotibablo webmaster" και στα ρωσικά, είναι μια υπηρεσία που επιτρέπει στους webmasters να τοποθετούν διαφημίσεις στους ιστότοπούς τους.

Την ίδια χρονιά εμφανίστηκε το Yandex.Dictionaries. Αλλαγές έχουν επίσης σημειωθεί στην υπηρεσία Yandex.Money. Τώρα όλοι οι χρήστες έχουν τη δυνατότητα να διαχειρίζονται τον λογαριασμό τους μέσω ενός διαδικτυακού πορτοφολιού.

2006

Αυτή η χρονιά θα μείνει αξέχαστη για την εμφάνιση της γνωστής πλέον υπηρεσίας blogs.yandex.ru. Αυτό είναι ένα είδος εργαλείου μάρκετινγκ. Μου επέτρεψε να μελετήσω την κοινή γνώμη, κριτικές σε ιστολόγια και φόρουμ. Το Yandex.Maps παρουσίασε ένα εργαλείο για την εμφάνιση μποτιλιαρίσματος.

Από το 2006 έως το 2010, η Yandex βρισκόταν σε ένα παλιό γραφείο στην οδό Samokatnaya στη Μόσχα





Όπως μπορείτε να δείτε, προηγουμένως ήταν λίγο στριμωγμένοι. Αυτό δεν είναι τώρα, ένα τεράστιο κτίριο για 2000 υπαλλήλους.

Υπήρχε άλλο ένα το 2006 ενδιαφέρουσα εκδήλωση– άνοιξε το πρώτο γραφείο απομακρυσμένης ανάπτυξης στην Αγία Πετρούπολη. Τότε, φυσικά, η κλίμακα δεν ήταν ακόμα η ίδια. Δεν είναι όπως σήμερα η Yandex έχει 11 γραφεία στη Ρωσία, την Ουκρανία, την Τουρκία και ακόμη και την Καλιφόρνια. Τα γραφεία διαφέρουν ανάλογα με τον τύπο δραστηριότητας. Υπάρχουν γραφεία που ασχολούνται με την ανάπτυξη, γραφεία πωλήσεων, γραφεία που εργάζονται στον τομέα της τοπικής προσαρμογής προϊόντων

2007

Φέτος υπήρξαν εκδηλώσεις που επικεντρώνονται περισσότερο στους webmasters. Συγκεκριμένα, εμφανίστηκε η υπηρεσία Yandex.Photos. Αλλά για μένα, ως webmaster, ένα πιο ενδιαφέρον γεγονός είναι η εμφάνιση της υπηρεσίας Yandex.Metrica. Είναι αλήθεια ότι εκείνη την εποχή ήταν μια εντελώς ωμή υπηρεσία και δεν απευθυνόταν σε webmasters, αλλά σε διαφημιστές Yandex.Direct. Την ίδια χρονιά, άνοιξε ένα ουκρανικό γραφείο αντιπροσωπείας - Yandex.ua. Σήμερα, σύμφωνα με το LiveInternet, σχεδόν το 14% της κυκλοφορίας στη ρωσική γλώσσα προέρχεται από το yandex.ua

Επίσης, το 2007, ξεκίνησε ένα έργο γνωστό σε όλους τους webmasters, το οποίο πιθανώς μόνο τεμπέληδες δεν χρησιμοποιούν τώρα

2008

Μπορούμε να πούμε ότι φέτος η σφαίρα επιρροής της Yandex έχει αυξηθεί τόσο πολύ που αποφασίστηκε να ανοίξει ένα υποκατάστημα της μηχανής αναζήτησης στις ΗΠΑ, στην Καλιφόρνια. Παράλληλα, έγιναν σημαντικές προσθήκες στους αλγόριθμους. Συγκεκριμένα, άρχισαν να υποστηρίζονται τα διεθνή πρότυπα Sitemap, MediaRSS κ.λπ. Δηλαδή, όπως μπορείτε να δείτε, οι τομείς ενδιαφέροντος έχουν ξεπεράσει κατά πολύ το RuNet. Η νούμερο ένα μηχανή αναζήτησης στο RuNet έχει γίνει πλέον αγγλόφωνοι ιστότοποι. Πριν από αυτό, το πρόβλημα ήταν ότι η εγχώρια μηχανή αναζήτησης δεν υποστήριζε διεθνή πρότυπα και επομένως υπήρχε πρόβλημα με την ευρετηρίαση ιστότοπων από το burzhunet, αλλά μετά την αναβάθμιση το 2008, αυτό το πρόβλημα επιλύθηκε. Και μετά από αυτό, το λογότυπο Yandex άρχισε να γράφεται εξ ολοκλήρου στα ρωσικά.

2009

Η φετινή χρονιά ήταν σημαντική γιατί πριν από αυτό δεν υπήρχε διαχωρισμός της αναζήτησης ανά περιοχή. Δηλαδή, πριν από την εισαγωγή αυτού του αλγορίθμου, χτίστηκε στις αρχές της ομοιομορφίας. Για παράδειγμα, εισάγετε το ερώτημα "" στη γραμμή αναζήτησης στη Μόσχα και στο Νοβοσιμπίρσκ και λαμβάνετε τα ίδια αποτελέσματα. Τώρα όλα έχουν αλλάξει. Και τα αποτελέσματα που βασίζονται στην αρχή της γεω-εξάρτησης αναμιγνύονται στα αποτελέσματα αναζήτησης. Για να το θέσω απλά, εάν κάνετε αναζήτηση χρησιμοποιώντας το Yandex στη Μόσχα και στο Νοβοσιμπίρσκ, τα αποτελέσματα θα είναι διαφορετικά.

Το 2009, οι εργασίες συνεχίστηκαν προς την προηγουμένως επιλεγμένη δυτική κατεύθυνση. Συγκεκριμένα, δοκιμάστηκε μια υπηρεσία που χρησιμοποιούσε τη μετάφραση ξένων ιστότοπων. Στη συνέχεια, αυτή η υπηρεσία εξελίχθηκε και το 2011 έγινε γνωστή ως Yandex.Translation.

Ένα εξίσου σημαντικό γεγονός ήταν η εισαγωγή μιας νέας μεθόδου μηχανικής μάθησης - Matrixnet. Αυτή η τεχνολογία χρησιμοποιεί διάφορα μοτίβα ως αξιολόγηση και λαμβάνει υπόψη διάφορους παράγοντες κατάταξης. Αλλά το κύριο πράγμα είναι ότι η τεχνολογία είναι αυτομάθηση. Κατά την αξιολόγηση των αξιολογητών, αξιολογούνται μόνο πραγματικά πρότυπα και η ανακάλυψη ανύπαρκτων αποκλείεται εντελώς.

Η επαναστατική φύση αυτής της τεχνολογίας έγκειται στο γεγονός ότι το Matrixnet χρησιμοποιεί έναν απίστευτα πολύπλοκο τύπο κατάταξης που λαμβάνει υπόψη έναν τεράστιο αριθμό παραγόντων. Αυτό, αφενός, σας επιτρέπει να επιτύχετε καλύτερα αποτελέσματα αναζήτησης, αλλά από την άλλη, δεν θα επιτρέψει στους webmasters να κατανοήσουν αυτό το μοτίβο και, ως εκ τούτου, να το επηρεάσουν για τα δικά τους συμφέροντα.

Περισσότερες λεπτομέρειες σχετικά με την τεχνολογία matrixnet:

2010

Το παλιό γραφείο στην οδό Samokatnaya ανήκει στο παρελθόν και ολόκληρη η εταιρεία έχει μετακομίσει σε νέα αρχοντικά. Στην πραγματικότητα, αυτό έγινε το κύριο γεγονός του 2010





1. Όροι και ορισμοί Στην παρούσα συμφωνία για την επεξεργασία προσωπικών δεδομένων (εφεξής η Συμφωνία), οι παρακάτω όροι έχουν τους ακόλουθους ορισμούς: Χειριστής - Μεμονωμένος Επιχειρηματίας Oleg Aleksandrovich Dneprovsky. Αποδοχή της Σύμβασης - πλήρης και ανεπιφύλακτη αποδοχή όλων των όρων της Σύμβασης με αποστολή και επεξεργασία προσωπικών δεδομένων. Προσωπικά δεδομένα - πληροφορίες που εισάγονται από τον Χρήστη (αντικείμενο προσωπικών δεδομένων) στον ιστότοπο και σχετίζονται άμεσα ή έμμεσα με αυτόν τον Χρήστη. Χρήστης - οποιοδήποτε άτομο ή νομικό πρόσωπο, έχοντας ολοκληρώσει επιτυχώς τη διαδικασία συμπλήρωσης των πεδίων εισαγωγής στον ιστότοπο. Συμπλήρωση πεδίων εισαγωγής - η διαδικασία για να στείλει ο Χρήστης το όνομα, το επώνυμο, τον αριθμό τηλεφώνου, την προσωπική του διεύθυνση e-mail(εφεξής καλούμενα Προσωπικά Δεδομένα) στη βάση δεδομένων των εγγεγραμμένων χρηστών του ιστότοπου, που παράγεται με σκοπό την αναγνώριση του Χρήστη. Ως αποτέλεσμα της συμπλήρωσης των πεδίων εισαγωγής, τα προσωπικά δεδομένα αποστέλλονται στη βάση δεδομένων του Χειριστή. Η συμπλήρωση των πεδίων εισαγωγής είναι εθελοντική. ιστότοπος - ένας ιστότοπος που βρίσκεται στο Διαδίκτυο και αποτελείται από μία σελίδα. 2. Γενικές διατάξεις 2.1. Η παρούσα συμφωνία έχει συνταχθεί με βάση τις απαιτήσεις Ομοσπονδιακός Νόμοςμε ημερομηνία 27 Ιουλίου 2006, αριθ. Ρωσική Ομοσπονδία στον τομέα των προσωπικών δεδομένων" του Κώδικα Διοικητικών Αδικημάτων της Ρωσικής Ομοσπονδίας και ισχύει για όλα τα προσωπικά δεδομένα που μπορεί να λάβει ο Διαχειριστής σχετικά με τον Χρήστη κατά τη χρήση του Ιστότοπου. 2.2. Η συμπλήρωση των πεδίων εισαγωγής από τον Χρήστη στον Ιστότοπο σημαίνει την ανεπιφύλακτη συμφωνία του Χρήστη με όλους τους όρους της παρούσας Συμφωνίας (Αποδοχή της Συμφωνίας). Σε περίπτωση διαφωνίας με αυτούς τους όρους, ο Χρήστης δεν συμπληρώνει τα πεδία εισαγωγής στον Ιστότοπο. 2.3. Η συγκατάθεση του Χρήστη για την παροχή προσωπικών δεδομένων στον Διαχειριστή και την επεξεργασία τους από τον Διαχειριστή ισχύει μέχρι τον τερματισμό των δραστηριοτήτων του Χειριστή ή έως ότου ο Χρήστης αποσύρει τη συγκατάθεσή του. Με την αποδοχή της παρούσας Σύμβασης και τη διεκπεραίωση της διαδικασίας Εγγραφής, καθώς και με τη μετέπειτα πρόσβαση στην Ιστοσελίδα, ο Χρήστης επιβεβαιώνει ότι, ενεργώντας με δική του ελεύθερη βούληση και προς το συμφέρον του, μεταφέρει τα προσωπικά του δεδομένα προς επεξεργασία στον Διαχειριστή και συμφωνεί να την επεξεργασία τους. Ο Χρήστης ειδοποιείται ότι η επεξεργασία των προσωπικών του δεδομένων θα πραγματοποιηθεί από τον Χειριστή βάσει του Ομοσπονδιακού Νόμου της 27ης Ιουλίου 2006 Αρ. 152-FZ «Περί Προσωπικών Δεδομένων». 3. Κατάλογος προσωπικών δεδομένων και άλλων πληροφοριών σχετικά με τον χρήστη που πρέπει να διαβιβαστούν στον Διαχειριστή 3.1. Κατά τη χρήση της Ιστοσελίδας του Διαχειριστή, ο Χρήστης παρέχει τα ακόλουθα προσωπικά δεδομένα: 3.1.1. Αξιόπιστες προσωπικές πληροφορίες που παρέχει ο Χρήστης για τον εαυτό του ανεξάρτητα κατά τη συμπλήρωση πεδίων εισαγωγής ή/και κατά τη διαδικασία χρήσης των υπηρεσιών του ιστότοπου, όπως επώνυμο, όνομα, πατρώνυμο, αριθμός τηλεφώνου (οικία ή κινητό), προσωπική διεύθυνση email. 3.1.2. Δεδομένα που μεταφέρονται αυτόματα στις υπηρεσίες του ιστότοπου κατά τη χρήση τους χρησιμοποιώντας το λογισμικό που είναι εγκατεστημένο στη συσκευή του Χρήστη, συμπεριλαμβανομένης της διεύθυνσης IP, πληροφοριών από Cookies, πληροφοριών σχετικά με το πρόγραμμα περιήγησης του χρήστη (ή άλλου προγράμματος μέσω του οποίου γίνεται πρόσβαση στις υπηρεσίες). 3.2. Ο Διαχειριστής δεν επαληθεύει την ακρίβεια των προσωπικών δεδομένων που παρέχονται από τον Χρήστη. Σε αυτήν την περίπτωση, ο Διαχειριστής υποθέτει ότι ο Χρήστης παρέχει αξιόπιστες και επαρκείς προσωπικές πληροφορίες για τις ερωτήσεις που προτείνονται στα Πεδία Εισόδου. 4. Σκοποί, κανόνες συλλογής και χρήσης προσωπικών δεδομένων 4.1. Ο Διαχειριστής επεξεργάζεται προσωπικά δεδομένα που είναι απαραίτητα για την παροχή υπηρεσιών και την παροχή υπηρεσιών στον Χρήστη. 4.2. Τα προσωπικά δεδομένα του Χρήστη χρησιμοποιούνται από τον Διαχειριστή για τους ακόλουθους σκοπούς: 4. 2.1. Αναγνώριση χρήστη. 4.2.2. Παροχή εξατομικευμένων υπηρεσιών στον Χρήστη (καθώς και ενημέρωση για νέες προσφορές και υπηρεσίες της εταιρείας με αποστολή επιστολών). 4.2.3. Διατήρηση επικοινωνίας με τον Χρήστη εάν είναι απαραίτητο, συμπεριλαμβανομένης της αποστολής ειδοποιήσεων, αιτημάτων και πληροφοριών που σχετίζονται με τη χρήση των υπηρεσιών, την παροχή υπηρεσιών, καθώς και την επεξεργασία αιτημάτων και αιτήσεων από τον Χρήστη. 4.3. Κατά την επεξεργασία των προσωπικών δεδομένων θα γίνονται οι ακόλουθες ενέργειες: συλλογή, καταγραφή, συστηματοποίηση, συσσώρευση, αποθήκευση, διευκρίνιση (ενημέρωση, αλλαγή), εξαγωγή, χρήση, αποκλεισμός, διαγραφή, καταστροφή. 4.4. Ο χρήστης δεν αντιτίθεται στο ότι οι πληροφορίες που καθορίζονται από αυτόν σε ορισμένες περιπτώσεις ενδέχεται να παρέχονται σε εξουσιοδοτημένα κρατικά όργανα της Ρωσικής Ομοσπονδίας σύμφωνα με την ισχύουσα νομοθεσία της Ρωσικής Ομοσπονδίας. 4.5. Τα προσωπικά δεδομένα του Χρήστη αποθηκεύονται και υφίστανται επεξεργασία από τον Διαχειριστή με τον τρόπο που προβλέπεται στην παρούσα Συμφωνία για όλη την περίοδο δραστηριότητας του Διαχειριστή. 4.6. Η επεξεργασία των προσωπικών δεδομένων πραγματοποιείται από τον Διαχειριστή με τη διατήρηση βάσεων δεδομένων, αυτοματοποιημένες, μηχανικές και μη αυτόματες μεθόδους. 4.7. Ο ιστότοπος χρησιμοποιεί cookies και άλλες τεχνολογίες για την παρακολούθηση της χρήσης των υπηρεσιών του ιστότοπου. Αυτά τα δεδομένα είναι απαραίτητα για τη βελτιστοποίηση της τεχνικής λειτουργίας της Ιστοσελίδας και τη βελτίωση της ποιότητας παροχής υπηρεσιών. Ο ιστότοπος καταγράφει αυτόματα πληροφορίες (συμπεριλαμβανομένης της διεύθυνσης URL, της διεύθυνσης IP, του τύπου προγράμματος περιήγησης, της γλώσσας, της ημερομηνίας και της ώρας αιτήματος) για κάθε επισκέπτη στον Ιστότοπο. Ο χρήστης έχει το δικαίωμα να αρνηθεί την παροχή προσωπικών δεδομένων όταν επισκέπτεται τον Ιστότοπο ή να απενεργοποιήσει τα Cookies, αλλά σε αυτήν την περίπτωση, ενδέχεται να μην λειτουργούν σωστά όλες οι λειτουργίες του ιστότοπου. 4.8. Οι όροι εμπιστευτικότητας που προβλέπονται στην παρούσα Συμφωνία ισχύουν για όλες τις πληροφορίες που μπορεί να λάβει ο Διαχειριστής σχετικά με τον Χρήστη κατά τη διάρκεια της παραμονής του τελευταίου στον Ιστότοπο και της χρήσης του. 4.9. Οι πληροφορίες που αποκαλύπτονται δημόσια κατά την εκτέλεση της παρούσας Συμφωνίας, καθώς και οι πληροφορίες που μπορούν να ληφθούν από τα μέρη ή τρίτα μέρη από πηγές στις οποίες οποιοδήποτε πρόσωπο έχει ελεύθερη πρόσβαση, δεν είναι εμπιστευτικές. 4.10. Ο Διαχειριστής λαμβάνει όλα τα απαραίτητα μέτρα για την προστασία του απορρήτου των προσωπικών δεδομένων του Χρήστη από μη εξουσιοδοτημένη πρόσβαση, τροποποίηση, αποκάλυψη ή καταστροφή, όπως: εξασφάλιση συνεχούς εσωτερικής επαλήθευσης των διαδικασιών συλλογής, αποθήκευσης και επεξεργασίας δεδομένων και διασφάλιση της ασφάλειας. διασφαλίζει τη φυσική ασφάλεια των δεδομένων, αποτρέποντας τη μη εξουσιοδοτημένη πρόσβαση σε τεχνικά συστήματα που διασφαλίζουν τη λειτουργία του Ιστότοπου, στον οποίο ο Διαχειριστής αποθηκεύει προσωπικά δεδομένα· παρέχει πρόσβαση στα προσωπικά δεδομένα μόνο σε όσους υπαλλήλους του Διαχειριστή ή εξουσιοδοτημένα πρόσωπα χρειάζονται αυτές τις πληροφορίες για την εκτέλεση καθηκόντων που σχετίζονται άμεσα με την παροχή υπηρεσιών στον Χρήστη, καθώς και με τη λειτουργία, ανάπτυξη και βελτίωση του Ιστότοπου. 4.11. Τα προσωπικά δεδομένα του Χρήστη παραμένουν απόρρητα, εκτός από τις περιπτώσεις που ο Χρήστης παρέχει οικειοθελώς πληροφορίες για τον εαυτό του για γενική πρόσβαση σε απεριόριστο αριθμό προσώπων. 4.12. Η μεταφορά από τον Χειριστή των προσωπικών δεδομένων του Χρήστη είναι νόμιμη κατά την αναδιοργάνωση του Χειριστή και τη μεταβίβαση δικαιωμάτων στον νόμιμο διάδοχο του Χειριστή, ενώ όλες οι υποχρεώσεις συμμόρφωσης με τους όρους της παρούσας Σύμβασης σε σχέση με τα προσωπικά στοιχεία που λαμβάνει είναι μεταβιβάζεται στον νόμιμο διάδοχο. 4.13. Η παρούσα Δήλωση ισχύει μόνο για τον Ιστότοπο του Χειριστή. Η Εταιρεία δεν ελέγχει και δεν ευθύνεται για ιστότοπους (υπηρεσίες) τρίτων στις οποίες μπορεί να έχει πρόσβαση ο χρήστης μέσω συνδέσμων που είναι διαθέσιμοι στον Ιστότοπο του Διαχειριστή, συμπεριλαμβανομένων των αποτελεσμάτων αναζήτησης. Σε αυτούς τους Ιστότοπους (υπηρεσίες), ενδέχεται να συλλέγονται ή να ζητούνται από τον χρήστη άλλες προσωπικές πληροφορίες, καθώς και άλλες ενέργειες. 5. Δικαιώματα του χρήστη ως αντικείμενο προσωπικών δεδομένων, αλλαγή και διαγραφή προσωπικών δεδομένων από τον χρήστη 5.1. Ο χρήστης έχει το δικαίωμα: 5.1.2. Απαιτήστε από τον Διαχειριστή να διευκρινίσει τα προσωπικά του δεδομένα, να τα μπλοκάρει ή να τα καταστρέψει εάν τα προσωπικά δεδομένα είναι ελλιπή, παρωχημένα, ανακριβή, παράνομα λήφθηκαν ή δεν είναι απαραίτητα για τον αναφερόμενο σκοπό επεξεργασίας, καθώς και να λάβει μέτρα που προβλέπονται από το νόμο για την προστασία των δικαιωμάτων του. 5.1.3. Λήψη πληροφοριών σχετικά με την επεξεργασία των προσωπικών του δεδομένων, συμπεριλαμβανομένων πληροφοριών που περιέχουν: 5.1.3.1. επιβεβαίωση του γεγονότος της επεξεργασίας προσωπικών δεδομένων από τον Διαχειριστή· 5.1.3.2. τους σκοπούς και τις μεθόδους επεξεργασίας προσωπικών δεδομένων που χρησιμοποιούνται από τον χειριστή· 5.1.3.3. όνομα και τοποθεσία του Διαχειριστή· 5.1.3.4. επεξεργασμένα προσωπικά δεδομένα που σχετίζονται με το σχετικό αντικείμενο των προσωπικών δεδομένων, την πηγή της λήψης τους, εκτός εάν προβλέπεται διαφορετική διαδικασία για την παρουσίαση τέτοιων δεδομένων από την ομοσπονδιακή νομοθεσία· 5.1.3.5. όρους επεξεργασίας των προσωπικών δεδομένων, συμπεριλαμβανομένων των περιόδων αποθήκευσης τους· 5.1.3.6. άλλες πληροφορίες που προβλέπονται από την ισχύουσα νομοθεσία της Ρωσικής Ομοσπονδίας. 5.2. Η ανάκληση της συγκατάθεσης για την επεξεργασία προσωπικών δεδομένων μπορεί να πραγματοποιηθεί από τον Χρήστη αποστέλλοντας στον Διαχειριστή κατάλληλη γραπτή (τυπωμένη σε απτό μέσο και υπογεγραμμένη από τον Χρήστη) ειδοποίηση. 6. Αρμοδιότητες του Διαχειριστή. Πρόσβαση σε προσωπικά δεδομένα 6.1. Ο Διαχειριστής αναλαμβάνει να διασφαλίζει την αποτροπή μη εξουσιοδοτημένης και μη στοχευμένης πρόσβασης στα προσωπικά δεδομένα των Χρηστών της Ιστοσελίδας του Διαχειριστή. Στην περίπτωση αυτή, η εξουσιοδοτημένη και στοχευμένη πρόσβαση στα προσωπικά δεδομένα των Χρηστών της Ιστοσελίδας θα θεωρείται πρόσβαση σε αυτά από όλα τα ενδιαφερόμενα μέρη, η οποία υλοποιείται στο πλαίσιο των στόχων των δραστηριοτήτων και του αντικειμένου της Ιστοσελίδας του Διαχειριστή. Ωστόσο, ο Διαχειριστής δεν ευθύνεται για πιθανή αστοχία προβλεπόμενη χρήσηπροσωπικά δεδομένα Χρηστών που προέκυψαν ως αποτέλεσμα: τεχνικών προβλημάτων στο λογισμικό και σε τεχνικά μέσα και δίκτυα πέρα ​​από τον έλεγχο του Διαχειριστή. σε σχέση με την εσκεμμένη ή ακούσια χρήση των Ιστοσελίδων του Χειριστή που δεν είναι σύμφωνα με τουςάμεσο σκοπό τρίτα μέρη· 6.2 Ο Διαχειριστής λαμβάνει τα απαραίτητα και επαρκή οργανωτικά και τεχνικά μέτρα για την προστασία των προσωπικών πληροφοριών του χρήστη από μη εξουσιοδοτημένη ή τυχαία πρόσβαση, καταστροφή, τροποποίηση, αποκλεισμό, αντιγραφή, διανομή, καθώς και από άλλες παράνομες ενέργειες τρίτων. 7. Αλλαγές στην Πολιτική Απορρήτου. Ισχύουσα νομοθεσία 7.1. Ο Διαχειριστής έχει το δικαίωμα να κάνει αλλαγές στους παρόντες Κανονισμούς χωρίς καμία ειδική ειδοποίηση προς τους Χρήστες. Όταν γίνονται αλλαγές στην τρέχουσα έκδοση, υποδεικνύεται η ημερομηνία. Η νέα έκδοση των Κανονισμών τίθεται σε ισχύ από τη στιγμή της δημοσίευσής της, εκτός εάν ορίζεται διαφορετικά από τη νέα έκδοση των Κανονισμών. 7.2. Το δίκαιο της Ρωσικής Ομοσπονδίας εφαρμόζεται στον παρόντα Κανονισμό και στη σχέση μεταξύ του Χρήστη και του Διαχειριστή που προκύπτει σε σχέση με την εφαρμογή του Κανονισμού.

δέχομαι δεν δέχομαι

Δεν είμαστε τόσο μοναδικοί όσο νομίζουμε: εκατομμύρια άνθρωποι πριν από εμάς προβληματίζονται και εκατομμύρια μετά από εμάς θα προβληματίσουν τη μηχανή αναζήτησης με σχεδόν πανομοιότυπες ερωτήσεις. Από την άλλη πλευρά, είμαστε πολύ απρόβλεπτοι: η διατύπωση του αιτήματός μας επηρεάζεται από έναν τεράστιο αριθμό παραγόντων που δεν γνωρίζουμε. Και τουλάχιστον για αυτόν τον λόγο, το αίτημα του καθενός μας, όσο κοινότοπο κι αν είναι, απαιτεί ατομική προσέγγιση.

Στην πραγματικότητα, ολόκληρο το έργο της μηχανής αναζήτησης Yandex καταλήγει σε δύο απλά πράγματα: να καταλάβει τι θέλει πραγματικά να μάθει ένα άτομο και σε λίγα δευτερόλεπτα να βρει τα κατάλληλα ανάμεσα σε δισεκατομμύρια έγγραφα στο Διαδίκτυο.

Πάρτε δακτυλικά αποτυπώματα

Το λειτουργικό σύστημα της μηχανής αναζήτησης είναι κάπως παρόμοιο με το Matrix και το ρομπότ αναζήτησης (το πολύπλοκο πρόγραμμα λήψης αποφάσεων που δημιούργησε ανεξάρτητα) είναι παρόμοιο με τον Πράκτορα Σμιθ.

Για να μην πραγματοποιεί αναζήτηση σε ολόκληρο το Διαδίκτυο κάθε φορά που κάποιος χρειάζεται να μάθει κάτι, η μηχανή αναζήτησης κάνει μέρος της δουλειάς εκ των προτέρων - ελέγχει τι υπάρχει στον Ιστό και πού βρίσκεται, χρησιμοποιώντας χιλιάδες ρομπότ αναζήτησης. Κυκλοφορούν σε δύο τύπους: βασικό και γρήγορο. Το κύριο ανιχνεύει και επεξεργάζεται το Διαδίκτυο στο σύνολό του, και το γρήγορο - έγγραφα που εμφανίστηκαν πριν από ένα λεπτό ή ακόμα και μερικά δευτερόλεπτα. Το καθήκον των προγραμμάτων ρομπότ είναι να επιλέγουν κατάλληλες και χρήσιμες πληροφορίες για τους χρήστες, να τις επεξεργάζονται, εξαλείφοντας οτιδήποτε ξεπερασμένο και περιττό. Κατά κάποιο τρόπο, αυτό θυμίζει τη διαλογή των σκουπιδιών: χαρτί σε ένα δοχείο, γυαλί σε άλλο, πλαστικό σε ένα τρίτο, απόβλητα τροφίμων σε ένα τέταρτο...

Οι πληροφορίες που συλλέγονται από τα ρομπότ σχηματίζουν το λεγόμενο cast του Διαδικτύου. Αποθηκεύεται σε χιλιάδες διακομιστές Yandex και ενημερώνεται συνεχώς. Ένα nugget είναι σαν μια λίστα που σας λέει πού να βρείτε ποιες πληροφορίες. Σε αυτήν τη λίστα, κάθε λέξη-κλειδί έχει όχι μία, αλλά εκατομμύρια «σελίδες». Για να διασφαλιστεί ότι όλες οι ενημερώσεις nugget είναι διαθέσιμες στους χρήστες, μετακινούνται από το χώρο αποθήκευσης στη «βασική αναζήτηση». Τα δεδομένα από το κύριο ρομπότ μεταφέρονται κάθε λίγες μέρες και από το γρήγορο ρομπότ - σε πραγματικό χρόνο.



Φέρτε σε καθαρό νερό

Κατά την αναζήτηση μιας απάντησης σε μια δεδομένη ερώτηση σε μια προετοιμασμένη βάση δεδομένων, το μηχάνημα αντιμετωπίζει δύο κύριες δυσκολίες. Η πρώτη δυσκολία είναι η γλώσσα. Πριν αναζητήσετε μια απάντηση σε μια ερώτηση, είναι σημαντικό για το μηχάνημα να καταλάβει σε ποια γλώσσα πρέπει να το κάνει. Για παράδειγμα, για ένα ρωσόφωνο άτομο, η αναζήτηση για την «ομάδα του πρίγκιπα Ιγκόρ» θα βρει έγγραφα με πληροφορίες για τον στρατό και για έναν Ουκρανό, η «ομάδα του Πρίγκιπα Ιγκόρ» θα επιστρέψει επίσης έγγραφα που αναφέρουν την πριγκίπισσα Όλγα, τη σύζυγό του, καθώς στα ουκρανικά "σύζυγος" είναι "ομάδα". Και στην πλούσια ρωσική γλώσσα, η ίδια λέξη ή τα παράγωγά της μπορεί να σημαίνουν διαφορετικά πράγματα. Για παράδειγμα, η λέξη «ατσάλι» είναι μία από τις μορφές του ουσιαστικού «ατσάλι» και του ρήματος «γίνομαι». Η δεύτερη δυσκολία είναι η ανθρώπινη ψυχολογία. Κατά την εισαγωγή ενός αιτήματος, αναμένουμε μια γρήγορη και ακριβή απάντηση, χωρίς φυσικά να ανησυχούμε για το αν η διατύπωση του αιτήματος αντιστοιχεί στις αρχές της μαθηματικής ανάλυσης με τις οποίες λειτουργεί ο εγκέφαλος της μηχανής. Για παράδειγμα, εισάγοντας τη λέξη «Ναπολέων» στη γραμμή αναζήτησης, τι θέλει να πάρει ένα άτομο: μια συνταγή για κέικ ή μια βιογραφία του Γάλλου αυτοκράτορα, να αγοράσει κονιάκ ή να βρει τη διεύθυνση ενός ψυχιατρείου;


Σε τέτοιες περιπτώσεις, πολλές τεχνολογίες μπαίνουν στο παιχνίδι. Μπορείτε να σας δώσετε πολλές συμβουλές κάτω από τη γραμμή αναζήτησης που θα καθορίσουν το αίτημά σας. Κάντε like, επιλέξτε αυτό που χρειάζεστε: Συνταγές Napoleon ή Napoleon - Bonaparte. Εάν ο χρήστης δεν ανταποκριθεί στο αίτημα του μηχανήματος και δεν προσθέσει λέξεις στο "Napoleon", τότε η τεχνολογία "Spectrum" βοηθά το θέμα: χωρίς να ελπίζει σε βοήθεια, το μηχάνημα αναζητά αμέσως πληροφορίες σε διάφορες κατηγορίες (σχετικά με το κέικ, και για τον αυτοκράτορα, και για το άλογο ..). Επιπλέον, οι μηχανισμοί εξατομίκευσης βοηθούν στην κατανόηση του χρήστη - οι γνώσεις του μηχανήματος για το τι έψαχνε ο χρήστης στον υπολογιστή του μια μέρα, δύο, τρεις ή μήνες πριν: αν κάνατε συχνά ερωτήσεις στο Yandex σχετικά με το μαγείρεμα, τότε το μηχάνημα θα εμφανίσει πρώτα αποτελέσματα που λένε ότι ο Ναπολέων είναι κέικ.

Συνδυασμοί: σύλλογοι συμφερόντων

Το καθήκον μιας μηχανής αναζήτησης δεν είναι απλώς να επιλέγει έγγραφα που περιέχουν λέξεις και φράσεις από το ερώτημα αναζήτησης. Το μηχάνημα πρέπει να κατανοήσει ποια έγγραφα πληρούν τις αντικρουόμενες απαιτήσεις μας και γιατί τις πληρούν. Θέλουμε να πάρουμε πληροφορίες για τον Ναπολέοντα την τούρτα, ή μήπως επισκεφθήκαμε ένα γυμναστήριο με ένα επιβλητικό όνομα για μερικά χρόνια ή ακόμη και ανησυχούμε εντελώς για τα κόμπλεξ των κοντών ανθρώπων. Σε κάθε περίπτωση, η επίλυση του προβλήματος απαιτεί μια μη τετριμμένη προσέγγιση.


Οι δημιουργοί του προγράμματος αναζήτησης Yandex βρήκαν αυτήν την προσέγγιση αναθέτοντας το δικαίωμα επιλογής στο μηχάνημα. Από τη μια μια άψυχη, αλλά πολύ γρήγορη και έξυπνη μηχανή δεν ξέρει και δεν θέλει να μάθει τίποτα για εμάς ως άτομα και από την άλλη προσπαθεί να μάθει όσο το δυνατόν περισσότερα για όλους.

Εκτός γεωγραφική θέσηχρήστη και γλωσσική ανάλυση των ερωτήσεών του, η μηχανή αναζήτησης χρησιμοποιεί αρκετές χιλιάδες κριτήρια που δεν είναι καθόλου προφανή για τον άνθρωπο.

Το κόλπο είναι ότι το μηχάνημα αναπτύσσει και ενημερώνει αυτά τα κριτήρια ανεξάρτητα.

Απλώς χρησιμοποιεί δεδομένα για τις προτιμήσεις και τη συμπεριφορά των χρηστών εκατομμυρίων ανθρώπων και συσχετίζει αυτόν τον «αριθμητικό μέσο όρο» με το ιστορικό των ερωτήσεών μας. Οι αρχές που καθοδηγούν το Matrix μέσα του, συγκρίνοντας τις χιλιάδες κατηγορίες ενδιαφερόντων των χρηστών που έχει αναπτύξει, συχνά δεν ταιριάζουν στις παραδοσιακές ανθρώπινες ιδέες για το τι μπορεί να είναι καταρχήν τα «ενδιαφέροντα». Υπάρχουν δεκάδες χιλιάδες από αυτούς. Δημιουργούν διαφορετικούς, ενίοτε αστείους, συνδυασμούς μεταξύ τους. Για παράδειγμα, ένας από αυτούς τους συνδυασμούς θα μπορούσε να είναι ότι τα αποτελέσματα αναζήτησης ταιριάζουν με τα ενδιαφέροντα ενός ατόμου που εκτρέφει τρίτωνες. Ταυτόχρονα, ένα άτομο δεν ενδιαφέρεται μόνο για τους τρίτωνες, αλλά τους εκτρέφει ήδη, αλλά μόνο για τον πρώτο χρόνο.

Ακροαματικότητα. Χέρια βοηθείας


Ο πίνακας, φυσικά, αποφασίζει μόνος του (με τη βοήθεια ανώτερων μαθηματικών) τι και με ποια σειρά πρέπει να εμφανίζεται στους χρήστες με βάση δεκάδες χιλιάδες κριτήρια. Αλλά το Matrix χρησιμοποιεί επίσης ζωντανούς ανθρώπους - 1000 υπάλληλοι της Yandex, οι λεγόμενοι αξιολογητές, αξιολογούν τα αποτελέσματα αναζήτησης για ένα συγκεκριμένο αίτημα (φυσικά, δεν αξιολογείται κάθε αίτημα και αυτό δεν γίνεται σε πραγματικό χρόνο) για να προσδιορίσουν εάν πληρούν τις προσδοκίες ενός απλού χρήστη: όχι τόσο λογικές όσο μια μηχανή, όχι τόσο ακριβείς στη διατύπωση, αντιφατικές και συναισθηματικές.

Καλησπέρα, αγαπητοί αναγνώστες του SEO blog μου. . Αυτό το άρθρο αφορά πώς λειτουργεί η μηχανή αναζήτησης Yandex ποιες τεχνολογίες και αλγόριθμους χρησιμοποιεί για την κατάταξη ιστοτόπων και τι κάνει για να προετοιμάσει μια απάντηση στους χρήστες. Πολλοί άνθρωποι γνωρίζουν ότι αυτή η ναυαρχίδα της ρωσικής αναζήτησης δίνει τον τόνο στο Runet, κατέχει τη μεγαλύτερη βάση δεδομένων στην Ευρασία, χειρίζεται το περιεχόμενο περισσότερων από ένα δισεκατομμύριο σελίδων και γνωρίζει την απάντηση σε οποιαδήποτε ερώτηση. Σύμφωνα με στοιχεία του Liveinternet για τον Αύγουστο του 2012, το μερίδιο της Yandex στη Ρωσία είναι 60,5%. Το μηνιαίο κοινό της πύλης είναι 48,9 εκατομμύρια άτομα. Αλλά το πιο σημαντικό για εμάς τους bloggers είναι πώς λαμβάνει η μηχανή αναζήτησης τα αιτήματά μας, πώς τα επεξεργάζεται και ποιο είναι το αποτέλεσμα ως αποτέλεσμα. Αφενός, η γνώση και η κατανόηση αυτών των πληροφοριών διευκολύνει τη χρήση όλων των πόρων του Yandex, αφετέρου, είναι ευκολότερο να προωθήσουμε τα ιστολόγιά μας. Ως εκ τούτου, προτείνω να δούμε μαζί μου τις πιο σημαντικές τεχνολογίες της καλύτερης μηχανής αναζήτησης Runet.

Όταν ένας χρήστης του Διαδικτύου θέλει για πρώτη φορά να απευθυνθεί σε μια μηχανή αναζήτησης για πληροφορίες, μπορεί να έχει μια ερώτηση: "Πώς λειτουργεί η αναζήτηση;" Αλλά όταν το λαμβάνει, αυτή η ερώτηση συχνά αλλάζει σε άλλη: «Γιατί τόσο γρήγορα;» Και αλήθεια, γιατί η αναζήτηση ενός αρχείου σε έναν υπολογιστή διαρκεί 20 δευτερόλεπτα και το αποτέλεσμα ενός αιτήματος από ένα ολόκληρο δίκτυο υπολογιστών σε όλο τον κόσμο εμφανίζεται σε ένα δευτερόλεπτο; Το πιο ενδιαφέρον είναι ότι οι δύο πρώτες ερωτήσεις (πώς γίνεται η αναζήτηση και γιατί 1 δευτερόλεπτο) μπορούν να απαντηθούν σε μία απάντηση - η μηχανή αναζήτησης έχει προετοιμαστεί εκ των προτέρων για το αίτημα του χρήστη.

Για να κατανοήσουμε την αρχή λειτουργίας του Yandex, όπως και άλλες μηχανές αναζήτησης, ας σχεδιάσουμε μια αναλογία με έναν τηλεφωνικό κατάλογο. Για να βρείτε οποιονδήποτε αριθμό τηλεφώνου, πρέπει να γνωρίζετε το επώνυμο του συνδρομητή και κάθε αναζήτηση σε αυτήν την περίπτωση διαρκεί το πολύ ένα λεπτό, επειδή όλες οι σελίδες του καταλόγου είναι ένα συνεχές αλφαβητικό ευρετήριο. Φανταστείτε όμως αν η αναζήτηση πραγματοποιήθηκε χρησιμοποιώντας μια διαφορετική επιλογή, όπου οι αριθμοί τηλεφώνου παραγγέλθηκαν από τους ίδιους τους αριθμούς. Μετά από τέτοιες αναζητήσεις, οι οποίες θα διαρκέσουν για μεγαλύτερο χρονικό διάστημα, οι αριθμοί θα παραμείνουν μπροστά στα μάτια του ερευνητή για πολύ μεγάλο χρονικό διάστημα. 🙂

Ομοίως, η μηχανή αναζήτησης εμφανίζει όλες τις πληροφορίες από το Διαδίκτυο σε μια κατάλληλη μορφή για αυτήν. Και το πιο σημαντικό, όλα αυτά τα δεδομένα τοποθετούνται στον κατάλογό της εκ των προτέρων, πριν φτάσει ο επισκέπτης με τα αιτήματά του. Δηλαδή, όταν κάνουμε μια ερώτηση στο Yandex, γνωρίζει ήδη την απάντησή μας. Και μας το δίνει σε ένα δευτερόλεπτο. Αλλά αυτό το δεύτερο περιλαμβάνει μια σειρά από σημαντικές διαδικασίες, τις οποίες θα εξετάσουμε τώρα λεπτομερώς.

Ευρετηρίαση Διαδικτύου

Το Yandex ru συλλέγει όλες τις πληροφορίες που μπορεί να πάρει στα χέρια του στο Διαδίκτυο. Χρησιμοποιώντας ειδικό εξοπλισμό, ελέγχεται όλο το περιεχόμενο, συμπεριλαμβανομένων των εικόνων που βασίζονται σε οπτικές παραμέτρους. Η μηχανή αναζήτησης ασχολείται με μια τέτοια συλλογή και η διαδικασία συλλογής και προετοιμασίας δεδομένων ονομάζεται ευρετηρίαση. Η βάση ενός τέτοιου μηχανήματος είναι ένα σύστημα υπολογιστή, το οποίο αλλιώς ονομάζεται ρομπότ αναζήτησης. Ανιχνεύει τακτικά ιστότοπους με ευρετήριο, τους ελέγχει για νέο περιεχόμενο και επίσης σαρώνει το Διαδίκτυο για διαγραμμένες σελίδες. Εάν ανακαλύψει ότι κάποια τέτοια σελίδα δεν υπάρχει πλέον ή έχει κλείσει από την ευρετηρίαση, την αφαιρεί από την αναζήτηση.

Πώς ένα ρομπότ αναζήτησης βρίσκει νέους ιστότοπους; Πρώτον, χάρη σε συνδέσμους από άλλους ιστότοπους. Διότι εάν ένας σύνδεσμος τοποθετηθεί σε έναν νέο πόρο Ιστού από έναν ήδη ευρετηριασμένο ιστότοπο, τότε την επόμενη φορά που θα επισκεφτείτε τον δεύτερο, το ρομπότ θα επισκεφθεί τον πρώτο. Δεύτερον, υπάρχει μια υπέροχη υπηρεσία, που ονομάζεται ευρέως "addurilka" (από τη φράση in αγγλικός-addurl - προσθέστε μια διεύθυνση). Σε αυτό μπορείτε να εισαγάγετε τη διεύθυνση του νέου σας ιστότοπου, τον οποίο θα επισκεφθεί ένα ρομπότ αναζήτησης μετά από λίγο. Τρίτον, με τη βοήθεια ενός ειδικού προγράμματος «Yandex.Bar», παρακολουθούνται οι επισκέψεις των χρηστών που το χρησιμοποιούν. Αντίστοιχα, εάν ένα άτομο προσγειωθεί σε έναν νέο πόρο Ιστού, ένα ρομπότ θα εμφανιστεί σύντομα εκεί.

Περιλαμβάνονται όλες οι σελίδες στην αναζήτηση; Εκατομμύρια σελίδες ευρετηριάζονται κάθε μέρα. Ανάμεσά τους υπάρχουν σελίδες διαφορετικής ποιότητας, οι οποίες μπορεί να περιέχουν διαφορετικές πληροφορίες - από μοναδικό περιεχόμενο έως πλήρη σκουπίδια. Επιπλέον, όπως λένε οι στατιστικές, υπάρχουν πολύ περισσότερα σκουπίδια στο Διαδίκτυο. Το ρομπότ αναζήτησης αναλύει κάθε έγγραφο χρησιμοποιώντας ειδικούς αλγόριθμους. Αυτός καθορίζει αν έχει χρήσιμες πληροφορίεςαν μπορεί να απαντήσει στο αίτημα του χρήστη. Εάν όχι, τότε τέτοιες σελίδες δεν γίνονται δεκτές ως "κοσμοναύτες", αλλά αν ναι, τότε περιλαμβάνονται στην αναζήτηση.

Αφού ένα ρομπότ επισκεφθεί μια σελίδα και προσδιορίσει τη χρησιμότητά της, εμφανίζεται στο χώρο αποθήκευσης της μηχανής αναζήτησης. Εδώ αναλύουμε οποιοδήποτε έγγραφο μέχρι τα πολύ βασικά, όπως λένε οι κύριοι του auto center - μέχρι τα γρανάζια. Η σελίδα απαλείφεται από τη σήμανση html, το καθαρό κείμενο περνά από ένα πλήρες απόθεμα - υπολογίζεται η θέση κάθε λέξης. Σε αυτή την αποσυναρμολογημένη μορφή, η σελίδα μετατρέπεται σε πίνακα με αριθμούς και γράμματα, που αλλιώς ονομάζεται ευρετήριο. Τώρα, ανεξάρτητα από το τι συμβαίνει στον πόρο ιστού που περιέχει αυτήν τη σελίδα, το πιο πρόσφατο αντίγραφό του είναι πάντα διαθέσιμο στην αναζήτηση. Ακόμα κι αν ο ιστότοπος δεν υπάρχει πλέον, αντίγραφα των εγγράφων του αποθηκεύονται στο Διαδίκτυο για κάποιο χρονικό διάστημα.

Κάθε ευρετήριο, μαζί με δεδομένα για τους τύπους εγγράφων, την κωδικοποίηση, τη γλώσσα, μαζί με τα αντίγραφα, αποτελούν βάση δεδομένων αναζήτησης . Ενημερώνεται περιοδικά, επομένως βρίσκεται σε ειδικούς διακομιστές, με τη βοήθεια των οποίων επεξεργάζονται αιτήματα από χρήστες μηχανών αναζήτησης.

Πόσο συχνά συμβαίνει η διαδικασία ευρετηρίασης; Πρώτα απ 'όλα, εξαρτάται από τους τύπους των τοποθεσιών. Ο πρώτος τύπος πόρου Ιστού αλλάζει πολύ συχνά το περιεχόμενο των σελίδων του. Δηλαδή, όταν ένα ρομπότ αναζήτησης έρχεται σε αυτές τις σελίδες κάθε φορά, αυτές περιέχουν διαφορετικό περιεχόμενο κάθε φορά. Την επόμενη φορά δεν θα μπορείτε να βρείτε τίποτα χρησιμοποιώντας τους, επομένως τέτοιοι ιστότοποι δεν περιλαμβάνονται στο ευρετήριο. Ο δεύτερος τύπος ιστότοπου είναι μια αποθήκη δεδομένων, στις σελίδες της οποίας προστίθενται περιοδικά σύνδεσμοι προς έγγραφα για λήψη. Το περιεχόμενο ενός τέτοιου ιστότοπου συνήθως δεν αλλάζει, επομένως το ρομπότ τον επισκέπτεται εξαιρετικά σπάνια. Άλλοι ιστότοποι εξαρτώνται από τη συχνότητα ενημέρωσης του υλικού. Αυτό σημαίνει το εξής: όσο πιο γρήγορα εμφανίζεται νέο περιεχόμενο στον ιστότοπο, τόσο πιο συχνά έρχεται το ρομπότ αναζήτησης. Και δίνεται προτεραιότητα πρώτα στους πιο σημαντικούς πόρους Ιστού (για παράδειγμα, ένας ιστότοπος ειδήσεων είναι μια τάξη μεγέθους πιο σημαντικός από οποιοδήποτε ιστολόγιο).

Η ευρετηρίαση σάς επιτρέπει να εκτελέσετε την πρώτη λειτουργία μιας μηχανής αναζήτησης - τη συλλογή πληροφοριών σε νέες σελίδες στο Διαδίκτυο. Αλλά το Yandex έχει επίσης μια δεύτερη λειτουργία - αναζήτηση απάντησης στο αίτημα ενός χρήστη σε μια ήδη προετοιμασμένη βάση δεδομένων αναζήτησης.

Η Yandex ετοιμάζει μια απάντηση

Η διαδικασία επεξεργασίας του αιτήματος και έκδοσης των σχετικών απαντήσεων διεκπεραιώνεται από σύστημα υπολογιστή "Metasearch" . Για τη δουλειά του, πρώτα συλλέγει όλες τις πληροφορίες εισόδου: από ποια περιοχή έγινε το αίτημα, σε ποια κατηγορία ανήκει, αν υπάρχουν σφάλματα στο αίτημα κ.λπ. Μετά από μια τέτοια επεξεργασία, η metasearch ελέγχει εάν υπάρχουν ακριβώς τα ίδια ερωτήματα με τις ίδιες παραμέτρους στη βάση δεδομένων. Εάν η απάντηση είναι ναι, τότε το σύστημα εμφανίζει στον χρήστη τα προηγουμένως αποθηκευμένα αποτελέσματα. Εάν μια τέτοια ερώτηση δεν υπάρχει στη βάση δεδομένων, η μετα-αναζήτηση απευθύνεται στη βάση δεδομένων αναζήτησης που περιέχει τα δεδομένα ευρετηρίου.

Και εδώ συμβαίνουν καταπληκτικά πράγματα. Φανταστείτε ότι υπάρχει ένας υπερ-ισχυρός υπολογιστής που αποθηκεύει ολόκληρο το Διαδίκτυο που επεξεργάζεται τα ρομπότ αναζήτησης. Ο χρήστης θέτει ένα ερώτημα και ξεκινά μια αναζήτηση στα κελιά μνήμης για όλα τα έγγραφα που εμπλέκονται στο ερώτημα. Η απάντηση βρέθηκε και όλοι είναι ευχαριστημένοι. Ας πάρουμε όμως μια άλλη περίπτωση, όταν υπάρχουν πολλά αιτήματα που περιέχουν τις ίδιες λέξεις στο σώμα τους. Το σύστημα πρέπει να περνά από τα ίδια κελιά μνήμης κάθε φορά, γεγονός που μπορεί να αυξήσει σημαντικά τον χρόνο επεξεργασίας δεδομένων. Αντίστοιχα, ο χρόνος αυξάνεται, γεγονός που μπορεί να οδηγήσει σε απώλεια του χρήστη - θα απευθυνθεί σε άλλη μηχανή αναζήτησης για βοήθεια.

Για να αποφευχθούν τέτοιες καθυστερήσεις, όλα τα αντίγραφα στο ευρετήριο τοποθεσίας διανέμονται σε διαφορετικούς υπολογιστές. Μετά τη μετάδοση της αίτησης, η metasearch δίνει εντολή σε αυτούς τους διακομιστές να αναζητήσουν το κομμάτι του κειμένου τους. Μετά από αυτό, όλα τα δεδομένα από αυτά τα μηχανήματα επιστρέφονται στον κεντρικό υπολογιστή, συνδυάζει όλα τα αποτελέσματα που ελήφθησαν και δίνει στον χρήστη τις δέκα καλύτερες απαντήσεις. Με αυτήν την τεχνολογία, δύο πουλιά με μια πέτρα σκοτώνονται: ο χρόνος αναζήτησης μειώνεται αρκετές φορές (η απάντηση λαμβάνεται σε κλάσματα δευτερολέπτου) και, χάρη στην αύξηση των πλατφορμών, οι πληροφορίες διπλασιάζονται (τα δεδομένα δεν χάνονται λόγω ξαφνικών βλαβών ). Οι ίδιοι οι υπολογιστές με διπλότυπες πληροφορίες αποτελούν ένα κέντρο δεδομένων - αυτό είναι ένα δωμάτιο με διακομιστές.

Όταν ένας χρήστης μηχανής αναζήτησης κάνει ένα ερώτημα, 20 φορές στις 100, τα αποτελέσματα στην ερώτηση είναι διφορούμενα. Για παράδειγμα, αν γράψει τη λέξη "Ναπολέων" στη γραμμή αναζήτησης, τότε δεν είναι ακόμη γνωστό ποια απάντηση περιμένει - μια συνταγή κέικ ή μια βιογραφία του μεγάλου διοικητή. Ή η φράση "Brothers Grimm" - παραμύθια, ταινίες, μουσικό συγκρότημα. Για να περιορίσει ένα τέτοιο πιθανό φάσμα στόχων σε συγκεκριμένες απαντήσεις, η Yandex διαθέτει μια ειδική τεχνολογία S p e c t r. Λαμβάνει υπόψη τις ανάγκες των χρηστών χρησιμοποιώντας στατιστικά ερωτημάτων αναζήτησης. Από όλες τις ερωτήσεις που γίνονται στο Yandex από επισκέπτες, το Spectrum προσδιορίζει διάφορα αντικείμενα σε αυτά (ονόματα ανθρώπων, τίτλους βιβλίων, μοντέλα αυτοκινήτων κ.λπ.) Αυτά τα αντικείμενα κατανέμονται σε ορισμένες κατηγορίες. Αυτή τη στιγμή υπάρχουν περισσότερες από 60 τέτοιες κατηγορίες. Με τη βοήθειά τους, η μηχανή αναζήτησης έχει στη βάση δεδομένων της διαφορετικές έννοιεςλέξεις σε ερωτήματα χρήστη. Είναι ενδιαφέρον ότι αυτές οι κατηγορίες ελέγχονται περιοδικά (η ανάλυση πραγματοποιείται μερικές φορές την εβδομάδα), γεγονός που επιτρέπει στο Yandex να παρέχει με μεγαλύτερη ακρίβεια απαντήσεις στις ερωτήσεις που τίθενται.

Με βάση την τεχνολογία Spectrum, η Yandex οργάνωσε προτροπές διαλόγου. Εμφανίζονται κάτω από τη γραμμή αναζήτησης στην οποία ο χρήστης πληκτρολογεί το διφορούμενο ερώτημά του. Αυτή η γραμμή αντικατοπτρίζει τις κατηγορίες στις οποίες μπορεί να ανήκει το θέμα της ερώτησης. Τα περαιτέρω αποτελέσματα αναζήτησης εξαρτώνται από την επιλογή του χρήστη αυτής της κατηγορίας.

Από το 15 έως το 30% όλων των χρηστών της μηχανής αναζήτησης Yandex θέλουν να λαμβάνουν μόνο τοπικές πληροφορίες (δεδομένα από την περιοχή στην οποία ζουν). Για παράδειγμα, για νέες ταινίες στους κινηματογράφους της πόλης σας. Επομένως, η απάντηση σε ένα τέτοιο αίτημα θα πρέπει να είναι διαφορετική για κάθε περιοχή. Από αυτή την άποψη, η Yandex χρησιμοποιεί την τεχνολογία της αναζήτηση βάσει περιοχών . Για παράδειγμα, αυτές είναι οι απαντήσεις που μπορεί να λάβουν οι κάτοικοι που αναζητούν ένα ρεπερτόριο ταινιών στον κινηματογράφο τους Oktyabr:

Αλλά αυτό είναι το αποτέλεσμα που θα λάβουν οι κάτοικοι της πόλης της Σταυρούπολης για το ίδιο αίτημα:

Η περιοχή του χρήστη καθορίζεται κυρίως από τη διεύθυνση IP του. Μερικές φορές αυτά τα δεδομένα δεν είναι ακριβή, επειδή ένας αριθμός παρόχων μπορεί να εργαστεί σε πολλές περιοχές ταυτόχρονα, και επομένως να αλλάξουν τις διευθύνσεις IP των χρηστών τους. Κατ 'αρχήν, εάν αυτό συμβεί σε εσάς, μπορείτε εύκολα να αλλάξετε την περιοχή σας στις ρυθμίσεις στη μηχανή αναζήτησης. Αναγράφεται στην επάνω δεξιά γωνία της σελίδας αποτελεσμάτων. Μπορείτε να το αλλάξετε.

Μηχανή αναζήτησης Yandex ru - αποτελέσματα απόκρισης

Όταν το Metasearch έχει ετοιμάσει μια απάντηση, η μηχανή αναζήτησης Yandex θα πρέπει να την εμφανίσει στη σελίδα αποτελεσμάτων. Είναι μια λίστα με συνδέσμους προς έγγραφα που βρέθηκαν με λίγες πληροφορίες για το καθένα. Το καθήκον της τεχνολογίας για την έκδοση αποτελεσμάτων είναι να παρέχει στον χρήστη τις πιο σχετικές απαντήσεις με τον πιο κατατοπιστικό τρόπο. Το πρότυπο για έναν τέτοιο σύνδεσμο μοιάζει με αυτό:

Ας δούμε αυτή τη μορφή αποτελέσματος με περισσότερες λεπτομέρειες. Για τίτλος αποτελεσμάτων αναζήτησης Το Yandex χρησιμοποιεί συχνά το όνομα του τίτλου της σελίδας (τι γράφουν οι βελτιστοποιητές στην ετικέτα τίτλου). Εάν δεν υπάρχει, τότε οι λέξεις από τον τίτλο του άρθρου ή της ανάρτησης εμφανίζονται εδώ. Εάν το κείμενο του τίτλου είναι μεγάλο, η μηχανή αναζήτησης τοποθετεί σε αυτό το πεδίο το τμήμα που είναι πιο σχετικό με το συγκεκριμένο ερώτημα.

Πολύ σπάνια, αλλά συμβαίνει ο τίτλος να μην ταιριάζει με το περιεχόμενο του αιτήματος. Σε αυτήν την περίπτωση, το Yandex σχηματίζει τον τίτλο του αποτελέσματος αναζήτησης χρησιμοποιώντας το κείμενο στο άρθρο ή την ανάρτηση. Σίγουρα θα έχει ερωτηματικά.

Για απόσπασμαη μηχανή αναζήτησης χρησιμοποιεί όλο το κείμενο της σελίδας. Επιλέγει όλα τα τμήματα όπου υπάρχει η απάντηση στο ερώτημα και, στη συνέχεια, επιλέγει το πιο σχετικό και εισάγει συνδέσμους προς το έγγραφο στο πεδίο φόρμας. Χάρη σε αυτήν την προσέγγιση, ένας ικανός βελτιστοποιητής μπορεί να το επαναδημιουργήσει αφού δει ένα απόσπασμα, βελτιώνοντας έτσι την ελκυστικότητα του συνδέσμου.

Για καλύτερη αντίληψηαποτέλεσμα του αιτήματος του χρήστη, οι επικεφαλίδες μορφοποιούνται ως σύνδεσμοι στο κείμενο (επισημαίνονται με μπλε χρώμα με υπογράμμιση). Για να γίνει ο πόρος Ιστού ελκυστικός και αναγνωρίσιμος, προστίθεται ένα favicon - ένα μικρό εικονίδιο επώνυμου ιστότοπου. Εμφανίζεται στα αριστερά του κειμένου στην πρώτη γραμμή πριν από την επικεφαλίδα. Όλες οι λέξεις που συμπεριλήφθηκαν στο αίτημα στην απάντηση επισημαίνονται επίσης με έντονη γραφή για ευκολία αντίληψης.

Πρόσφατα, η μηχανή αναζήτησης Yandex προσθέτει διάφορες πληροφορίες στο απόσπασμα που θα βοηθήσουν τον χρήστη να βρει την απάντησή του ακόμα πιο γρήγορα και με μεγαλύτερη ακρίβεια. Για παράδειγμα, εάν ένας χρήστης γράψει το όνομα ενός οργανισμού στο αίτημά του, τότε το Yandex θα προσθέσει τη διεύθυνσή του, τους αριθμούς επικοινωνίας και έναν σύνδεσμο προς την τοποθεσία σε γεωγραφικούς χάρτες στο απόσπασμα. Εάν η μηχανή αναζήτησης είναι εξοικειωμένη με τη δομή του ιστότοπου, ο οποίος περιέχει ένα έγγραφο με απάντηση για τον χρήστη, σίγουρα θα το εμφανίσει. Επιπλέον, το Yandex μπορεί να προσθέσει αμέσως τις σελίδες με τις περισσότερες επισκέψεις ενός τέτοιου πόρου ιστού στο απόσπασμα, έτσι ώστε, εάν το επιθυμεί, ο επισκέπτης να μπορεί να μεταβεί αμέσως στην ενότητα που χρειάζεται, εξοικονομώντας χρόνο.

Υπάρχουν αποσπάσματα που περιέχουν την τιμή ενός προϊόντος για ένα ηλεκτρονικό κατάστημα, μια βαθμολογία ξενοδοχείου ή εστιατορίου με τη μορφή αστεριών και άλλες ενδιαφέρουσες πληροφορίες με διάφορους αριθμούς σχετικά με αντικείμενα στα έγγραφα αναζήτησης. Ο σκοπός αυτών των πληροφοριών είναι να δώσει πλήρης λίσταδεδομένα σχετικά με εκείνα τα στοιχεία ή αντικείμενα που ενδιαφέρουν τον χρήστη.

Γενικά, ήδη από διάφορα παραδείγματαΗ σελίδα απαντήσεων θα μοιάζει με αυτό:

Κατάταξη και αξιολογητές

Η εργασία του Yandex περιλαμβάνει όχι μόνο την αναζήτηση όλων πιθανές επιλογέςαπάντηση, αλλά και η επιλογή των καλύτερων (σχετική). Εξάλλου, ο χρήστης δεν θα ψάξει σε όλους τους συνδέσμους που θα του παρέχει η Yandex ως αποτέλεσμα αναζήτησης. Η διαδικασία οργάνωσης των αποτελεσμάτων αναζήτησης ονομάζεται κατάταξη . Δηλαδή, είναι η κατάταξη που καθορίζει την ποιότητα των προτεινόμενων απαντήσεων.

Υπάρχουν κανόνες με τους οποίους το Yandex καθορίζει τις σχετικές σελίδες:

  • Οι ιστότοποι που υποβαθμίζουν την ποιότητα αναζήτησης θα υποβαθμιστούν σε θέσεις στη σελίδα αποτελεσμάτων. Συνήθως πρόκειται για πόρους Ιστού των οποίων οι ιδιοκτήτες προσπαθούν να εξαπατήσουν τη μηχανή αναζήτησης. Για παράδειγμα, πρόκειται για ιστότοπους με σελίδες που περιέχουν κείμενο χωρίς νόημα ή αόρατο. Φυσικά, είναι ορατό και κατανοητό σε ένα ρομπότ αναζήτησης, αλλά όχι σε έναν επισκέπτη που διαβάζει αυτό το έγγραφο. Ή ιστοσελίδες που, όταν κάνουν κλικ σε έναν σύνδεσμο στην περιοχή των αποτελεσμάτων αναζήτησης, μεταφέρουν αμέσως τον χρήστη σε έναν εντελώς διαφορετικό ιστότοπο.
  • Οι ιστότοποι που περιέχουν ερωτικό περιεχόμενο δεν περιλαμβάνονται στα αποτελέσματα ή έχουν μειωθεί σημαντικά στην κατάταξη. Αυτό οφείλεται στο γεγονός ότι τέτοιοι πόροι Ιστού χρησιμοποιούν συχνά επιθετικές μεθόδους προώθησης.
  • Οι ιστότοποι που έχουν μολυνθεί με ιούς δεν υποβιβάζονται στα αποτελέσματα αναζήτησης και δεν εξαιρούνται από τα αποτελέσματα αναζήτησης - σε αυτήν την περίπτωση, ο χρήστης ενημερώνεται για τον κίνδυνο χρησιμοποιώντας ένα ειδικό εικονίδιο. Αυτό οφείλεται στο γεγονός ότι η Yandex υποθέτει ότι τέτοιοι πόροι Ιστού ενδέχεται να περιέχουν σημαντικά έγγραφα κατόπιν αιτήματος ενός επισκέπτη της μηχανής αναζήτησης.

Για παράδειγμα, η Yandex θα κατατάξει τους ιστότοπους για το ερώτημα "apple":

Εκτός από τους παράγοντες κατάταξης, το Yandex χρησιμοποιεί ειδικά δείγματα με ερωτήματα και απαντήσεις που οι χρήστες των μηχανών αναζήτησης θεωρούν τα καταλληλότερα. Καμία μηχανή δεν μπορεί να κάνει τέτοια δείγματα αυτή τη στιγμή - αυτό είναι το προνόμιο του ανθρώπου. Στο Yandex, καλούνται τέτοιοι ειδικοί αξιολογητές. Το καθήκον τους είναι να αναλύουν πλήρως όλα τα έγγραφα αναζήτησης και να αξιολογούν τις απαντήσεις σε καθορισμένα ερωτήματα. Επιλέγουν τις καλύτερες απαντήσεις και δημιουργούν ένα ειδικό σετ εκπαίδευσης. Σε αυτό, η μηχανή αναζήτησης βλέπει τη σχέση μεταξύ των σχετικών σελίδων και των ιδιοτήτων τους. Έχοντας τέτοιες πληροφορίες, η Yandex μπορεί να επιλέξει τη βέλτιστη φόρμουλα κατάταξης για κάθε αίτημα. Η μέθοδος για την κατασκευή ενός τέτοιου τύπου ονομάζεται Matrixnet. Το πλεονέκτημα αυτού του συστήματος είναι ότι είναι ανθεκτικό στην υπερβολική προσαρμογή, γεγονός που σας επιτρέπει να λαμβάνετε υπόψη έναν μεγάλο αριθμό παραγόντων κατάταξης χωρίς να αυξάνετε τον αριθμό των περιττών αξιολογήσεων και μοτίβων.

Στο τέλος της ανάρτησής μου, θέλω να σας δείξω ενδιαφέροντα στατιστικά στοιχεία που συλλέγονται από τη μηχανή αναζήτησης Yandex κατά τη διάρκεια της εργασίας της.

1. Δημοτικότητα προσωπικών ονομάτων στη Ρωσία και τις ρωσικές πόλεις (δεδομένα λαμβάνονται από bloggers και λογαριασμούς χρηστών κοινωνικά δίκτυατον Μάρτιο του 2012).

Μεγάλος μάντης

Το 1863, ο μεγάλος συγγραφέας Ιούλιος Βερν δημιούργησε το επόμενο βιβλίο του, «Το Παρίσι στον 20ο αιώνα». Σε αυτό περιέγραψε αναλυτικά το μετρό, το αυτοκίνητο, την ηλεκτρική καρέκλα, τον υπολογιστή ακόμα και το Διαδίκτυο. Ωστόσο, ο εκδότης αρνήθηκε να τυπώσει το βιβλίο και έμεινε εκεί για περισσότερα από 120 χρόνια μέχρι που βρέθηκε από τον δισέγγονο του Ιουλίου Βερν το 1989. Το βιβλίο εκδόθηκε το 1994.

Σε αυτό το άρθρο θα μιλήσω για το τι είναι η μηχανή αναζήτησης Yandex, πώς λειτουργεί αυτή η μηχανή αναζήτησης και θα δώσω παραδείγματα τοποθεσιών που η μηχανή αναζήτησης Yandex περιορίζει στην κατάταξη.

Η μηχανή αναζήτησης Yandex, όσον αφορά τη δημοτικότητά της, κατέχει την 20η θέση στον κόσμο και την 1η στη Ρωσία. Επίσημα, η εταιρεία Yandex εγκρίθηκε το 1997 στις 23 Σεπτεμβρίου, η ανάπτυξή της ξεκίνησε στο πλαίσιο της εταιρείας Comp Tek International και ήδη το 2000 η Yandex άρχισε να υπάρχει ως ξεχωριστή εταιρεία.

Ιδρυτές της εταιρείας είναι ο Volozh Arkady Yurievich, ο οποίος είναι ο γενικός διευθυντής, και ο Segalovich Ilya Valentinovich (1964-2013), ιδρυτής της Yandex και διευθυντής τεχνολογίας και ανάπτυξης. Μάθαμε λίγα για την ιστορία του Yandex, τώρα ας μιλήσουμε για τη μηχανή αναζήτησής του.

Και έτσι, η κύρια κατεύθυνση της εταιρείας Yandex είναι μια μηχανή αναζήτησης, το χαρακτηριστικό γνώρισμα της οποίας είναι η τελειοποίηση του ερωτήματος αναζήτησης. Η μηχανή αναζήτησης Yandex σάς επιτρέπει να κάνετε αναζήτηση για το ερώτημα που έχετε επιλέξει στα Ρωσικά, Ουκρανικά, Λευκορωσικά, Ταταρικά, Καζακικά, Αγγλικά, Τουρκικά, Γερμανικά και Γάλλος, ενώ λαμβάνεται υπόψη η μορφολογική τους ορθογραφία.

Η Yandex έχει επίσης αναπτύξει έναν ενδελεχή αλγόριθμο για την αξιολόγηση της συνάφειας και της αρχής του ελέγχου των εγγράφων με την εξαίρεση των αντιγράφων τους σε διαφορετικές κωδικοποιήσεις. Σε αντίθεση με την Google, πιο συγκεκριμένα από τον αλγόριθμο κατάταξης PR - PageRank, άλλος σημαντικό σημείογια τη μηχανή αναζήτησης Yandex, είναι η εισαγωγή ενός ευρετηρίου θεματικών παραπομπών - TIC.

Έργο της μηχανής αναζήτησης Yandex

http://www.yandex.ru
Η μηχανή αναζήτησης Yandex διαθέτει ρομπότ, τα οποία είναι ένα συγκεκριμένο πρόγραμμα για τον έλεγχο τοποθεσιών για τη συνάφειά τους. Τα ρομπότ αναζήτησης μεταβαίνουν στον ιστότοπο μέσω απευθείας συνδέσμων, ευρετηριάζοντας νέες σελίδες και αποθηκεύοντας τις στη βάση δεδομένων τους. Προκειμένου μια ευρετηριασμένη σελίδα ενός ιστότοπου να φτάσει στην κορυφή, κάτι που είναι πολύ σημαντικό, είναι απαραίτητο να ληφθούν υπόψη θέματα ευρετηρίασης όπως η συχνότητα των λέξεων-κλειδιών στη σελίδα, ο αριθμός των εξωτερικών συνδέσμων που οδηγούν στον ιστότοπό σας και το συνολικό βάρος του ιστότοπου, το οποίο μετράται από έναν δείκτη όπως το Yandex TIC.

Ένα παράδειγμα ιστότοπων που το σύστημα Yandex περιορίζει στην κατάταξη

Ιστότοποι με μη μοναδικό περιεχόμενο που έχει αντιγραφεί ή ξαναγραφτεί από άλλους ιστότοπους.

Ιστότοποι που συνδέονται εντατικά μεταξύ τους σε ομάδες.

Ιστότοποι με περιεχόμενο χωρίς νόημα.

Ιστότοποι που χρησιμοποιούν παραπλανητική τεχνολογία.

Φόρουμ και πίνακες μηνυμάτων που περιέχουν πολλά ανεπιθύμητα μηνύματα συνδέσμων.

Ιστότοποι που προσπαθούν να κερδίσουν συνάφεια τοποθετώντας εξωτερικούς συνδέσμους που δεν αποτελούν πρόσκληση από τον συγγραφέα για επίσκεψη στον πόρο του.