Yandex als Suchmaschine. Internet-Suchmaschinen: Yandex, Google, Rambler, Yahoo. Aufbau, Funktionen, Wirkungsweise. Die Zusammensetzung und Prinzipien der Suchmaschine

Heute begeben wir uns auf eine weitere lange Reise entlang der verschlungenen Pfade der Suchmaschinenentwicklung ( Jandex, Jandex). Ich denke, dass der heimische Gigant der Netzwerksuche längst so weit gewachsen ist, dass er nicht zu faul ist, alle seine Korridore zu graben, sich daran zu erinnern, wie sich die Yandex-Suchmaschine entwickelt hat, was in all den Jahren ihres Bestehens interessant war.

Darüber hinaus erhält es viele Besucher von der Yandex-Suchmaschine. Viele von ihnen gehen für kontextbezogene Werbung, ich habe kürzlich den Blog übernommen, daher denke ich, dass dieses Unternehmen einer großen Veröffentlichung mehr als würdig ist.

Wenn wir das russische Internet berücksichtigen, dann ist Yandex hier der unangefochtene Marktführer. In Russland ist dies die erste wichtigste Suchmaschine. Es gibt regionale Suchmaschinen, eine Art Filialen in Weißrussland, der Ukraine, Kasachstan. Yandex ist bei Einwohnern dieser Länder sehr beliebt. Das kann ich zumindest statistisch beurteilen, da viele Besucher aus anderen Regionen kommen.

Derzeit ist Yandex nicht nur eine Suchmaschine, sondern auch zahlreiche Dienste, auf die absolut alle Benutzer dieser Suchmaschine zugreifen können. Hier können Sie die notwendigen Informationen finden und durch die Freizeitauswahl navigieren, Bilder, Waren finden, Preise vergleichen, das Wetter beobachten, in einem sozialen Netzwerk kommunizieren, Fernsehprogramme ansehen, Transport. Es gibt zahlreiche Unternehmenslösungen. Sie können sogar Narod.ru. Auf Yandex wurde ein praktisches System implementiert, in dem Funktionen für die Arbeit mit Ihren Websites implementiert sind. Zu den neuesten verfügbaren Innovationen des Dienstes gehört, der lange Zeit bezahlt wurde, aber im Dezember 2011 wurde dieser Dienst für absolut jeden verfügbar.

Über die wunderbaren Technologien und nützlichen Dienste von Yandex können Sie sehr, sehr lange weitermachen. Daher werde ich zur Vereinfachung der Informationswahrnehmung unsere Reise in Komponenten aufteilen. Ich werde den gesamten Weg der Suchmaschine in chronologischer Reihenfolge nach Jahren beschreiben - von der Entstehung bis heute.

Geschichte der Yandex-Entwicklung

1980er - 1990er Jahre

Geschichte der Yandex-Entwicklung wurzelt in den mittlerweile fernen 80er Jahren der ehemaligen UdSSR. Damals begann erstmals die Entwicklung von Suchsoftware für das Unternehmen Arcadia. Die Arbeiten wurden unter der Leitung von Arkady Borkovsky und Arkady Volozh durchgeführt. Das ist es erstmal Suchtechnologie wurde "Yandex" genannt. Und die Yandex-Site selbst, die wir heute sehen können, erschien 1996. Die damals laufenden Entwicklungen wurden als vielversprechend erkannt, woraufhin die Geschäftsführung von CompTek (Verkauf von Computern und Komponenten) und die Systementwickler entschieden, ob es ratsam ist, die Technologie weiterzuentwickeln und in die breite Masse einzuführen. In diesem Zusammenhang wurde ein Konzept für die Entwicklung des Projekts erstellt, das sich an ein breites Publikum richtet.

Yandex wurde erst am 23. September 1997 offiziell angekündigt. Und tatsächlich war es zunächst eine der Abteilungen von CompTek International. Das heißt, Unabhängigkeit gab es im Allgemeinen mit der Nase von Gulkin. Und erst im Jahr 2000 wurde Yandex zu dem Unternehmen, das man heute sehen kann. In dem Sinne, dass das Unternehmen bereits vollständig unabhängig geworden ist. Unabhängiges Yandex.

Übrigens haben sich die Unternehmen lange vor der Ankündigung der Suchmaschine Yandex einen Namen ausgedacht. Yandex - bedeutet "Sprachindex". Wenn es aus dem Englischen übersetzt wird, stellt es sich als "Yet Another Indexer" heraus. Sicher, später, als sich die Suchmaschine weiterentwickelte, tauchten andere Interpretationen auf. Wenn wir beispielsweise im englischen Index den ersten Buchstaben (I - Z) aus dem Englischen ins Russische übersetzen, erhalten wir "Yandex".

Ilya Segalovich (aktueller CTO) und Arkady Volozh erfanden den Namen „Yandex“

Ein Jahr vor der offiziellen Veröffentlichung des Unternehmens, am 18. Oktober 1996, fand die Messe Netcom'96 statt, auf der CompTek die ersten Produkte der sich entwickelnden Suchmaschine vorstellte. Dies waren Yandex.Site und Yandex.Dict. Dann, ein halbes Jahr später, erschien Yandex.CD - auf der Suche nach Dokumenten auf CD-ROM, und dann wurde das Yandex.Lib-Projekt gestartet. Es war eine Yandex-Paketbibliothek, die in alle Arten von Anwendungen und Datenbanken eingebettet werden sollte.

Zu der Zeit, als Yandex.ru offiziell der Öffentlichkeit vorgestellt wurde, kann Folgendes von dem Interessanten unterschieden werden:

    Bewertung der Relevanz von Dokumenten. Damals war Yandex ziemlich gut darin, Kopien zu finden und auszuschließen. Gleichzeitig wurden Dokumente in verschiedenen Kodierungen durchsucht.

    Suche nach exakter Wortform. Yashka konnte unter Berücksichtigung der Morphologie suchen

    Suche nach Entfernung. Yandex konnte innerhalb eines Absatzes nach genauen Ausdrücken suchen

    Der Kern der Seitenrelevanzbewertung funktionierte. Für jede Anfrage wurden Dokumente unter Berücksichtigung der Übereinstimmung (Relevanz) mit der Anfrage ausgewählt. Außerdem wurde bei der Auswahl von Dokumenten für Suchergebnisse die Häufigkeit (Dichte) des Keywords auf der Seite berücksichtigt. Übrigens, gerade wegen der Unvollkommenheit (damals) dieses Algorithmus, landeten Seiten, die dicht mit Schlüsselwörtern gefüllt waren, tatsächlich ohne Bedeutung, an der Spitze der Suchergebnisse.

    Die Suche berücksichtigte auch den Abstand zwischen Wörtern und die Position der Wörter im Dokument.

Website-Design Yandex

Das allererste Design für die Yandex-Site war ziemlich primitiv und unvollkommen. Es wurde von dem bekannten Artemy Lebedev entwickelt. Er sah so aus

Übrigens wurde im selben Jahr das Yandex-Forum eröffnet. Es war für die Kommunikation zwischen Benutzern des Systems und Entwicklern gedacht. Die Idee war gut, und das Forum funktionierte normal. Es dauerte zwar bis 2008. Dann gab es eine leichte Neuordnung der Prioritäten. Soweit ich das beurteilen kann, wurde Sozialisation bevorzugt. Yandex begann auch aktiv mit der Entwicklung eines eigenen sozialen Netzwerks, auf dessen Grundlage der aktuelle Blog erschien, in dem alle Yandex-Ankündigungen veröffentlicht werden und in dem Benutzer tatsächlich mit Entwicklern kommunizieren. Sie können selbst sehen, die alte Forum-URL ( http://forum.yandex.ru/yandex/) leitet heute zu den bekannten weiter http://webmaster.ya.ru/.

1998

Das gestartete Projekt zeigte gutes Potenzial, es wurde weiter daran gearbeitet. 1998 wurde die Suchmaschine verbessert, viele weitere Funktionalitäten wurden für Benutzer eingeführt. Insbesondere wurde es möglich, im Gefundenen zu suchen, nach ähnlichen Dokumenten zu suchen und vieles mehr. Auch am Design der Yandex-Homepage wird gearbeitet. Jetzt hat sie sich ein wenig verändert

Wie Sie sehen, hat sich äußerlich nichts geändert. Die meisten der technischen Arbeit

1999

Im Laufe des Jahres ist das Publikum des russischen Internetanteils erheblich gewachsen. Damit einhergehend sind Qualität und Technik von Yandex gewachsen, die Entwickler haben viele Verbesserungen umgesetzt. Die Yandex-Suchmaschine hat einen neuen Suchbot eingeführt, wodurch sich die Geschwindigkeit beim Crawlen von Dokumenten im Netzwerk erheblich erhöht hat.

Die Neuerungen, die sich auf die Benutzerteile der Funktionalität auswirkten, waren wie folgt:

    Es wurde möglich, genauer zu suchen – nach Anmerkungen, Bildunterschriften, Bildern, Überschriften

    Ein Suchlimit für eine Gruppe von Websites wurde eingeführt

    Separat zugeteilte Dokumente in russischer Sprache

Übrigens wurde es 1999 zum ersten Mal allen heute vorgestellt bekannte Konzepte(Thematischer Zitationsindex). Richtig, dann wurde es ziemlich primitiv berechnet. Die Autorität der Site (alias TIC) hing in größerem Maße von der Anzahl der Sites ab, die auf die für uns interessante Domain verwiesen.

Das Design des Mains hat sich übrigens auch geändert. Jetzt ist es so etwas wie der Strom geworden

1999 gab es ein weiteres bedeutendes Ereignis. Damals erschien ein kostenloser Website-Builder, der uns allen besser bekannt ist als Narod.ru (kostenloses Hosting und Datei-Hosting). Dieses Projekt existiert übrigens noch. Das Motto dieses Projekts lautete: In 60 Sekunden.

Jahr 2000

Vielleicht war es die Einführung neuer Dienste, die es Yandex ermöglichte, eine grundlegend neue Entwicklungsstufe zu erreichen. Im Laufe der Zeit hat sich die Suchmaschine ihren Status fest gesichert, was sie maßgeblich ermöglicht hat. Tatsächlich war es bereits ein neues Projekt, nicht das, das unter der Schirmherrschaft von CompTek gestartet wurde.

1999 begann Arkady Volozh, nachdem er die Aussichten für die Entwicklung des Projekts verstanden hatte, sich nur noch mit der Förderung von Yandex zu beschäftigen. Die Schwierigkeit bestand jedoch darin, erfahrene Partner zu finden, die über die Fähigkeiten des Corporate Building verfügen. Die einzige Schwierigkeit war, dass es notwendig war, solche Partner zu finden, die in die Entwicklung des Projekts investieren würden, aber gleichzeitig keine vollständige Übergabe des Managements unter ihrer eigenen Kontrolle erfordern würden.

Und so ein Partner wurde gefunden. Das war die Firma ru-Net-Bestände. Mit dieser Gesellschaft wurde im Frühjahr 2000 ein Beteiligungsvertrag geschlossen. Hier gab es jedoch keine Verletzten. Ein gewisser Anteil der Suchmaschine musste noch verschenkt werden. Laut Vertrag des Unternehmens ist 1/3 der Suchmaschine abgereist. Das heißt, von diesem Moment an war Yandex keine strukturelle Abteilung von CompTek, sondern wurde zu einem unabhängigen Unternehmen mit eigenen Büros, eigenem Management, eigenem Budget usw. Arkady Volozh wurde Generaldirektor des Unternehmens.

Ich denke, dass Yandex mit seinem ersten Kopf sehr viel Glück hatte, denn Volozh erwies sich nicht nur als Spezialist für die Suche nach potenziellen Partnern, sondern auch als guter Innovator. Nach dem Beginn des selbstständigen „Floatens“ begannen grandiose Veränderungen im Unternehmen. Das Personal hat sich deutlich erhöht, und die Ressource selbst hat von ihren Führungskräften einen neuen Kick erhalten.

Insgesamt investierte ru-Net Holdings etwa 5 Millionen US-Dollar, und was soll ich sagen, der Deal erwies sich als sehr profitabel, insbesondere wenn man bedenkt, dass die Suchmaschine Nummer eins in Runet heute mindestens mehrere hundert Millionen Dollar kosten wird. Dies ist die bescheidenste Zahl.

Das Jahr 2000 war auch deshalb von Bedeutung, weil in diesem Jahr die Multiportalität von Yandex deutlicher hervortrat, weil viele Dienste auftauchten, die nicht direkt mit der Suche verbunden waren. Yandex.News, Yandex.Mail, Postcards, die Suchleiste bei ya.ru wurden zu solchen Diensten. Darüber hinaus gab es viele Dienste, die später fusionierten und zu dem wurden, was wir heute als Yandex.Market kennen. Darüber hinaus war eine weitere bedeutende Innovation die Einführung einer speziellen Software zur Integration in Benutzerbrowser - Yandex Bar.

Jahr 2001

Dieses Jahr war ein Wendepunkt, denn im Jahr 2001 wurde Yandex in Bezug auf die Besucherzahlen zum Marktführer des RuNet. Darüber hinaus hat auch die Menge der auf den Servern des Unternehmens gespeicherten Informationen zugenommen. Seine Größe betrug 1 Terabyte. Übrigens ist dieses Jahr auch Yandex.Pictures erschienen. Darüber hinaus erschien das elektronische Zahlungssystem Yandex.Money

Darüber hinaus wurde das Design der Hauptseite von Yandex deutlich verbessert. Links zu neuen Diensten und Neuigkeiten erschienen hier. Wir können sagen, dass im Allgemeinen die Umrisse des heutigen Yandex bereits erschienen sind

2002

In diesem Jahr haben Entwickler aktiv daran gearbeitet, den Kommunikationsdienst Yandex.Mail zu verbessern. Beim Filtern der Korrespondenz wurde viel Arbeit geleistet. 2002 war das Jahr der Fusion von drei Diensten – Waren, Guru und Abholung – zu einem – Yandex.Market. Übrigens, Sie können sich selbst davon überzeugen, dass dieser Service auch heute noch sehr aktuell ist. Vielleicht tauchte 2002 zum ersten Mal in all den Jahren des Investierens ein Ziel auf – die Selbstversorgung zu erreichen. Es war notwendig, ein strategisches System zur Monetarisierung des Projekts zu entwickeln. Außerdem eines, das in Zukunft stabile und große Gewinne bringen würde. Es wurde zu einem solchen Modell, und gerade die Einnahmen, mit denen das Unternehmen dieses Werbemodell zu erhalten begann, ermöglichten es, die Selbstversorgung viel früher als erwartet zu erreichen. Daher können wir sagen, dass das Jahr 2002 ein Wendepunkt in Bezug auf den Einstieg in ein geschäftsorientiertes Modell war, das im Übrigen bereits begonnen hat, Früchte zu tragen.

2003

In diesem Jahr wurde die aktive Arbeit am Yandex.Mail-Dienst fortgesetzt. Hier wurden die nächsten massiven Änderungen eingeführt, die alle Benutzer des Systems betrafen. Natürlich ist Ya.Mail funktionaler und komfortabler geworden. Mit Blick auf die Zukunft möchte ich sagen, dass sich der Dienst auch in Zukunft sehr aktiv entwickelt und seine Benutzer mehr als einmal viele neue interessante Funktionen gesehen haben. Insbesondere erhielten die Benutzer eine unbegrenzte Größe des Postfachs und einen neuen Spam-Abwehr-Spamfilter. 2003 wurde das Yandex-Design erneut aktualisiert.

Übrigens entsprach jedes Design einer bestimmten Version. Die 2003er Version des Designs war die achte in Folge und sah so aus

Jeder Rollout neue Version Design durchläuft zunächst eine Beta-Testphase. Und wenn davor Beta-Tests in einem geschlossenen Modus durchgeführt wurden, konnte dieses Mal während zwei Wochen des Testens der neuen Benutzeroberfläche jeder Zugriff auf die neue Benutzeroberfläche erhalten. Ein Jahr später wurde der Haupt zwar erneut aufgerüstet, jedoch erfolgreicher. Und es dauerte in dieser Form bis 2007.

Schon damals war Yandex ein ziemlich seriöses Unternehmen, denn bereits 2003 wurde die Yandex-Suchmaschine erfolgreich in die Präsidenten-Website eingeführt. Im Herbst 2003 brachten die Entwickler die nächsten Produktupdates heraus: Yandex.Publisher (Yandex.Publisher), Yandex.Server (Yandex.Server), die das Erbe von Yandex.Site wurden.

2004

Das Geschäftsmodell der Suchmaschine Nummer eins in Runet funktionierte sehr gut, wodurch sich der Gewinn des Unternehmens im Jahr 2004 auf mehrere zehn Millionen Dollar belief. Dies gab Impulse für die Entwicklung neuer Dienste, beispielsweise eines Kartensuchdienstes, Blogs und Foren. Das Jahr 2004 zeichnet sich auch dadurch aus, dass mit Google ein ernstzunehmender Konkurrent auf dem russischen Markt auftauchte. Es war dringend notwendig, sich dem Kampf um die Führung anzuschließen, weshalb das Yandex-Management beschloss, das Personal zu verzehnfachen. Anfangs waren es 200, nach der personellen Erneuerung waren es 2.000 Mitarbeiter. Aber die Hauptsache ist, dass sich nach der personellen Erneuerung nichts zum Schlechteren verändert hat. Traditionen blieben, Technologien waren auch auf der Ebene. Und im Allgemeinen können wir sagen, dass Yasha kein trockenes Unternehmen geworden ist.

Technologie-Kampf: Yandex gegen Google

2005 Jahr

Dieses Jahr stand unter dem Motto der geografischen Erweiterung der Repräsentanz des Unternehmens. Weil die ukrainische Repräsentanz von Yandex erschienen ist - Yandex.Ukraine. Der Direktor dieser Repräsentanz ist übrigens Sergey Petrenko, der Gründer der bekannten Suche und Autor des interessanten Blogs BloGnot

2005 war auch bedeutsam, weil mein Favorit eröffnet wurde. Dies ist ein Dienst, der auf dem Prinzip "Kolotibablo-Webmaster" basiert, und wenn es auf Russisch ist, dann ist dies ein Dienst, der es Webmastern ermöglicht, Anzeigen auf ihren Websites zu platzieren.

Im selben Jahr erschien Yandex.Dictionaries. Auch beim Dienst Yandex.Money hat es Änderungen gegeben. Jetzt haben alle Benutzer die Möglichkeit, ihr Konto über eine Online-Wallet zu verwalten.

2006

Dieses Jahr wurde durch das Erscheinen des mittlerweile bekannten Dienstes blogs.yandex.ru in Erinnerung gerufen. Das ist eine Art Marketinginstrument. Erlaubt, die öffentliche Meinung, Rezensionen in Blogs und Foren zu studieren. Yandex.Maps hat ein Tool zur Anzeige von Staus vorgestellt.

Von 2006 bis 2010 befand sich Yandex im alten Büro in der Samokatnaya-Straße in Moskau





Wie Sie sehen können, waren sie früher überfüllt. Es ist nicht jetzt, ein riesiges Gebäude für 2.000 Mitarbeiter.

2006 gab es noch einen interessante Veranstaltung– Das erste Remote-Entwicklungsbüro wurde in St. Petersburg eröffnet. Dann war der Maßstab natürlich nicht derselbe. Das ist nicht so wie heute Yandex hat 11 Niederlassungen in Russland, der Ukraine, der Türkei und sogar Kalifornien. Ämter unterscheiden sich nach Art der Tätigkeit. Es gibt Entwicklungsbüros, Verkaufsbüros, Büros, die in Richtung Produktlokalisierung arbeiten

2007

In diesem Jahr gab es Veranstaltungen, die sich mehr an Webmaster richten. Insbesondere erschien der Yandex.Fotki-Dienst. Aber für mich als Webmaster ist das Erscheinen des Dienstes ein interessanteres Ereignis Yandex.Metrica. Zu dieser Zeit war es zwar ein völlig grober Dienst, und er konzentrierte sich nicht auf Webmaster, sondern auf Yandex.Direct-Werbetreibende. Im selben Jahr wurde eine ukrainische Repräsentanz eröffnet - Yandex.ua. Heute stammen laut LiveInternet-Daten fast 14 % des russischsprachigen Datenverkehrs von yandex.ua

Ebenfalls 2007 wurde ein allen Webmastern bekanntes Projekt ins Leben gerufen, das heute nicht mehr genutzt wird, wohl nur von Faulpelzen

2008

Wir können sagen, dass in diesem Jahr der Einflussbereich von Yandex so stark zugenommen hat, dass beschlossen wurde, eine Niederlassung der Suchmaschine in den USA, Kalifornien, zu eröffnen. Gleichzeitig wurden die Algorithmen erheblich erweitert. Insbesondere wurden die internationalen Standards Sitemap, MediaRSS usw. unterstützt, dh wie Sie sehen, sind die Interessensgebiete weit über das Runet hinausgegangen. Die Suchmaschine Nummer eins von Runet ist jetzt zu englischsprachigen Websites geworden. Davor bestand das Problem darin, dass die heimische Suchmaschine keine internationalen Standards unterstützte und daher ein Problem mit der Indizierung von Seiten der Bourgeoisie auftrat, aber nach dem Upgrade von 2008 wurde dieses Problem gelöst. Danach wurde das Yandex-Logo vollständig auf Russisch geschrieben.

Jahr 2009

Dieses Jahr war insofern bezeichnend, als es zuvor keine Einteilung der Suche nach Regionen gab. Das heißt, vor der Einführung dieses Algorithmus wurde er auf den Prinzipien der Einheitlichkeit aufgebaut. Sie geben beispielsweise die Suchanfrage „“ in Moskau und Nowosibirsk in das Suchfeld ein und erhalten die gleichen Ergebnisse. Jetzt hat sich alles geändert. Und die Suchergebnisse werden mit Ergebnissen gemischt, die auf dem Prinzip der Geoabhängigkeit basieren. Einfach ausgedrückt, wenn Sie mit Yandex in Moskau und Nowosibirsk suchen, werden die Ergebnisse unterschiedlich sein.

2009 wurden die Arbeiten an der zuvor gewählten Richtung West fortgesetzt. Insbesondere wurde ein Dienst getestet, mit dessen Hilfe ausländische Seiten übersetzt wurden. Dann entwickelte sich dieser Dienst weiter und wurde 2011 als Yandex.Translation bekannt.

Ein ebenso wichtiges Ereignis war die Einführung einer neuen Methode des maschinellen Lernens - Matrixnet. Diese Technologie verwendet verschiedene Muster als Bewertung und berücksichtigt verschiedene Ranking-Faktoren. Aber Hauptsache, die Technik ist selbstlernend. Bei der Bewertung von Assessoren werden nur reale Muster bewertet, das Auffinden von nicht vorhandenen wird komplett ausgeschlossen.

Die revolutionäre Natur dieser Technologie liegt in der Tatsache, dass Matrixnet eine unglaublich komplexe Ranking-Formel verwendet, die eine Vielzahl von Faktoren berücksichtigt. Dadurch können einerseits bessere Suchergebnisse erzielt werden, andererseits können Webmaster dieses Muster nicht nachvollziehen und somit in ihrem eigenen Interesse beeinflussen.

Mehr zur Matrixnet-Technologie:

2010

Das alte Büro in der Samokatnaya-Straße wurde in der Vergangenheit verlassen, und die gesamte Firma zog in neue Villen um. Eigentlich war dies das Hauptereignis des Jahres 2010.





1. Begriffe und Definitionen In dieser Vereinbarung über die Verarbeitung personenbezogener Daten (im Folgenden als Vereinbarung bezeichnet) haben die folgenden Begriffe die folgenden Definitionen: Betreiber - IP Dneprovskiy Oleg Aleksandrovich. Annahme der Vereinbarung - vollständige und bedingungslose Annahme aller Bedingungen der Vereinbarung durch Übermittlung und Verarbeitung personenbezogener Daten. Personenbezogene Daten - Informationen, die vom Benutzer (Gegenstand personenbezogener Daten) auf der Website eingegeben wurden und direkt oder indirekt mit diesem Benutzer in Verbindung stehen. Benutzer - jede natürliche oder juristische Person, die das Verfahren zum Ausfüllen der Eingabefelder auf der Website erfolgreich abgeschlossen hat. Ausfüllen der Eingabefelder - Verfahren zum Senden des Benutzernamens, Nachnamens, der Telefonnummer und der persönlichen Adresse Email(im Folgenden: personenbezogene Daten) in die Datenbank der registrierten Benutzer der Website, die erstellt wird, um den Benutzer zu identifizieren. Durch das Ausfüllen der Eingabefelder werden personenbezogene Daten an die Datenbank des Betreibers gesendet. Das Ausfüllen der Eingabefelder ist freiwillig. Website - eine Website, die im Internet gehostet wird und aus einer Seite besteht. 2. Allgemeine Bestimmungen 2.1. Diese Vereinbarung wurde auf der Grundlage der Anforderungen des Bundesgesetzes Nr. 152-FZ vom 27. Juli 2006 „Über personenbezogene Daten“ und der Bestimmungen von Artikel 13.11 über „Verletzung des Gesetzes“ erstellt Russische Föderation im Bereich personenbezogener Daten“ des Gesetzes über Ordnungswidrigkeiten der Russischen Föderation und gilt für alle personenbezogenen Daten, die der Betreiber bei der Nutzung der Website über den Benutzer erhalten kann. 2.2. Das Ausfüllen der Eingabefelder durch den Benutzer auf der Website bedeutet die bedingungslose Zustimmung des Benutzers zu allen Bedingungen dieser Vereinbarung (Akzeptanz der Vereinbarung). Im Falle eines Widerspruchs zu diesen Bedingungen füllt der Benutzer die Eingabefelder auf der Website nicht aus. 2.3. Die Zustimmung des Benutzers zur Bereitstellung personenbezogener Daten an den Betreiber und deren Verarbeitung durch den Betreiber gilt bis zur Beendigung der Tätigkeit des Betreibers oder bis zum Widerruf der Zustimmung durch den Benutzer. Durch die Annahme dieser Vereinbarung und das Durchlaufen des Registrierungsverfahrens sowie durch den anschließenden Zugriff auf die Website bestätigt der Benutzer, dass er aus freiem Willen und in seinem eigenen Interesse seine personenbezogenen Daten zur Verarbeitung an den Betreiber übermittelt und stimmt der Verarbeitung zu. Der Benutzer wird darüber informiert, dass die Verarbeitung seiner personenbezogenen Daten durch den Betreiber auf der Grundlage des Bundesgesetzes Nr. 152-FZ vom 27. Juli 2006 „Über personenbezogene Daten“ erfolgt. 3. Liste der personenbezogenen Daten und anderer Informationen über den Benutzer, die an den Betreiber zu übermitteln sind 3.1. Bei der Nutzung der Website des Betreibers gibt der Nutzer folgende personenbezogene Daten an: 3.1.1. Zuverlässige persönliche Informationen, die der Benutzer beim Ausfüllen der Eingabefelder und / oder bei der Nutzung der Dienste der Website über sich selbst bereitstellt, einschließlich Nachname, Vorname, Vatersname, Telefonnummer (privat oder mobil), persönliche E-Mail die Anschrift. 3.1.2. Daten, die während ihrer Nutzung mithilfe der auf dem Gerät des Benutzers installierten Software automatisch an die Dienste der Website übertragen werden, einschließlich IP-Adresse, Informationen von Cookies, Informationen über den Browser des Benutzers (oder ein anderes Programm, das auf die Dienste zugreift). 3.2. Der Betreiber überprüft nicht die Richtigkeit der vom Benutzer bereitgestellten personenbezogenen Daten. Dabei geht der Betreiber davon aus, dass der Nutzer zu den in den Eingabefeldern vorgeschlagenen Themen verlässliche und ausreichende persönliche Angaben macht. 4. Zwecke, Regeln für die Erhebung und Nutzung personenbezogener Daten 4.1. Der Betreiber verarbeitet personenbezogene Daten, die für die Erbringung von Dienstleistungen und die Erbringung von Dienstleistungen für den Benutzer erforderlich sind. 4.2. Die personenbezogenen Daten des Benutzers werden vom Betreiber für folgende Zwecke verwendet: 4. 2.1. Benutzeridentifikation; 4.2.2. Bereitstellung personalisierter Dienste und Dienstleistungen für den Benutzer (sowie Information über neue Werbeaktionen und Dienstleistungen des Unternehmens durch Zusendung von Briefen); 4.2.3. Aufrechterhaltung des Kontakts mit dem Benutzer, falls erforderlich, einschließlich des Versands von Benachrichtigungen, Anfragen und Informationen in Bezug auf die Nutzung von Diensten, die Bereitstellung von Diensten sowie die Bearbeitung von Anfragen und Anträgen des Benutzers; 4.3. Bei der Verarbeitung personenbezogener Daten werden folgende Aktionen durchgeführt: Erhebung, Erfassung, Systematisierung, Sammlung, Speicherung, Klärung (Aktualisierung, Änderung), Extraktion, Nutzung, Sperrung, Löschung, Vernichtung. 4.4. Der Benutzer widerspricht nicht, dass die von ihm angegebenen Informationen in bestimmten Fällen gemäß den geltenden Gesetzen der Russischen Föderation an die autorisierten staatlichen Stellen der Russischen Föderation weitergegeben werden können. 4.5. Die personenbezogenen Daten des Benutzers werden vom Betreiber in der in diesem Vertrag vorgeschriebenen Weise für die gesamte Dauer der Tätigkeit des Betreibers gespeichert und verarbeitet. 4.6. Die Verarbeitung personenbezogener Daten erfolgt durch den Betreiber durch Pflege von Datenbanken, automatisierte, mechanische, manuelle Methoden. 4.7. Die Website verwendet Cookies und andere Technologien, um die Nutzung der Dienste der Website zu verfolgen. Diese Daten sind notwendig, um den technischen Betrieb der Website zu optimieren und die Qualität der Servicebereitstellung zu verbessern. Die Website zeichnet automatisch Informationen (einschließlich URL, IP-Adresse, Browsertyp, Sprache, Datum und Uhrzeit der Anfrage) über jeden Besucher der Website auf. Der Benutzer hat das Recht, die Angabe personenbezogener Daten beim Besuch der Website zu verweigern oder Cookies zu deaktivieren, aber in diesem Fall funktionieren möglicherweise nicht alle Funktionen der Website ordnungsgemäß. 4.8. Die in dieser Vereinbarung vorgesehenen Vertraulichkeitsbedingungen gelten für alle Informationen, die der Betreiber über den Benutzer während seines Aufenthalts auf der Website und der Nutzung der Website erhalten kann. 4.9. Die während der Ausführung dieser Vereinbarung öffentlich bekannt gegebenen Informationen sowie Informationen, die von den Parteien oder Dritten aus Quellen bezogen werden können, zu denen jedermann freien Zugang hat, sind nicht vertraulich. 4.10. Der Betreiber ergreift alle erforderlichen Maßnahmen, um die Vertraulichkeit der personenbezogenen Daten des Benutzers vor unbefugtem Zugriff, Änderung, Offenlegung oder Zerstörung zu schützen, einschließlich: Gewährleistung einer ständigen internen Überprüfung der Datenerhebungs-, -speicher- und -verarbeitungsprozesse und -sicherheit; gewährleistet die physische Sicherheit der Daten und verhindert unbefugten Zugriff auf die technischen Systeme, die den Betrieb der Website gewährleisten, auf der der Betreiber personenbezogene Daten speichert; gewährt nur Mitarbeitern des Betreibers oder autorisierten Personen Zugang zu personenbezogenen Daten, die diese Informationen benötigen, um Aufgaben zu erfüllen, die direkt mit der Bereitstellung von Diensten für den Benutzer sowie dem Betrieb, der Entwicklung und der Verbesserung der Website zusammenhängen. 4.11. In Bezug auf die personenbezogenen Daten des Nutzers wird deren Vertraulichkeit gewahrt, außer in Fällen, in denen der Nutzer freiwillig Informationen über sich selbst für einen allgemeinen Zugang zu einem unbeschränkten Personenkreis bereitstellt. 4.12. Die Übertragung der personenbezogenen Daten des Benutzers durch den Betreiber ist bei der Umstrukturierung des Betreibers und der Übertragung von Rechten auf den Nachfolger des Betreibers rechtmäßig, während der Abtretungsempfänger alle Verpflichtungen zur Einhaltung der Bedingungen dieser Vereinbarung in Bezug auf die von ihm erhaltenen personenbezogenen Daten überträgt. 4.13. Diese Verordnung gilt nur für die Website des Betreibers. Das Unternehmen kontrolliert nicht und ist nicht verantwortlich für die Websites (Dienste) Dritter, zu denen der Benutzer den auf der Website des Betreibers verfügbaren Links folgen kann, einschließlich in den Suchergebnissen. Auf solchen Sites (Diensten) können andere persönliche Informationen vom Benutzer gesammelt oder angefordert werden, und es können auch andere Aktionen durchgeführt werden. 5. Rechte des Benutzers als Subjekt personenbezogener Daten, Änderung und Löschung personenbezogener Daten durch den Benutzer 5.1. Der Benutzer hat das Recht: 5.1.2. Den Betreiber auffordern, seine personenbezogenen Daten zu klären, zu sperren oder zu vernichten, wenn die personenbezogenen Daten unvollständig, veraltet, ungenau, illegal erlangt oder für den angegebenen Verarbeitungszweck nicht erforderlich sind, sowie rechtliche Maßnahmen zum Schutz ihrer Rechte ergreifen. 5.1.3. Informationen über die Verarbeitung seiner personenbezogenen Daten erhalten, einschließlich Informationen, die Folgendes enthalten: 5.1.3.1. Bestätigung der Verarbeitung personenbezogener Daten durch den Betreiber; 5.1.3.2. die Zwecke und Methoden, die der Betreiber für die Verarbeitung personenbezogener Daten verwendet; 5.1.3.3. Name und Standort des Betreibers; 5.1.3.4. verarbeitete personenbezogene Daten in Bezug auf die betreffende Person personenbezogener Daten, die Quelle ihres Eingangs, sofern nicht durch Bundesgesetz ein anderes Verfahren für die Übermittlung dieser Daten vorgesehen ist; 5.1.3.5. Bedingungen für die Verarbeitung personenbezogener Daten, einschließlich der Bedingungen für ihre Speicherung; 5.1.3.6. andere Informationen, die von der geltenden Gesetzgebung der Russischen Föderation vorgesehen sind. 5.2. Der Widerruf der Zustimmung zur Verarbeitung personenbezogener Daten kann durch den Benutzer erfolgen, indem er dem Betreiber eine entsprechende schriftliche (auf einem materiellen Medium gedruckte und vom Benutzer unterzeichnete) Mitteilung sendet. 6. Pflichten des Betreibers. Zugriff auf personenbezogene Daten 6.1. Der Betreiber verpflichtet sich, dafür zu sorgen, dass unbefugter und nicht zielgerichteter Zugriff auf die personenbezogenen Daten der Benutzer der Website des Betreibers verhindert wird. Gleichzeitig gilt der autorisierte und gezielte Zugriff auf die personenbezogenen Daten der Benutzer der Website als Zugriff aller interessierten Parteien auf sie, der im Rahmen der Ziele der Aktivität und des Gegenstands der Website des Betreibers umgesetzt wird. Gleichzeitig ist der Betreiber nicht verantwortlich für die mögliche nicht zielgerichtete Verwendung der personenbezogenen Daten der Benutzer, die sich aus folgenden Gründen ergeben: technische Probleme in der Software und in Hardware und Netzwerken, die außerhalb der Kontrolle des Betreibers liegen; im Zusammenhang mit der absichtlichen oder unabsichtlichen Nutzung der Seiten des Betreibers nicht auf deren beabsichtigter Zweck Dritte; 6.2 Der Betreiber trifft die notwendigen und ausreichenden organisatorischen und technischen Maßnahmen, um die personenbezogenen Daten des Nutzers vor unbefugtem oder versehentlichem Zugriff, Zerstörung, Veränderung, Sperrung, Vervielfältigung, Verbreitung sowie vor sonstigen rechtswidrigen Handlungen Dritter zu schützen. 7. Änderung der Datenschutzerklärung. Anwendbares Recht 7.1. Der Betreiber hat das Recht, Änderungen an dieser Verordnung ohne besondere Benachrichtigung der Benutzer vorzunehmen. Bei Änderungen in der aktuellen Version wird das Datum angegeben neuestes Update. Die neue Version des Reglements tritt ab dem Zeitpunkt ihrer Inkraftsetzung in Kraft, sofern in der neuen Version des Reglements nichts anderes bestimmt ist. 7.2. Diese Verordnung und die Beziehung zwischen dem Benutzer und dem Betreiber, die sich im Zusammenhang mit der Anwendung der Verordnung ergibt, unterliegen dem Recht der Russischen Föderation. Ich akzeptiere Ich akzeptiere nicht

Wir sind nicht so einzigartig, wie wir denken: Millionen von Menschen vor uns rätseln und Millionen nach uns werden die Suchmaschine mit fast denselben Fragen rätseln. Andererseits sind wir zu unberechenbar: Die Formulierung unseres Anliegens wird von einer Vielzahl uns unbewusster Faktoren beeinflusst. Und zumindest aus diesem Grund erfordert das Anliegen eines jeden von uns, so banal es auch sein mag, eine individuelle Herangehensweise.

Tatsächlich läuft die gesamte Arbeit der Yandex-Suchmaschine auf zwei einfache Dinge hinaus: zu verstehen, was eine Person wirklich wissen möchte, und in wenigen Sekunden unter den Milliarden von Dokumenten im Web die für sie geeigneten zu finden.

Fingerabdrücke nehmen

Das System der Suchmaschine ähnelt in gewisser Weise der Matrix, und der Suchroboter (ein komplexes, von ihm erstelltes Programm zur unabhängigen Entscheidungsfindung) ist wie Agent Smith.

Um nicht jedes Mal das gesamte Internet zu durchsuchen, wenn jemand etwas wissen muss, übernimmt die Suchmaschine einen Teil der Arbeit im Voraus – sie prüft, was im Web steht und wo es mit Hilfe von Tausenden von Suchrobotern liegt. Es gibt zwei Arten: einfach und schnell. Das Haupt umgeht und verarbeitet das Internet als Ganzes und das schnelle - Dokumente, die vor einer Minute oder sogar ein paar Sekunden erschienen sind. Die Aufgabe von Roboterprogrammen besteht darin, Informationen auszuwählen, die für Benutzer geeignet und nützlich sind, sie zu verarbeiten und alles Überholte und Unnötige auszusortieren. In gewisser Weise erinnert das an Mülltrennung: Papier in einem Behälter, Glas in einem anderen, Plastik in einem dritten, Lebensmittelabfälle in einem vierten …

Die von den Robotern gesammelten Informationen bilden den sogenannten Internet-Schimmel. Es wird auf Tausenden von Yandex-Servern gespeichert und ständig aktualisiert. Die Impression ist wie eine Liste, die anzeigt, wo welche Informationen zu finden sind. In dieser Liste hat jedes Keyword nicht eine, sondern Millionen von „Seiten“. Damit alle Snapshot-Updates den Benutzern zur Verfügung stehen, werden sie aus dem Repository in die "Basissuche" übertragen. Daten vom Hauptroboter werden alle paar Tage und vom schnellen Roboter in Echtzeit übertragen.

In sauberes Wasser bringen



ABBILDUNG: EUGENE TONKONOGI

Auf der Suche nach der Antwort auf die Frage in der vorbereiteten Datenbank steht die Maschine vor zwei Hauptschwierigkeiten. Die erste Schwierigkeit ist die Sprache. Bevor nach einer Antwort auf eine Frage gesucht wird, ist es wichtig, dass die Maschine versteht, in welcher Sprache sie dies tun soll. Für eine russischsprachige Person findet die Suche nach der Abfrage „Prinz Igors Trupp“ beispielsweise Dokumente mit Informationen über die Armee, und für einen Ukrainer gibt „Prinz Igors Trupp“ auch Dokumente zurück, in denen Prinzessin Olga, seine Frau, erwähnt wird. denn auf Ukrainisch ist „Ehefrau“ „Trupp“. Und in der reichen russischen Sprache können dasselbe Wort oder seine Ableitungen verschiedene Dinge bedeuten. Beispielsweise ist das Wort „Stahl“ eine der Formen des Substantivs „Stahl“ und des Verbs „werden“. Die zweite Schwierigkeit ist die menschliche Psychologie. Bei der Eingabe einer Anfrage erwarten wir eine schnelle und genaue Antwort, natürlich ohne uns Gedanken über die Übereinstimmung der Anfrageformulierung mit den Prinzipien der mathematischen Analyse zu machen, nach denen das Gehirn der Maschine arbeitet. Wenn eine Person zum Beispiel das Wort „Napoleon“ in das Suchfeld eingibt, was möchte eine Person bekommen: ein Kuchenrezept oder eine Biographie des französischen Kaisers, Cognac kaufen oder die Adresse einer psychiatrischen Klinik finden?


In solchen Situationen kommen gleich mehrere Technologien ins Spiel. Sie können Ihnen unter der Suchleiste ein paar Hinweise geben, die die Suchanfrage präzisieren. Wählen Sie zum Beispiel, was Sie brauchen: Napoleon-Rezepte oder Napoleon - Bonaparte. Wenn der Benutzer nicht auf die Anfrage der Maschine reagiert und dem „Napoleon“ keine Wörter hinzufügt, hilft die Spectrum-Technologie: Ohne auf Hilfe zu hoffen, sucht die Maschine sofort nach Informationen in mehreren Kategorien (sowohl über den Kuchen als auch über den Kaiser und über das Yakpferd ...). Darüber hinaus helfen Personalisierungsmechanismen, den Benutzer zu verstehen - das Wissen der Maschine darüber, was dieser Benutzer vor einem Tag oder zwei oder drei Monaten von seinem Computer aus gesucht hat: Wenn Sie Yandex häufig Fragen zum Kochen gestellt haben, wird die Maschine zuerst angezeigt Sie Ergebnisse, die sagen, dass Napoleon ein Kuchen ist.

Kombinationen: Interessenvereine

Die Aufgabe der Suchmaschine beschränkt sich nicht nur auf die einfache Auswahl von Dokumenten, die Wörter und Phrasen aus der Suchanfrage enthalten. Die Maschine muss verstehen, welche Dokumente unsere widersprüchlichen Anforderungen erfüllen und warum sie sie erfüllen. Wollen wir Informationen über Napoleon bekommen - einen Kuchen, oder haben wir vielleicht ein paar Jahre lang einen Fitnessclub mit einem erbärmlichen Namen besucht, oder sind wir sogar vollständig mit Komplexen von Menschen mit kleiner Statur beschäftigt? In jedem Fall erfordert die Lösung des Problems einen nicht-trivialen Ansatz.


Die Macher des Suchprogramms Yandex fanden einen solchen Ansatz, indem sie das Wahlrecht an eine Maschine delegierten. Einerseits weiß und will eine seelenlose, aber sehr schnelle und schlaue Maschine nichts über uns als Individuen wissen, andererseits versucht sie möglichst viel über jeden herauszufinden.

Außer, abgesondert, ausgenommen geografische Position Benutzer- und Sprachanalyse seiner Suchanfragen verwendet die Suchmaschine mehrere tausend Kriterien, die für einen Menschen überhaupt nicht offensichtlich sind.

Der Clou dabei ist, dass die Maschine diese Kriterien selbst entwickelt und aktualisiert.

Es verwendet einfach Daten über die Vorlieben und das Nutzerverhalten von Millionen von Menschen und verknüpft dieses „arithmetische Mittel“ mit der Historie unserer Anfragen. Die Prinzipien, die die Matrix in sich selbst leiten und die Tausende von Kategorien von Benutzerinteressen vergleichen, die sie entwickelt hat, passen oft nicht in traditionelle menschliche Vorstellungen darüber, was „Interessen“ im Prinzip sein können. Es gibt Zehntausende von ihnen. Sie kreieren verschiedene, manchmal lustige Kombinationen miteinander. Eine solche Kombination könnte beispielsweise darin bestehen, die Suchergebnisse mit den Interessen einer Person abzugleichen, die Molche züchtet. Gleichzeitig interessiert sich eine Person nicht nur für Molche, sondern züchtet sie bereits, aber nur im ersten Jahr.

Schätzungen. helfende Hände


Die Matrix entscheidet (mit Hilfe höherer Mathematik) natürlich anhand von Zehntausenden von Kriterien, was und in welcher Reihenfolge den Nutzern angezeigt wird. Aber die Matrix nutzt auch lebende Menschen – 1000 Yandex-Mitarbeiter, die sogenannten Assessoren, bewerten Suchergebnisse für eine bestimmte Suchanfrage (natürlich wird nicht jede Suchanfrage ausgewertet, und das geschieht nicht in Echtzeit) auf ihre Erfüllung der Erwartungen eines gewöhnlichen Benutzers : nicht so rational wie eine Maschine, nicht so präzise in den Begriffen, widersprüchlich und emotional.

Guten Tag, liebe Leser meines SEO-Blogs . Dieser Artikel ist über wie die Yandex-Suchmaschine funktioniert welche Technologien und Algorithmen verwendet werden, um Websites zu bewerten, was es tut, um eine Antwort an Benutzer vorzubereiten. Viele Menschen wissen, dass dieses Flaggschiff der russischen Suche in Runet den Ton angibt, die größte Datenbank in Eurasien besitzt, mit Inhalten von mehr als einer Milliarde Seiten arbeitet und die Antwort auf jede Frage kennt. Laut Liveinternet-Daten für August 2012 beträgt der Anteil von Yandex in Russland 60,5 %. Das monatliche Publikum des Portals beträgt 48,9 Millionen Menschen. Aber das Wichtigste für uns Blogger ist, wie die Suchmaschine unsere Anfragen erhält, wie sie sie verarbeitet und was das Ergebnis ist. Wenn wir diese Informationen kennen und verstehen, ist es einerseits einfacher, alle Yandex-Ressourcen zu nutzen, andererseits ist es einfacher, unsere Blogs zu bewerben. Daher schlage ich vor, mit mir die wichtigsten Technologien der besten Suchmaschine im Runet zu betrachten.

Wenn sich ein Internetnutzer zum ersten Mal an eine Suchmaschine wenden möchte, um Informationen zu erhalten, hat er möglicherweise eine Frage: „Wie funktioniert die Suche?“ Aber wenn er es erhält, ändert sich diese Frage oft in eine andere: „Warum so schnell?“ Und wirklich, warum dauert es 20 Sekunden, um auf einem Computer nach einer Datei zu suchen, aber das Ergebnis einer Abfrage von einem ganzen Netzwerk von Computern auf der ganzen Welt erscheint in einer Sekunde? Das Interessanteste ist, dass die ersten beiden Fragen (wie die Suche funktioniert und warum 1 Sekunde) in einer Antwort enthalten sein können - die Suchmaschine hat sich im Voraus auf die Anfrage des Benutzers vorbereitet.

Um das Prinzip von Yandex und anderen Suchmaschinen zu verstehen, ziehen wir eine Analogie mit einem Telefonbuch. Um eine Telefonnummer zu finden, müssen Sie den Namen des Teilnehmers kennen, und jede Suche dauert in diesem Fall maximal eine Minute, da alle Seiten des Verzeichnisses ein fortlaufender alphabetischer Index sind. Aber stellen Sie sich vor, die Suche würde nach einer anderen Option verlaufen, bei der Telefonnummern nach den Nummern selbst geordnet würden. Nach solchen Suchen, die sich schon länger hinziehen werden, bleiben die Figuren sehr lange vor den Augen des Suchenden. 🙂

Die Suchmaschine legt also alle Informationen aus dem Internet in einer für sie bequemen Form an. Und das Wichtigste: All diese Daten werden vorab in ihrem Verzeichnis abgelegt, bevor der Besucher mit seinen Anfragen kommt. Das heißt, wenn wir Yandex eine Frage stellen, kennt es unsere Antwort bereits. Und gibt es uns in einer Sekunde. Aber diese Sekunde beinhaltet eine Reihe wichtiger Prozesse, die wir nun im Detail betrachten werden.

Internet-Indexierung

Yandex ru sammelt im Internet alle Informationen, die es erreichen kann. Mit Hilfe spezieller Geräte werden alle Inhalte einschließlich Bilder nach visuellen Parametern angezeigt. Die Suchmaschine ist an einer solchen Sammlung beteiligt, und der Prozess des Sammelns und Vorbereitens von Daten wird Indexierung genannt. Basis einer solchen Maschine ist ein Computersystem, das auch als Suchroboter bezeichnet wird. Es crawlt regelmäßig indizierte Websites, überprüft sie auf neue Inhalte und scannt auch das Internet nach gelöschten Seiten. Wenn festgestellt wird, dass eine solche Seite nicht mehr existiert oder von der Indexierung ausgeschlossen wurde, wird sie aus der Suche entfernt.

Wie findet ein Suchroboter neue Seiten? Erstens dank Links von anderen Seiten. Denn wenn ein Link von einer bereits indizierten Seite auf eine neue Webressource gesetzt wird, besucht der Roboter beim nächsten Besuch der zweiten auch die erste. Zweitens gibt es ein wunderbares Service, das im Volksmund "addurilka" genannt wird (von der Phrase in Englische Sprache-addurl - eine Adresse hinzufügen). Darin können Sie die Adresse Ihrer neuen Website eingeben, die nach einer Weile vom Suchroboter besucht wird. Drittens werden mit Hilfe eines speziellen Yandex.Bar-Programms die Besuche von Benutzern verfolgt, die es verwenden. Ist eine Person demnach auf einer neuen Webressource gelandet, taucht dort bald ein Roboter auf.

Werden alle Seiten in der Suche angezeigt? Jeden Tag werden Millionen von Seiten indiziert. Darunter befinden sich Seiten unterschiedlicher Qualität, die unterschiedliche Informationen enthalten können – von einzigartigen Inhalten bis hin zu komplettem Müll. Außerdem gibt es laut Statistik viel mehr Müll im Internet. Der Suchroboter analysiert jedes Dokument mit speziellen Algorithmen. Er stellt fest, ob er welche hat eine nützliche Information ob es die Anfrage des Benutzers beantworten kann. Wenn nicht, dann werden solche Seiten nicht „Astronauten“ genommen, aber wenn ja, dann wird sie in die Suche einbezogen.

Nachdem der Robot die Seite besucht und ihre Nützlichkeit festgestellt hat, erscheint sie im Suchmaschinenspeicher. Hier ist die Analyse eines jeden Dokuments auf die Grundlagen, wie die Meister des Autozentrums sagen - auf die Zahnräder. Die Seite wird von HTML-Markup befreit, der saubere Text durchläuft eine vollständige Bestandsaufnahme - die Position jedes Wortes wird berechnet. In dieser zerlegten Form verwandelt sich die Seite in eine Tabelle mit Zahlen und Buchstaben, die auch als Index bezeichnet wird. Was auch immer mit der Webressource passiert, die diese Seite enthält, ihre neueste Kopie ist immer in der Suche. Auch wenn die Site nicht mehr existiert, werden noch einige Zeit Kopien ihrer Dokumente im Internet gespeichert.

Jeder Index bildet zusammen mit Daten zu Dokumenttypen, Kodierung, Sprache zusammen mit Kopien Suchbasis . Es wird regelmäßig aktualisiert und befindet sich daher auf speziellen Servern, mit deren Hilfe die Anfragen von Suchmaschinenbenutzern verarbeitet werden.

Wie oft findet der Indexierungsprozess statt? Zunächst einmal hängt es von der Art der Sites ab. Eine Webressource des ersten Typs ändert sehr oft den Inhalt ihrer Seiten. Das heißt, wenn ein Suchroboter jedes Mal auf diese Seiten kommt, enthalten sie jedes Mal unterschiedliche Inhalte. Beim nächsten Mal werden Sie darauf nichts mehr finden können, daher werden solche Seiten nicht in den Index aufgenommen. Die zweite Art von Sites sind Data Warehouses, auf deren Seiten regelmäßig Links zu Dokumenten zum Herunterladen hinzugefügt werden. Der Inhalt einer solchen Seite ändert sich normalerweise nicht, sodass der Roboter sie selten besucht. Andere Websites hängen davon ab, wie oft das Material aktualisiert wird. Das bedeutet folgendes – je schneller neue Inhalte auf der Seite erscheinen, desto häufiger kommt der Suchroboter. Und Priorität haben zunächst die wichtigsten Web-Ressourcen (eine News-Site ist zum Beispiel um eine Größenordnung wichtiger als jeder Blog).

Durch die Indizierung können Sie die erste Funktion einer Suchmaschine ausführen - das Sammeln von Informationen auf neuen Seiten im Internet. Aber Yandex hat auch eine zweite Funktion – die Suche nach einer Antwort auf die Anfrage eines Benutzers in einer bereits vorbereiteten Suchdatenbank.

Yandex bereitet eine Antwort vor

Der Prozess der Bearbeitung der Anfrage und der Erteilung entsprechender Antworten wird von abgewickelt Computersystem "Metapoisk" . Für seine Arbeit sammelt es zunächst alle einleitenden Informationen: aus welcher Region die Anfrage stammt, zu welcher Klasse sie gehört, ob die Anfrage Fehler enthält usw. Nach einer solchen Verarbeitung prüft die Metasuche, ob es in der Datenbank genau die gleichen Abfragen mit den gleichen Parametern gibt. Wenn die Antwort ja ist, zeigt das System dem Benutzer die zuvor gespeicherten Ergebnisse an. Existiert eine solche Frage nicht in der Datenbank, verweist die Metasuche auf die Suchdatenbank, die die Indexdaten enthält.

Und hier passieren erstaunliche Dinge. Stellen Sie sich vor, es gäbe einen superstarken Computer, der das gesamte von Suchrobotern verarbeitete Internet speichert. Der Benutzer stellt eine Anfrage und die Suche nach allen an der Anfrage beteiligten Dokumenten beginnt in den Speicherzellen. Die Antwort ist gefunden und alle sind glücklich. Aber nehmen wir einen anderen Fall, wenn es viele Anfragen gibt, die dieselben Wörter in ihrem Körper enthalten. Das System muss jedes Mal dieselben Speicherzellen durchlaufen, was die Zeit für die Datenverarbeitung zeitweise verlängern kann. Dementsprechend steigt die Zeit, was zum Verlust des Benutzers führen kann - er wird sich an eine andere Suchmaschine wenden, um Hilfe zu erhalten.

Um solche Verzögerungen zu vermeiden, werden alle Kopien im Site-Index auf verschiedene Computer verteilt. Nach dem Senden der Anfrage weist die Metasuche solche Server an, nach ihrem Stück mit Text zu suchen. Danach werden alle Daten dieser Maschinen an den zentralen Computer zurückgesendet, der alle Ergebnisse zusammenfasst und dem Benutzer die zehn besten Antworten liefert. Mit dieser Technologie schlagen Sie sofort zwei Fliegen mit einer Klappe: Die Suchzeit wird um ein Vielfaches verkürzt (die Antwort wird in Sekundenbruchteilen erhalten) und durch die Zunahme der Standorte werden Informationen dupliziert (Daten gehen nicht durch plötzliche Ausfälle verloren ). Die Computer selbst mit doppelten Informationen bilden das Rechenzentrum - dies ist ein Raum mit Servern.

Wenn ein Suchmaschinenbenutzer seine Anfrage absendet, enthält die Frage in 20 von 100 Fällen mehrdeutige Ziele. Schreibt er beispielsweise das Wort „Napoleon“ in die Suchleiste, dann ist noch nicht bekannt, welche Antwort ihn erwartet – ein Kuchenrezept oder eine Biographie des großen Feldherrn. Oder der Ausdruck "Die Brüder Grimm" - Märchen, Filme, eine Musikgruppe. Um einen solchen möglichen Torfächer auf konkrete Antworten einzugrenzen, verfügt Yandex über eine spezielle Technologie Reichweite. Es berücksichtigt die Bedürfnisse der Benutzer, die Suchanfragestatistiken verwenden. Aus allen Fragen, die von Besuchern in Yandex gestellt werden, hebt Spectrum verschiedene Objekte hervor (Namen von Personen, Buchtitel, Automodelle usw.) Diese Objekte werden in bestimmte Kategorien eingeteilt. Bis heute gibt es mehr als 60 solcher Kategorien. Mit deren Hilfe hat die Suchmaschine in ihrer Datenbank unterschiedliche Bedeutungen Wörter in Benutzerabfragen. Interessanterweise werden diese Kategorien regelmäßig überprüft (die Analyse findet ein paar Mal pro Woche statt), was es Yandex ermöglicht, die gestellten Fragen genauer zu beantworten.

Basierend auf der Spectrum-Technologie organisierte Yandex Dialogaufforderungen. Sie erscheinen unterhalb der Suchleiste, in die der Benutzer seine mehrdeutige Suchanfrage eingibt. Diese Zeile spiegelt die Kategorien wider, zu denen das Frageobjekt gehören kann. Weitere Suchergebnisse hängen von der Wahl einer solchen Kategorie durch den Benutzer ab.

15 bis 30 % aller Nutzer der Yandex-Suchmaschine möchten nur lokale Informationen (Daten aus der Region, in der sie leben) erhalten. Zum Beispiel über neue Filme in den Kinos deiner Stadt. Daher sollte die Antwort auf eine solche Anfrage für jede Region unterschiedlich sein. In dieser Hinsicht nutzt Yandex seine Technologie Suche nach Regionen . Hier sind zum Beispiel die Antworten, die Anwohner, die nach einem Filmrepertoire in ihrem Oktyabr-Kino suchen, bekommen können:

Und das ist das Ergebnis, das die Einwohner der Stadt Stavropol für dieselbe Anfrage erhalten:

Die Region des Benutzers wird in erster Linie durch seine IP-Adresse bestimmt. Manchmal sind diese Daten nicht korrekt, da mehrere Anbieter gleichzeitig für mehrere Regionen arbeiten und daher die IP-Adressen ihrer Benutzer ändern können. Wenn Ihnen das passiert ist, können Sie Ihre Region im Prinzip ganz einfach in den Einstellungen in der Suchmaschine ändern. Es wird in der oberen rechten Ecke auf der Ergebnisseite aufgeführt. Du kannst es ändern.

Suchmaschine Yandex ru - Antwortergebnisse

Wenn Metapoisk eine Antwort vorbereitet hat, sollte die Yandex-Suchmaschine sie auf der Ergebnisseite anzeigen. Es ist eine Liste von Links zu gefundenen Dokumenten mit ein paar Informationen zu jedem. Die Aufgabe der Erbesteht darin, dem Benutzer die relevantesten Antworten so informativ wie möglich zu liefern. Die Vorlage für einen solchen Link sieht folgendermaßen aus:

Betrachten wir diese Form des Ergebnisses genauer. Für Kopfzeile der Suchergebnisse Yandex verwendet häufig den Namen des Seitentitels (was Optimierer in den Titel-Tag schreiben). Wenn es nicht vorhanden ist, erscheinen hier die Wörter aus dem Titel des Artikels oder Beitrags. Wenn der Titeltext groß ist, fügt die Suchmaschine in dieses Feld ihr Fragment ein, das für die gegebene Anfrage am relevantesten ist.

Sehr selten, aber es kommt vor, dass der Titel nicht mit dem Inhalt der Anfrage übereinstimmt. In diesem Fall generiert Yandex anhand des Textes im Artikel oder Post einen eigenen Suchergebnistitel. Es wird definitiv Abfragewörter haben.

Für Ausschnitt Die Suchmaschine verwendet den gesamten Text auf der Seite. Es wählt alle Fragmente aus, in denen die Antwort auf die Abfrage vorhanden ist, und wählt dann die relevantesten davon aus und fügt Links zum Dokument in das Formularfeld ein. Dank dieses Ansatzes kann ein kompetenter Optimierer das Snippet neu erstellen, nachdem er es gesehen hat, und so die Attraktivität des Links verbessern.

Zur besseren Erkennbarkeit des Ergebnisses zum Nutzerwunsch sind die Überschriften als Links im Text formatiert (blau hinterlegt mit Unterstreichung). Für die Attraktivität der Webressource und ihre Wiedererkennung wird ein Favicon hinzugefügt - ein kleines Unternehmenssymbol der Website. Es erscheint links neben dem Text in der ersten Zeile vor der Überschrift. Alle Wörter, die in der Anfrage in der Antwort enthalten waren, sind ebenfalls fett gedruckt, um die Wahrnehmung zu erleichtern.

Kürzlich hat die Suchmaschine Yandex dem Snippet verschiedene Informationen hinzugefügt, die dem Benutzer helfen sollen, seine Antwort noch schneller und genauer zu finden. Wenn ein Benutzer beispielsweise den Namen einer Organisation in seine Anfrage schreibt, fügt Yandex deren Adresse, Kontaktnummern und einen Link zum Standort in geografischen Karten in das Snippet ein. Wenn die Suchmaschine mit der Struktur der Website vertraut ist, die ein Dokument mit einer Antwort für den Benutzer enthält, wird sie dies auf jeden Fall anzeigen. Außerdem kann Yandex die am häufigsten besuchten Seiten einer solchen Webressource sofort zum Snippet hinzufügen, sodass der Besucher auf Wunsch sofort zu dem Abschnitt gehen kann, den er benötigt, und so Zeit spart.

Es gibt Snippets, die den Preis eines Produkts für einen Online-Shop, die Bewertung eines Hotels oder Restaurants in Form von Sternen und andere interessante Informationen mit verschiedenen Zahlen zu Objekten in Suchdokumenten enthalten. Die Aufgabe solcher Informationen besteht darin, eine vollständige Liste von Daten über diejenigen Themen oder Objekte zu liefern, die für den Benutzer von Interesse sind.

Im Allgemeinen sieht die Antwortseite bereits mit verschiedenen Beispielen wie folgt aus:

Ranking und Assessoren

Die Aufgabe von Yandex umfasst nicht nur die Suche nach allen Optionen Antwort, sondern auch die Auswahl der besten (relevanten). Schließlich wird der Nutzer nicht alle Links durchwühlen, die Yandex ihm als Suchergebnis liefert. Der Vorgang zum Ordnen von Suchergebnissen wird aufgerufen Rangfolge . Das heißt, es ist das Ranking, das die Qualität der vorgeschlagenen Antworten bestimmt.

Es gibt Regeln, nach denen Yandex relevante Seiten bestimmt:

  • Eine Abnahme der Positionen auf der Ergebnisseite wartet auf Websites, die die Qualität der Suche verschlechtern. Normalerweise handelt es sich dabei um Webressourcen, deren Besitzer versuchen, die Suchmaschine zu täuschen. Dies sind beispielsweise Websites mit Seiten, die bedeutungslosen oder unsichtbaren Text enthalten. Natürlich ist es für den Suchroboter sichtbar und verständlich, aber nicht für den Besucher, der dieses Dokument liest. Oder Seiten, die den Nutzer beim Klick auf einen Link im Suchergebnisbereich sofort auf eine ganz andere Seite weiterleiten.
  • Seiten mit erotischen Inhalten gelangen nicht in die Ergebnisse oder werden stark im Ranking reduziert. Dies liegt daran, dass solche Webressourcen oft aggressive Werbemethoden verwenden.
  • Mit Viren infizierte Seiten werden in den Suchergebnissen nicht abgesenkt und nicht aus den Suchergebnissen ausgeschlossen - in diesem Fall wird der Benutzer mit einem speziellen Symbol über die Gefahr informiert. Dies liegt daran, dass Yandex davon ausgeht, dass solche Webressourcen auf Anfrage eines Suchmaschinenbesuchers wichtige Dokumente enthalten können.

So ordnet Yandex beispielsweise Websites für die Suchanfrage „Apfel“ ein:

Zusätzlich zu den Ranking-Faktoren verwendet Yandex spezielle Stichproben mit Anfragen und Antworten, die Suchmaschinennutzer für am geeignetsten halten. Keine Maschine kann derzeit solche Proben herstellen - das ist das Vorrecht des Menschen. Bei Yandex werden solche Spezialisten angerufen Gutachter. Ihre Aufgabe ist es, alle Recherchendokumente vollständig zu analysieren und Antworten auf gegebene Anfragen auszuwerten. Sie wählen die besten Antworten aus und erstellen eine spezielle Trainingsprobe. Darin sieht die Suchmaschine die Beziehung zwischen relevanten Seiten und ihren Eigenschaften. Mit diesen Informationen kann Yandex die optimale Ranking-Formel für jede Anfrage auswählen. Die Methode zur Konstruktion einer solchen Formel heißt Matrixnet. Der Vorteil dieses Systems besteht darin, dass es resistent gegen Overfitting ist, wodurch Sie eine große Anzahl von Ranking-Faktoren berücksichtigen können, ohne die Anzahl unnötiger Schätzungen und Muster zu erhöhen.

Am Ende meines Beitrags möchte ich Ihnen einige interessante Statistiken zeigen, die die Suchmaschine Yandex im Laufe ihrer Arbeit gesammelt hat.

1. Die Popularität von Personennamen in Russland und russischen Städten (Daten aus Blogger- und Benutzerkonten soziale Netzwerke im März 2012).

großer Seher

1863 verfasste der große Schriftsteller Jules Verne sein nächstes Buch, Paris im 20. Jahrhundert. Darin beschrieb er ausführlich die U-Bahn, das Auto, den elektrischen Stuhl, den Computer und sogar das Internet. Der Verlag weigerte sich jedoch, das Buch zu drucken, und es blieb mehr als 120 Jahre liegen, bis Jules Vernes Urenkel es 1989 fand. Das Buch wurde 1994 veröffentlicht.

In diesem Artikel werde ich darüber sprechen, was die Yandex-Suchmaschine über den Betrieb dieser Suchmaschine ist, und Beispiele für Websites geben, die die Yandex-Suchmaschine im Ranking einschränkt.

Die Suchmaschine Yandex belegt in Bezug auf ihre Popularität den 20. Platz in der Welt und den 1. Platz in Russland. Offiziell wurde Yandex am 23. September 1997 zugelassen, seine Entwicklung begann als Teil von Comp Tek International, und bereits im Jahr 2000 begann Yandex als eigenständiges Unternehmen zu existieren.

Die Gründer des Unternehmens sind Arkady Yurievich Volozh, der CEO ist, und Ilya Valentinovich Segalovich (1964-2013), Yandex-Gründer und Direktor für Technologie und Entwicklung. Wir haben uns ein wenig mit der Geschichte von Yandex vertraut gemacht, jetzt reden wir über seine Suchmaschine.

Die Hauptrichtung von Yandex ist also eine Suchmaschine, deren Besonderheit die Feinabstimmung der Suchanfrage ist. Die Yandex-Suchmaschine ermöglicht es Ihnen, nach Ihrer gewählten Suchanfrage in Russisch, Ukrainisch, Weißrussisch, Tatarisch, Kasachisch, Englisch, Türkisch, Deutsch und Französisch zu suchen und dabei deren morphologische Schreibweise zu berücksichtigen.

Yandex hat auch einen gründlichen Algorithmus zur Bewertung der Relevanz und das Prinzip der Überprüfung von Dokumenten unter Ausschluss ihrer Kopien in verschiedenen Codierungen entwickelt. Im Gegensatz zu Google, genauer gesagt von seinem PR-Ranking-Algorithmus - PageRank, ein anderer wichtiger Punkt für die Suchmaschine Yandex ist die Einführung eines thematischen Zitationsindex - TIC.

Die Arbeit der Yandex-Suchmaschine

http://www.yandex.ru
Die Yandex-Suchmaschine verfügt über Roboter, die ein spezielles Programm zum Überprüfen von Websites auf ihre Relevanz sind. Suchroboter gehen über direkte Links auf die Website, indizieren neue Seiten und speichern sie in ihrer Datenbank. Damit die indizierte Seite der Website in die TOP gelangt, was sehr wichtig ist, müssen Indexierungspunkte wie die Häufigkeit von Schlüsselwörtern auf der Seite, die Anzahl der externen Links, die zu Ihrer Website führen, und berücksichtigt werden das Gesamtgewicht der Website, das von einem Indikator wie dem Yandex TIC gemessen wird.

Ein Beispiel für Websites, die das Yandex-System im Ranking einschränkt

Websites mit nicht eindeutigen Inhalten, die von anderen Websites kopiert oder umgeschrieben wurden.

Sites, die in Gruppen stark miteinander verlinkt sind.

Websites mit bedeutungslosem Inhalt.

Websites, die betrügerische Technologien verwenden.

Foren und Message Boards, die viel Link-Spam enthalten.

Seiten, die versuchen, sich Relevanz zu verschaffen, indem sie externe Links platzieren, sind kein Angebot des Autors, seine Ressource zu besuchen.