Yandex ca motor de căutare. Motoare de căutare pe Internet: Yandex, Google, Rambler, Yahoo. Compoziție, funcții, principiu de funcționare. Compoziția și principiile de funcționare ale sistemului de căutare

Astăzi am pornit într-o altă călătorie lungă de-a lungul căilor ornamentate ale dezvoltării motoarelor de căutare ( Yandex, Yandex). Cred că gigantul autohton al căutării online a crescut de mult la un astfel de nivel încât nu este prea lene să sape în toate colțurile sale, să-ți amintești cum s-a dezvoltat motorul de căutare Yandex și ce a fost interesant în toți anii lui. existenţă.

În plus, primește o mulțime de vizitatori de la motorul de căutare Yandex. Mulți dintre ei pleacă prin publicitate contextuală, eu am preluat recent blogul, așa că cred că această companie este mai mult decât demnă să se scrie o publicație mare despre ea.

Dacă luăm în considerare internetul rusesc, atunci Yandex este liderul incontestabil. În Rusia este primul cel mai important motor de căutare. Există motoare de căutare regionale, un fel de filiale în Belarus, Ucraina și Kazahstan. Yandex este foarte popular printre rezidenții acestor țări. Pot judeca acest lucru cel puțin după statistici, văzând că mulți vizitatori vin din alte regiuni.

În prezent, Yandex nu este doar un motor de căutare, ci și numeroase servicii pe care absolut toți utilizatorii acestui motor de căutare le pot accesa. Aici puteți găsi informațiile de care aveți nevoie și puteți naviga pe alegerea dvs. de activități de agrement, găsiți poze, produse, comparați prețuri, verificați vremea, comunicați pe o rețea de socializare, urmăriți programele de televiziune și transportul. Există numeroase soluții pentru întreprinderi. Puteți chiar să accesați Narod.ru. Yandex are un sistem convenabil care oferă funcționalități pentru lucrul cu site-urile dvs. web. Printre cele mai recente inovații disponibile ale serviciului se numără, care a rămas plătit destul de mult timp, dar în decembrie 2011 acest serviciu a devenit disponibil pentru absolut toată lumea.

Aș putea continua și mai departe despre tehnologiile minunate și serviciile utile ale Yandex pentru o perioadă foarte, foarte lungă. Prin urmare, pentru ușurarea percepției informațiilor, voi împărți călătoria noastră în componente. Voi descrie întreaga cale a motorului de căutare în ordine cronologică pe an - de la creare până în prezent.

Istoria dezvoltării Yandex

Anii 1980 - 1990

Istoria dezvoltării Yandexîși are rădăcinile în anii '80, acum îndepărtați, în timpul URSS. Atunci a început dezvoltarea software-ului de căutare la Arcadia. Lucrarea a fost realizată sub conducerea lui Arkady Borkovsky și Arkady Volozh. Acesta este primul tehnologie de căutare a primit numele „Yandex”. Și site-ul Yandex în sine, cel pe care îl putem vedea astăzi, a apărut în 1996. Dezvoltarile care au fost efectuate la acel moment au fost recunoscute ca promitatoare, drept urmare conducerea CompTek (vânzarea de computere și componente) și dezvoltatorii de sisteme au decis oportunitatea dezvoltării ulterioare a tehnologiei și introducerea acesteia în masă. . În acest sens, a fost elaborat un concept de dezvoltare a proiectului, destinat unui public larg.

Yandex a fost anunțat oficial abia pe 23 septembrie 1997. Și, de fapt, la început a fost una dintre diviziile CompTek International. Adică nu era deloc independență acolo. Și abia în 2000 Yandex a devenit compania care poate fi văzută astăzi. În sensul că firma a devenit deja complet independentă. Yandex independent.

Apropo, cu mult înainte de anunțul motorului de căutare Yandex, compania a venit cu un nume. Yandex – înseamnă „Index de limbă”. Dacă este tradus din engleză, se dovedește „Yet Another indexer”. Adevărat, atunci, pe măsură ce motorul de căutare s-a dezvoltat, au început să apară și alte interpretări. De exemplu, dacă în indexul englezesc traduceți prima literă (I – Z) din engleză în rusă, obțineți „Yandex”.

Numele „Yandex” a fost inventat de Ilya Segalovici (actualul director de tehnologie) și Arkady Volozh

Cu un an înainte de lansarea oficială a companiei, pe 18 octombrie 1996, a avut loc expoziția Netcom’96, la care CompTek a prezentat primele produse ale motorului de căutare în curs de dezvoltare. Acestea au fost Yandex.Site și Yandex.Dict. Apoi, șase luni mai târziu, a apărut Yandex.CD - căutând documente pe CD ROM, apoi a început proiectul Yandex.Lib. Era o bibliotecă de pachete Yandex, care era destinată încorporarii în tot felul de aplicații și baze de date.

În momentul în care Yandex.ru a fost prezentat oficial publicului, următoarele ar putea fi evidențiate ca interesante:

    Evaluarea relevanței documentelor. La acea vreme, Yandex era destul de bun în găsirea de copii și excluderea acestora. Totodată, documentele au fost căutate în diverse codificări

    Căutați după forma exactă a cuvântului. Yashka a știut să caute ținând cont de morfologie

    Căutare în funcție de distanță. Yandex ar putea căuta într-un paragraf folosind expresii exacte

    Miezul pentru evaluarea relevanței paginilor era funcțional. Pentru fiecare cerere, documentele au fost selectate ținând cont de conformitatea (relevanța) la cerere. În plus, la selectarea documentelor pentru rezultatele căutării s-a luat în considerare frecvența (densitatea) cuvântului cheie din pagină. Apropo, tocmai din cauza imperfecțiunii (la acea vreme) a acestui algoritm, paginile pline dens de cuvinte cheie, practic lipsite de sens, apăreau în primele rezultate ale căutării.

    De asemenea, în timpul căutării s-a luat în considerare distanța dintre cuvinte și modul în care sunt localizate cuvintele în document

Design site-ul Yandex

Primul design pentru site-ul web Yandex a fost destul de primitiv și imperfect. A fost dezvoltat de binecunoscuta Artemy Lebedev. Arăta așa

Apropo, forumul Yandex a fost deschis în același an. Destinat comunicării între utilizatorii de sistem și dezvoltatori. Ideea a fost bună, iar forumul a funcționat normal. Adevărat, a existat până în 2008. Apoi a avut loc o uşoară remaniere a priorităţilor. Din câte îmi dau seama, s-a dat preferință socializării. Yandex a început să-și dezvolte în mod activ propria rețea socială, pe baza căreia a apărut blogul actual, unde sunt publicate toate anunțurile Yandex și unde, de fapt, utilizatorii comunică cu dezvoltatorii. Puteți vedea singur, vechiul URL al forumului ( http://forum.yandex.ru/yandex/) astăzi o redirecționare este cunoscută de toată lumea http://webmaster.ya.ru/.

1998

Proiectul, care a fost lansat, a arătat un potențial bun și au continuat să lucreze la el. În 1998, motorul de căutare a fost îmbunătățit și multe alte funcționalități au fost introduse pentru utilizatori. În special, a devenit posibil să căutați prin ceea ce a fost găsit, să căutați documente similare și multe altele. De asemenea, se lucrează la proiectarea paginii de pornire Yandex. Acum s-a schimbat puțin

După cum puteți vedea, în exterior nimic nu s-a schimbat. Majoritatea lucrărilor tehnice au fost efectuate

1999

De-a lungul anului, audiența cotei ruse a internetului a crescut semnificativ. Odată cu aceasta, calitatea și tehnologia Yandex au crescut, iar dezvoltatorii au introdus multe îmbunătățiri. Motorul de căutare Yandex a introdus un nou bot de căutare, care a crescut semnificativ viteza de accesare cu crawlere a documentelor în rețea.

Inovațiile care au afectat părțile utilizator ale funcționalității au fost următoarele:

    Acum este posibil să căutați mai precis - după adnotări, subtitrări, imagini, titluri

    Am introdus o restricție de căutare pe un grup de site-uri

    Documentele în limba rusă au fost evidențiate separat

Apropo, în 1999 a fost prezentat pentru prima dată tuturor astăzi concepte cunoscute(index de citare a subiectului). Adevărat, atunci a fost calculat destul de primitiv. Autoritatea site-ului (aka TIC) depindea în mare măsură de numărul de site-uri care aveau legătură cu domeniul de interes pentru noi.

Designul paginii principale, de altfel, s-a schimbat și el. Acum a devenit ceva mai asemănător cu cel actual

A mai avut loc un alt eveniment semnificativ în 1999. Atunci a apărut un constructor de site-uri web gratuit, mai cunoscut de noi toți sub numele de Narod.ru (serviciu gratuit de găzduire și partajare de fișiere). Apropo, acest proiect încă există. Motto-ul acestui proiect a fost: în 60 de secunde.

anul 2000

Poate că introducerea de noi servicii a permis lui Yandex să atingă un nivel fundamental nou de dezvoltare. De-a lungul timpului, motorul de căutare și-a stabilit ferm statutul, ceea ce a făcut posibil să fie semnificativ De fapt, acesta a fost un proiect nou, nu cel care a început sub auspiciile CompTek.

În 1999, Arkady Volozh, realizând perspectivele de dezvoltare a proiectului, a început să se concentreze doar pe promovarea Yandex. Dar dificultatea a fost că a fost necesar să se găsească parteneri experimentați, cu abilități de construcție corporative. Singura dificultate a fost că era necesar să se găsească parteneri care să investească în dezvoltarea proiectului, dar să nu necesite un transfer complet al managementului sub conducerea lor.

Și un astfel de partener a fost găsit. Era o companie ru-Net Holdings. În primăvara anului 2000 a fost încheiat un acord de investiții cu această societate. Aici, însă, au fost câteva victime. Totuși, a trebuit să renunț la o anumită cotă din motorul de căutare. Conform acordului, compania a primit 1/3 din motorul de căutare. Adică, din acel moment, Yandex a încetat să mai fie o divizie structurală a CompTek, dar a devenit o companie independentă care avea propriile birouri, propriul management, propriul buget etc. Arkady Volozh a devenit directorul general al companiei.

Cred că Yandex a fost foarte norocos cu primul său lider, deoarece Volozh s-a dovedit a fi nu numai un specialist în găsirea de potențiali parteneri, ci și un bun inovator. După începerea „înotului” independent, au început schimbări extraordinare în companie. Personalul a fost completat în mod semnificativ, iar resursa în sine a primit o nouă lovitură din partea liderilor săi.

În total, ru-Net Holdings a investit aproximativ 5 milioane de dolari.Ce să spun, afacerea s-a dovedit a fi foarte profitabilă, mai ales având în vedere faptul că astăzi motorul de căutare numărul unu în RuNet va costa cel puțin câteva sute de milioane de dolari. Aceasta este cea mai conservatoare estimare.

Anul 2000 a fost, de asemenea, semnificativ pentru că în acest an a început să apară mai clar multiportalitatea Yandex, deoarece au început să apară multe servicii care nu erau direct legate de căutare. Astfel de servicii au fost Yandex.News, Yandex.Mail, Cărți poștale și bara de căutare de la ya.ru. În plus, au existat multe servicii care au fuzionat ulterior, devenind ceea ce știm astăzi ca Yandex.Market. În plus, o altă inovație semnificativă a fost introducerea unui software specializat pentru integrarea în browserele utilizatorilor - Yandex Bar.

anul 2001

Anul acesta a fost un punct de cotitură, deoarece în 2001 Yandex a devenit liderul Runetului în ceea ce privește traficul. În plus, a crescut și cantitatea de informații stocate pe serverele companiei. Dimensiunea sa a fost de 1 terabyte. Apropo, Yandex.Images a apărut și în acest an. În plus, a apărut sistemul electronic de plată Yandex.Money

În plus, designul paginii de pornire Yandex a fost îmbunătățit mai semnificativ. Iată link-uri către noi servicii și știri. Putem spune că, în general, contururile Yandex-ului de astăzi au apărut deja

2002

În acest an, dezvoltatorii au lucrat activ pentru a îmbunătăți serviciul de comunicare - Yandex.Mail. S-a făcut multă muncă pentru a filtra corespondența. 2002 a fost anul fuziunii a trei servicii - Products, Guru și Select într-unul singur - Yandex.Market. Apropo, puteți vedea singuri că acest serviciu este foarte relevant și astăzi. Poate pentru prima dată în toți anii de investiții, un obiectiv a apărut în 2002 - atingerea autosuficienței. A fost necesară dezvoltarea unui sistem strategic de monetizare a proiectului. Mai mult, unul care ar aduce profituri stabile și mari în viitor. A devenit un astfel de model și tocmai veniturile pe care compania a început să le primească din acest model de publicitate au făcut posibilă atingerea autosuficienței mult mai devreme decât se aștepta. Prin urmare, putem spune că anul 2002 a fost un punct de cotitură în ceea ce privește intrarea într-un model orientat spre business, care, de altfel, a început deja să dea roade.

2003

În acest an, munca activă la serviciul Yandex.Mail a continuat. Aici au fost introduse următoarele modificări masive, care afectează toți utilizatorii sistemului. Desigur, Ya.Mail a devenit mai funcțional și mai convenabil. Privind în perspectivă, vreau să spun că în viitor serviciul s-a dezvoltat foarte activ, iar utilizatorii săi au văzut multe noi funcții interesante de mai multe ori. În special, utilizatorii au primit o dimensiune nelimitată a cutiei poștale și un nou filtru de spam „Spam Defense”. În 2003, designul Yandex a fost actualizat din nou.

Apropo, fiecare design corespundea unei versiuni specifice. Versiunea din 2003 a designului a fost a opta la rând și arăta astfel

Orice lansare versiune noua designul trece inițial printr-o perioadă de testare beta. Și dacă înainte de aceasta testele beta au fost efectuate în modul închis, atunci de data aceasta, pe parcursul a două săptămâni de testare de probă a noii interfețe, oricine putea obține acces la noua interfață. Adevărat, un an mai târziu, cel principal a fost din nou modernizat, dar cu mai mult succes. Și a existat în această formă până în 2007.

Chiar și la acel moment, Yandex era deja o companie destul de reputată, deoarece deja în 2003 motorul de căutare Yandex a fost implementat cu succes pe site-ul prezidențial. În toamna anului 2003, dezvoltatorii au lansat următoarele actualizări ale produsului: Yandex.Publisher, Yandex.Server (Yandex.Server), care a devenit moștenirea Yandex.Site.

2004

Modelul de afaceri ocupat de motorul de căutare numărul unu în RuNet a funcționat foarte bine, drept urmare profitul primit de companie în 2004 se ridica deja la zeci de milioane de dolari. Acest lucru a dat un impuls dezvoltării de noi servicii, de exemplu, un serviciu de căutare pe o hartă, bloguri și forumuri. Anul 2004 se remarcă și prin faptul că atunci a apărut pe piața rusă un concurent serios în persoana lui Google. Era nevoie urgentă de a intra în lupta pentru conducere, drept urmare conducerea Yandex a decis să-și mărească personalul de zece ori. Inițial erau 200, după actualizarea personalului erau 2.000 de angajați. Dar principalul lucru este că, după reînnoirea personalului, nimic nu s-a schimbat în rău. Tradițiile au rămas, tehnologiile au fost și ele la zi. Și, în general, putem spune că Yasha nu s-a transformat într-o corporație uscată.

Bătălia tehnologiilor: Yandex vs Google

anul 2005

Anul acesta a trecut sub sloganul extinderii geografice a reprezentanței companiei. Pentru că a apărut reprezentanța ucraineană a Yandex - Yandex.Ukraine. Apropo, directorul acestei reprezentanțe este Serghei Petrenko, fondatorul renumitei căutări și autorul blogului interesant BloGnot

Anul 2005 a fost și el semnificativ pentru că s-a deschis cel preferat. Acesta este un serviciu bazat pe principiul „kolotibablo webmaster”, iar în rusă, este un serviciu care permite webmasterilor să plaseze reclame pe site-urile lor.

În același an, a apărut Yandex.Dictionaries. S-au produs modificări și în serviciul Yandex.Money. Acum toți utilizatorii au posibilitatea de a-și gestiona contul printr-un portofel online.

2006

Anul acesta va fi amintit pentru apariția serviciului acum binecunoscut blogs.yandex.ru. Acesta este un fel de instrument de marketing. Mi-a permis să studiez opinia publică, recenzii pe bloguri și forumuri. Yandex.Maps a introdus un instrument pentru afișarea blocajelor de trafic.

Din 2006 până în 2010, Yandex a fost situat într-un birou vechi de pe strada Samokatnaya din Moscova





După cum puteți vedea, anterior erau puțin înghesuite. Aceasta nu este acum, o clădire uriașă pentru 2000 de angajați.

A mai fost una în 2006 eveniment interesant– primul birou de dezvoltare la distanță a fost deschis la Sankt Petersburg. Apoi, desigur, scara nu era încă aceeași. Nu este ca astăzi Yandex are 11 birouri în Rusia, Ucraina, Turcia și chiar California. Birourile variază în funcție de tipul de activitate. Există birouri implicate în dezvoltare, birouri de vânzări, birouri care lucrează în zona de localizare a produselor

2007

Anul acesta au avut loc evenimente care se concentrează mai mult pe webmasteri. În special, a apărut serviciul Yandex.Photos. Dar pentru mine, ca webmaster, un eveniment mai interesant este apariția serviciului Yandex.Metrica. Adevărat, la acea vreme era un serviciu complet brut și nu era destinat webmasterilor, ci agenților de publicitate Yandex.Direct. În același an, a fost deschisă o reprezentanță ucraineană - Yandex.ua. Astăzi, conform LiveInternet, aproape 14% din traficul în limba rusă provine de la yandex.ua

Tot în 2007 a fost lansat un proiect cunoscut de toți webmasterii, pe care probabil doar lenesii nu îl folosesc acum

2008

Putem spune că anul acesta sfera de influență a Yandex a crescut atât de mult încât s-a decis deschiderea unei filiale a motorului de căutare în SUA, California. În același timp, s-au făcut adăugări semnificative la algoritmi. În special, au început să fie suportate standardele internaționale Sitemap, MediaRSS etc.. Adică, după cum puteți vedea, domeniile de interes au depășit cu mult RuNet. Motorul de căutare numărul unu pe RuNet a devenit acum site-uri în limba engleză. Înainte de aceasta, problema era că motorul de căutare național nu accepta standardele internaționale și, prin urmare, a existat o problemă cu indexarea site-urilor din burzhunet, dar după actualizarea din 2008, această problemă a fost rezolvată. Și după aceea, logo-ul Yandex a început să fie scris în întregime în rusă.

anul 2009

Anul acesta a fost semnificativ pentru că înainte nu exista o împărțire a căutărilor pe regiuni. Adică, înainte de introducerea acestui algoritm, acesta a fost construit pe principiile uniformității. De exemplu, introduceți interogarea „” în bara de căutare din Moscova și Novosibirsk și obțineți aceleași rezultate. Acum totul s-a schimbat. Iar rezultatele bazate pe principiul geodependenței sunt amestecate în rezultatele căutării. Pentru a spune simplu, dacă căutați folosind Yandex în Moscova și Novosibirsk, rezultatele vor fi diferite.

În 2009 s-au continuat lucrările în direcția de vest aleasă anterior. În special, a fost testat un serviciu care a fost folosit pentru a traduce site-uri străine. Apoi, acest serviciu a evoluat, iar în 2011 a devenit cunoscut sub numele de Yandex.Translation.

Un eveniment la fel de important a fost introducerea unei noi metode de învățare automată - Matrixnet. Această tehnologie folosește diverse modele ca evaluare și ia în considerare diverși factori de clasare. Dar principalul lucru este că tehnologia este de auto-învățare. La evaluarea evaluatorilor, sunt evaluate doar modele reale, iar descoperirea celor inexistente este complet exclusă.

Natura revoluționară a acestei tehnologii constă în faptul că Matrixnet folosește o formulă de clasare incredibil de complexă, care ia în considerare un număr mare de factori. Acest lucru, pe de o parte, vă permite să obțineți rezultate de căutare mai bune, dar, pe de altă parte, nu va permite webmasterilor să înțeleagă acest model și, prin urmare, să îl influențeze în propriile interese.

Mai multe detalii despre tehnologia matrixnet:

2010

Vechiul birou de pe strada Samokatnaya este de domeniul trecutului, iar întreaga companie s-a mutat în conace noi. De fapt, acesta a devenit principalul eveniment al anului 2010





1. Termeni și definiții În acest acord privind prelucrarea datelor cu caracter personal (denumit în continuare Acordul), termenii de mai jos au următoarele definiții: Operator - Antreprenor Individual Oleg Aleksandrovich Dneprovsky. Acceptarea Acordului - acceptarea deplină și necondiționată a tuturor termenilor Acordului prin trimiterea și prelucrarea datelor cu caracter personal. Date personale – informații introduse de Utilizator (subiect al datelor personale) pe site și legate direct sau indirect de acest Utilizator. Utilizator - orice persoană fizică sau juridică care a finalizat cu succes procedura de completare a câmpurilor de introducere pe site. Completarea câmpurilor de introducere - procedura prin care Utilizatorul își trimite numele, prenumele, numărul de telefon, adresa personală E-mail(denumite în continuare Date Personale) către baza de date a utilizatorilor înregistrați ai site-ului, produsă în scopul identificării Utilizatorului. Ca urmare a completării câmpurilor de introducere, datele personale sunt trimise în baza de date a Operatorului. Completarea câmpurilor de introducere este voluntară. site web - un site web situat pe Internet și format dintr-o pagină. 2. Dispoziții generale 2.1. Acest acord a fost întocmit pe baza cerințelor Legii federale nr. 152-FZ din 27 iulie 2006 „Cu privire la datele cu caracter personal” și a prevederilor articolului 13.11 privind „Încălcarea legii”. Federația Rusă în domeniul datelor cu caracter personal” din Codul de Infracțiuni Administrative al Federației Ruse și se aplică tuturor datelor personale pe care Operatorul le poate obține despre Utilizator în timpul utilizării Site-ului. 2.2. Completarea câmpurilor de introducere de către Utilizator pe Site înseamnă acordul necondiționat al Utilizatorului cu toți termenii acestui Acord (Acceptarea Acordului). În caz de dezacord cu aceste condiții, Utilizatorul nu completează câmpurile de introducere de pe Site. 2.3. Consimțământul Utilizatorului pentru furnizarea de date cu caracter personal către Operator și prelucrarea acestora de către Operator este valabil până la încetarea activităților Operatorului sau până când Utilizatorul își retrage consimțământul. Prin acceptarea acestui Acord și parcurgerea procedurii de Înregistrare, precum și prin accesarea ulterioară a Site-ului, Utilizatorul confirmă că, acționând din proprie voință și în interes propriu, își transferă datele personale pentru prelucrare către Operator și este de acord să prelucrarea acestora. Utilizatorul este informat că prelucrarea datelor sale personale va fi efectuată de către Operator în baza Legii federale din 27 iulie 2006 nr. 152-FZ „Cu privire la datele cu caracter personal”. 3. Lista datelor personale și alte informații despre utilizator care urmează să fie transferate Operatorului 3.1. Atunci când utilizează Site-ul web al Operatorului, Utilizatorul furnizează următoarele date personale: 3.1.1. Informații personale de încredere pe care Utilizatorul le oferă despre sine în mod independent atunci când completează câmpurile de introducere și/sau în procesul de utilizare a serviciilor Site-ului, inclusiv nume, prenume, patronimic, număr de telefon (de acasă sau mobil), adresa de e-mail personală. 3.1.2. Date care sunt transferate automat către serviciile Site-ului în timpul utilizării lor folosind software-ul instalat pe dispozitivul Utilizatorului, inclusiv adresa IP, informații din Cookie-uri, informații despre browserul Utilizatorului (sau alt program prin care sunt accesate serviciile). 3.2. Operatorul nu verifică acuratețea datelor cu caracter personal furnizate de Utilizator. În acest caz, Operatorul presupune că Utilizatorul furnizează informații personale de încredere și suficiente cu privire la întrebările propuse în Câmpurile de introducere. 4. Scopuri, reguli de colectare și utilizare a datelor cu caracter personal 4.1. Operatorul prelucrează datele personale care sunt necesare pentru a furniza servicii și pentru a furniza servicii Utilizatorului. 4.2. Datele personale ale Utilizatorului sunt utilizate de către Operator în următoarele scopuri: 4. 2.1. Identificarea utilizatorului; 4.2.2. Furnizarea Utilizatorului de servicii personalizate (precum și informarea despre noile promoții și servicii ale companiei prin trimiterea de scrisori); 4.2.3. Menținerea contactului cu Utilizatorul dacă este necesar, inclusiv trimiterea de notificări, solicitări și informații legate de utilizarea serviciilor, furnizarea de servicii, precum și procesarea cererilor și aplicațiilor de la Utilizator; 4.3. In timpul prelucrarii datelor cu caracter personal se vor efectua urmatoarele actiuni: colectare, inregistrare, sistematizare, acumulare, stocare, clarificare (actualizare, modificare), extragere, utilizare, blocare, stergere, distrugere. 4.4. Utilizatorul nu obiectează că informațiile specificate de el în anumite cazuri pot fi furnizate organismelor de stat autorizate ale Federației Ruse în conformitate cu legislația actuală a Federației Ruse. 4.5. Datele personale ale Utilizatorului sunt stocate și prelucrate de Operator în modul prevăzut în prezentul Acord pe întreaga perioadă de activitate a Operatorului. 4.6. Prelucrarea datelor cu caracter personal se realizează de către Operator prin menținerea bazelor de date, prin metode automate, mecanice și manuale. 4.7. Site-ul folosește Cookie-uri și alte tehnologii pentru a urmări utilizarea serviciilor Site-ului. Aceste date sunt necesare pentru a optimiza funcționarea tehnică a Site-ului și pentru a îmbunătăți calitatea furnizării serviciilor. Site-ul înregistrează automat informații (inclusiv adresa URL, adresa IP, tipul browserului, limba, data și ora solicitării) despre fiecare vizitator al Site-ului. Utilizatorul are dreptul de a refuza furnizarea de date personale atunci când vizitează Site-ul sau de a dezactiva Cookie-urile, dar în acest caz, este posibil ca nu toate funcțiile Site-ului să funcționeze corect. 4.8. Condițiile de confidențialitate prevăzute în prezentul Acord se aplică tuturor informațiilor pe care Operatorul le poate obține despre Utilizator în timpul șederii acestuia din urmă pe Site și utilizării Site-ului. 4.9. Informațiile care sunt dezvăluite public în timpul executării prezentului Acord, precum și informațiile care pot fi obținute de părți sau terți din surse la care orice persoană are acces liber, nu sunt confidențiale. 4.10. Operatorul ia toate măsurile necesare pentru a proteja confidențialitatea datelor personale ale Utilizatorului împotriva accesului, modificării, dezvăluirii sau distrugerii neautorizate, inclusiv: asigurarea verificării interne constante a proceselor de colectare, stocare și prelucrare a datelor și asigurarea securității; asigură securitatea fizică a datelor, împiedicând accesul neautorizat la sistemele tehnice care asigură funcționarea Site-ului, în care Operatorul stochează date cu caracter personal; oferă acces la datele cu caracter personal doar acelor angajați ai Operatorului sau persoanelor autorizate care au nevoie de aceste informații pentru a îndeplini sarcini legate direct de furnizarea de servicii către Utilizator, precum și de funcționarea, dezvoltarea și îmbunătățirea Site-ului. 4.11. Datele personale ale Utilizatorului rămân confidențiale, cu excepția cazurilor în care Utilizatorul furnizează în mod voluntar informații despre sine pentru acces general la un număr nelimitat de persoane. 4.12. Transferul de către Operator al datelor cu caracter personal ale Utilizatorului este legal în perioada reorganizării Operatorului și transferul drepturilor succesorului legal al Operatorului, în timp ce toate obligațiile de a respecta termenii prezentului Acord în legătură cu informațiile personale primite de acesta sunt transferat succesorului legal. 4.13. Această Declarație se aplică numai site-ului web al Operatorului. Compania nu controlează și nu este responsabilă pentru site-urile (serviciile) terților pe care utilizatorul le poate accesa prin link-uri disponibile pe site-ul web al Operatorului, inclusiv în rezultatele căutării. Pe astfel de Site-uri (servicii), alte informații personale pot fi colectate sau solicitate de la utilizator și pot fi efectuate și alte acțiuni 5. Drepturile utilizatorului ca subiect al datelor cu caracter personal, modificarea și ștergerea datelor cu caracter personal de către utilizator 5.1. Utilizatorul are dreptul: 5.1.2. Solicitați Operatorului să își clarifice datele cu caracter personal, să le blocheze sau să le distrugă dacă datele cu caracter personal sunt incomplete, depășite, inexacte, obținute ilegal sau nu sunt necesare pentru scopul declarat al prelucrării și, de asemenea, să ia măsurile prevăzute de lege pentru a-și proteja drepturile. 5.1.3. Primește informații cu privire la prelucrarea datelor sale cu caracter personal, inclusiv informații care conțin: 5.1.3.1. confirmarea faptului prelucrării datelor cu caracter personal de către Operator; 5.1.3.2. scopurile și metodele de prelucrare a datelor cu caracter personal utilizate de operator; 5.1.3.3. numele și locația Operatorului; 5.1.3.4. datele cu caracter personal prelucrate referitoare la subiectul relevant al datelor cu caracter personal, sursa primirii acestora, cu excepția cazului în care legea federală prevede o procedură diferită de prezentare a acestor date; 5.1.3.5. termenii de prelucrare a datelor cu caracter personal, inclusiv perioadele de stocare a acestora; 5.1.3.6. alte informații prevăzute de legislația actuală a Federației Ruse. 5.2. Retragerea consimțământului pentru prelucrarea datelor cu caracter personal poate fi efectuată de către Utilizator prin transmiterea Operatorului unei notificări scrise adecvate (tipărite pe un suport tangibil și semnate de Utilizator). 6. Responsabilitățile Operatorului. Accesul la datele personale 6.1. Operatorul se angajează să asigure prevenirea accesului neautorizat și nedirecționat la datele personale ale Utilizatorilor Site-ului Operatorului. În acest caz, accesul autorizat și direcționat la datele personale ale Utilizatorilor Site-ului va fi considerat acces la acestea de către toate părțile interesate, implementat în cadrul obiectivelor și subiectului Site-ului Operatorului. În același timp, Operatorul nu este responsabil pentru posibila utilizare abuzivă a datelor cu caracter personal ale Utilizatorilor care apare ca urmare a: problemelor tehnice în software și în hardware și rețele aflate în afara controlului Operatorului; în legătură cu utilizarea intenționată sau neintenționată a Site-urilor Operatorului care nu este în conformitate cu acestea scop direct terțe părți; 6.2 Operatorul ia măsurile organizatorice și tehnice necesare și suficiente pentru a proteja informațiile personale ale utilizatorului împotriva accesului neautorizat sau accidental, distrugerii, modificării, blocării, copierii, distribuirii, precum și împotriva altor acțiuni ilegale ale terților cu acestea. 7. Modificări ale Politicii de confidențialitate. Legislația aplicabilă 7.1. Operatorul are dreptul de a aduce modificări prezentului Regulament fără nicio notificare specială pentru Utilizatori. Când se fac modificări la ediția curentă, este indicată data Ultima actualizare. Noua ediție a Regulamentului intră în vigoare din momentul publicării sale, cu excepția cazului în care noua ediție a Regulamentului prevede altfel. 7.2. Legea Federației Ruse se aplică prezentului Regulament și relației dintre Utilizator și Operator care decurge în legătură cu aplicarea Regulamentului. Accept nu accept

Nu suntem atât de unici pe cât credem: milioane de oameni dinaintea noastră au nedumerit și milioane după noi vor deruta motorul de căutare cu întrebări aproape identice. Pe de altă parte, suntem prea imprevizibili: formularea cererii noastre este influențată de un număr imens de factori de care nu suntem conștienți. Și cel puțin din acest motiv, cererea fiecăruia dintre noi, oricât de banală ar fi, necesită o abordare individuală.

De fapt, întreaga activitate a motorului de căutare Yandex se rezumă la două lucruri simple: să înțeleagă ceea ce o persoană dorește cu adevărat să știe și, în câteva secunde, să le găsească pe cele potrivite printre miliardele de documente de pe Internet.

Luați amprentele digitale

Sistemul de operare al motorului de căutare este oarecum similar cu Matrix, iar robotul de căutare (programul complex, independent de luare a deciziilor pe care l-a creat) este similar cu Agentul Smith.

Pentru a nu căuta în întregul Internet de fiecare dată când cineva trebuie să știe ceva, motorul de căutare face o parte din muncă în avans - verifică ce este pe Web și unde se află, folosind mii de roboți de căutare. Sunt de două tipuri: de bază și rapide. Principalul accesează cu crawlere și procesează Internetul în întregime, iar cel rapid - documente care au apărut acum un minut sau chiar câteva secunde. Sarcina programelor roboți este să selecteze informații adecvate și utile pentru utilizatori, să le proceseze, eliminând tot ce este învechit și inutil. Într-un fel, acest lucru amintește de sortarea gunoiului: hârtie într-un recipient, sticlă în altul, plastic într-un al treilea, deșeuri alimentare într-un al patrulea...

Informațiile colectate de roboți formează așa-numita distribuție Internet. Este stocat pe mii de servere Yandex și este actualizat în mod constant. O pepită este ca o listă care vă spune unde să găsiți ce informații. În această listă, fiecare cuvânt cheie are nu una, ci milioane de „pagini”. Pentru a vă asigura că toate actualizările nugget sunt disponibile pentru utilizatori, acestea sunt mutate din depozit în „căutarea de bază”. Datele de la robotul principal sunt transferate la fiecare câteva zile, iar de la robotul rapid - în timp real.

Aduceți la apă curată



ILUSTRARE: EVGENY TONKONOGY

În timp ce caută răspunsul la o întrebare dată într-o bază de date pregătită, mașina se confruntă cu două dificultăți principale. Prima dificultate este limbajul. Înainte de a căuta un răspuns la o întrebare, este important ca aparatul să înțeleagă în ce limbă ar trebui să facă acest lucru. De exemplu, pentru o persoană vorbitoare de limbă rusă, căutarea „Echipă Prințului Igor” va găsi documente cu informații despre armată, iar pentru un ucrainean, „Echipa Prințului Igor” va returna și documente care menționează prințesa Olga, soția sa, deoarece în ucraineană „soția” este „echipă”. Și în limba rusă bogată, același cuvânt sau derivatele sale pot însemna lucruri diferite. De exemplu, cuvântul „oțel” este una dintre formele substantivului „oțel” și verbul „deveni”. A doua dificultate este psihologia umană. Când introducem o solicitare, ne așteptăm la un răspuns rapid și precis, fără a ne îngrijora în mod natural dacă formularea cererii corespunde principiilor analizei matematice prin care funcționează creierul mașinii. De exemplu, introducând cuvântul „Napoleon” în bara de căutare, ce vrea o persoană să obțină: o rețetă de tort sau o biografie a împăratului francez, să cumpere coniac sau să găsească adresa unui spital de psihiatrie?


În astfel de situații intră în joc mai multe tehnologii. Vă puteți oferi mai multe indicii sub bara de căutare care vă vor specifica solicitarea. Ca, alegeți ceea ce aveți nevoie: rețete Napoleon sau Napoleon - Bonaparte. Dacă utilizatorul nu răspunde la cererea mașinii și nu adaugă cuvinte la „Napoleon”, atunci tehnologia „Spectrum” ajută problema: fără a spera în ajutor, mașina caută imediat informații în mai multe categorii (despre tort, şi despre împărat, şi despre cal) ..). În plus, mecanismele de personalizare ajută la înțelegerea utilizatorului - cunoașterea mașinii despre ceea ce căuta acest utilizator pe computerul său cu o zi, două, trei sau luni în urmă: dacă ați adresat adesea întrebări Yandex despre gătit, atunci aparatul va afișa mai întâi rezultate care spun că Napoleon este o prăjitură.

Combinații: cluburi de interese

Sarcina unui motor de căutare nu este doar să selecteze documente care conțin cuvinte și expresii din interogarea de căutare. Aparatul trebuie să înțeleagă ce documente îndeplinesc cerințele noastre conflictuale și de ce le îndeplinesc. Vrem să obținem informații despre tortul Napoleon, sau poate am vizitat de câțiva ani un club de fitness cu nume pretențios, sau chiar suntem complet preocupați de complexele de oameni scunzi. În orice caz, rezolvarea problemei necesită o abordare non-trivială.


Creatorii programului de căutare Yandex au găsit această abordare delegând dreptul de alegere mașinii. Pe de o parte, o mașină fără suflet, dar foarte rapidă și inteligentă nu știe și nu vrea să știe nimic despre noi ca indivizi și, pe de altă parte, încearcă să afle cât mai multe despre toată lumea.

in afara de asta locație geografică utilizator și analiză lingvistică a interogărilor sale, motorul de căutare folosește câteva mii de criterii care nu sunt deloc evidente pentru oameni.

Trucul este că mașina dezvoltă și actualizează aceste criterii în mod independent.

Pur și simplu folosește date despre preferințele și comportamentul utilizatorilor a milioane de oameni și leagă această „medie aritmetică” cu istoricul interogărilor noastre. Principiile care ghidează Matrix în sine, comparând miile de categorii de interese ale utilizatorilor pe care le-a dezvoltat, adesea nu se încadrează în ideile umane tradiționale despre ce pot fi „interesele” în principiu. Sunt zeci de mii. Ele creează combinații diferite, uneori amuzante, între ele. De exemplu, una dintre aceste combinații ar putea fi aceea că rezultatele căutării se potrivesc cu interesele unei persoane care cresc tritoni. În același timp, o persoană nu este interesată doar de tritoni, ci îi crește deja, ci doar pentru primul an.

Evaluări. Mâinile de ajutor


Matricea, desigur, decide singură (cu ajutorul matematicii superioare) ce și în ce secvență trebuie arătată utilizatorilor pe baza a zeci de mii de criterii. Dar Matrix folosește și oameni vii - 1000 de angajați Yandex, așa-numiții evaluatori, evaluează rezultatele căutării pentru o anumită cerere (desigur, nu fiecare cerere este evaluată, iar acest lucru nu se face în timp real) pentru a determina dacă îndeplinesc cerințele. așteptările unui utilizator obișnuit: nu la fel de raționale ca o mașină, nu la fel de precise în formulare, contradictorii și emoționale.

Bună ziua, dragi cititori ai blogului meu SEO. . Acest articol este despre cum funcționează motorul de căutare Yandex ce tehnologii și algoritmi folosește pentru a clasifica site-urile și ce face pentru a pregăti un răspuns pentru utilizatori. Mulți oameni știu că acest flagship al căutării rusești dă tonul în Runet, deține cea mai mare bază de date din Eurasia, gestionează conținutul a peste un miliard de pagini și cunoaște răspunsul la orice întrebare. Conform datelor Liveinternet pentru august 2012, cota Yandex în Rusia este de 60,5%. Audiența lunară a portalului este de 48,9 milioane de oameni. Dar cel mai important lucru pentru noi, bloggerii, este modul în care motorul de căutare primește cererile noastre, cum le procesează și care este rezultatul ca rezultat. Pe de o parte, cunoașterea și înțelegerea acestor informații ne face mai ușor să folosim toate resursele Yandex; pe de altă parte, este mai ușor să ne promovăm blogurile. Prin urmare, îmi propun să privim împreună cu mine cele mai importante tehnologii ale celui mai bun motor de căutare Runet.

Când un utilizator de internet dorește pentru prima dată să apeleze la un motor de căutare pentru informații, el poate avea o întrebare: „Cum funcționează căutarea?” Dar când o primește, această întrebare se schimbă adesea în alta: „De ce atât de repede?” Și într-adevăr, de ce căutarea unui fișier pe un computer durează 20 de secunde, iar rezultatul unei solicitări de la o întreagă rețea de computere din întreaga lume apare într-o secundă? Cel mai interesant lucru este că primele două întrebări (cum are loc căutarea și de ce 1 secundă) pot primi răspuns într-un singur răspuns - motorul de căutare s-a pregătit în avans pentru solicitarea utilizatorului.

Pentru a înțelege principiul de funcționare a lui Yandex, ca și alte motoare de căutare, să facem o analogie cu un director telefonic. Pentru a găsi orice număr de telefon, trebuie să cunoașteți numele de familie al abonatului, iar orice căutare în acest caz durează maximum un minut, deoarece toate paginile directorului sunt un index alfabetic continuu. Dar imaginați-vă dacă căutarea a fost efectuată folosind o altă opțiune, în care numerele de telefon au fost ordonate după numerele în sine. După astfel de căutări, care se vor întinde mai mult timp, numerele vor rămâne în fața ochilor celui care caută o perioadă foarte lungă de timp. 🙂

La fel, motorul de căutare afișează toate informațiile de pe Internet într-o formă convenabilă pentru acesta. Și cel mai important, toate aceste date sunt plasate în directorul ei în avans, înainte ca vizitatorul să sosească cu cererile sale. Adică, atunci când punem o întrebare Yandex, acesta știe deja răspunsul nostru. Și ni-l oferă într-o secundă. Dar această secundă include o serie de procese importante, pe care acum le vom analiza în detaliu.

Indexarea Internetului

Yandex ru colectează toate informațiile pe care le poate pune mâna pe internet. Folosind echipamente speciale, tot conținutul este revizuit, inclusiv imaginile bazate pe parametri vizuali. Motorul de căutare este angajat într-o astfel de colectare, iar procesul de colectare și pregătire a datelor se numește indexare. Baza unei astfel de mașini este un sistem informatic, care altfel se numește robot de căutare. Acesta accesează cu crawlere în mod regulat site-urile indexate, le verifică pentru conținut nou și, de asemenea, scanează Internetul pentru pagini șterse. Dacă descoperă că o astfel de pagină nu mai există sau este închisă de la indexare, o elimină din căutare.

Cum găsește un robot de căutare site-uri noi? În primul rând, mulțumim link-urilor de pe alte site-uri. Pentru că dacă un link este plasat pe o nouă resursă web de pe un site deja indexat, atunci data viitoare când îl vei vizita pe al doilea, robotul îl va vizita pe primul. În al doilea rând, există un serviciu minunat, numit popular „addurilka” (din expresia în Limba engleză-addurl - adăugați o adresă). În el puteți introduce adresa noului dvs. site, care va fi vizitat de un robot de căutare după un timp. În al treilea rând, cu ajutorul unui program special „Yandex.Bar”, vizitele utilizatorilor care îl folosesc sunt urmărite. În consecință, dacă o persoană ajunge pe o nouă resursă web, un robot va apărea în curând acolo.

Sunt toate paginile incluse în căutare? Milioane de pagini sunt indexate în fiecare zi. Printre acestea se numără pagini de diferite calități, care pot conține informații diferite - de la conținut unic până la gunoi complet. În plus, după cum spun statisticile, există mult mai mult gunoi pe Internet. Robotul de căutare analizează fiecare document folosind algoritmi speciali. El determină dacă are vreunul informatii utile dacă poate răspunde solicitării utilizatorului. Dacă nu, atunci astfel de pagini nu sunt acceptate ca „cosmonauți”, dar dacă da, atunci sunt incluse în căutare.

După ce un robot a vizitat o pagină și a determinat utilitatea acesteia, aceasta apare în stocarea motorului de căutare. Aici analizăm orice document până la elementele de bază, așa cum spun maeștrii centrelor auto - până la roți. Pagina este ștearsă de markup html, textul curat este supus unui inventar complet - locația fiecărui cuvânt este calculată. În această formă dezasamblată, pagina se transformă într-un tabel cu cifre și litere, care altfel se numește index. Acum, indiferent de ce se întâmplă cu resursa web care conține această pagină, cea mai recentă copie a acesteia este întotdeauna disponibilă în căutare. Chiar dacă site-ul nu mai există, copii ale documentelor sale sunt stocate pe Internet de ceva timp.

Fiecare index, împreună cu datele despre tipurile de documente, codificare, limbă, împreună cu copiile, constituie baza de date de cautare . Este actualizat periodic, deci se află pe servere speciale cu ajutorul cărora sunt procesate solicitările de la utilizatorii motoarelor de căutare.

Cât de des are loc procesul de indexare? În primul rând, depinde de tipurile de site-uri. Primul tip de resursă web modifică foarte des conținutul paginilor sale. Adică, atunci când un robot de căutare ajunge la aceste pagini de fiecare dată, acestea conțin conținut diferit de fiecare dată. Data viitoare nu veți putea găsi nimic folosindu-le, așa că astfel de site-uri nu sunt incluse în index. Al doilea tip de site este un depozit de date, pe paginile căruia se adaugă periodic link-uri către documente pentru descărcare. Conținutul unui astfel de site de obicei nu se schimbă, așa că robotul îl vizitează extrem de rar. Alte site-uri depind de frecvența actualizării materialului. Aceasta înseamnă următoarele: cu cât apare mai rapid conținut nou pe site, cu atât mai des apare robotul de căutare. Și se acordă prioritate în primul rând celor mai importante resurse web (un site de știri este cu un ordin de mărime mai important decât orice blog, de exemplu).

Indexarea vă permite să îndepliniți prima funcție a unui motor de căutare - colectarea de informații pe pagini noi de pe Internet. Dar Yandex are și o a doua funcție - căutarea unui răspuns la solicitarea unui utilizator într-o bază de date de căutare deja pregătită.

Yandex pregătește un răspuns

Procesul de procesare a cererii și emiterea de răspunsuri relevante este gestionat de sistem informatic "Metasearch" . Pentru activitatea sa, mai întâi colectează toate informațiile de intrare: din ce regiune a fost făcută cererea, din ce clasă aparține, dacă există erori în cerere etc. După o astfel de procesare, metasearch verifică dacă există exact aceleași interogări cu aceiași parametri în baza de date. Dacă răspunsul este da, atunci sistemul arată utilizatorului rezultatele salvate anterior. Dacă o astfel de întrebare nu există în baza de date, metacăutarea se adresează bazei de date de căutare care conține datele indexului.

Și aici se întâmplă lucruri uimitoare. Imaginați-vă că există un computer super-puternic care stochează întregul Internet procesat de roboții de căutare. Utilizatorul setează o interogare și începe o căutare în celulele de memorie pentru toate documentele implicate în interogare. Răspunsul a fost găsit și toată lumea este fericită. Dar să luăm un alt caz când există o mulțime de cereri care conțin aceleași cuvinte în corpul lor. Sistemul trebuie să treacă prin aceleași celule de memorie de fiecare dată, ceea ce poate crește semnificativ timpul necesar procesării datelor. În consecință, timpul crește, ceea ce poate duce la pierderea utilizatorului - acesta va apela la un alt motor de căutare pentru ajutor.

Pentru a evita astfel de întârzieri, toate copiile din indexul site-ului sunt distribuite pe diferite computere. După transmiterea cererii, metasearch instruiește astfel de servere să caute fragmentul lor de text. După care, toate datele de la aceste mașini sunt returnate la computerul central, acesta combină toate rezultatele obținute și oferă utilizatorului primele zece cele mai bune răspunsuri. Cu această tehnologie, două păsări sunt ucise simultan: timpul de căutare este redus de mai multe ori (răspunsul se obține într-o fracțiune de secundă) și, datorită creșterii platformelor, informațiile sunt duplicate (datele nu se pierd din cauza defecțiunilor bruște) . Calculatoarele în sine cu informații duplicate formează un centru de date - aceasta este o cameră cu servere.

Când un utilizator de motor de căutare solicită o interogare, de 20 de ori din 100, obiectivele întrebării sunt ambigue. De exemplu, dacă scrie cuvântul „Napoleon” în bara de căutare, atunci nu se știe încă ce răspuns așteaptă - o rețetă de tort sau o biografie a marelui comandant. Sau expresia „Frații Grimm” - basme, filme, grup muzical. Pentru a restrânge o astfel de gamă posibilă de obiective la răspunsuri specifice, Yandex are o tehnologie specială Gamă. Ia în considerare nevoile utilizatorilor folosind statisticile privind interogările de căutare. Dintre toate întrebările adresate în Yandex de către vizitatori, Spectrum identifică diverse obiecte în ele (nume de persoane, titluri de cărți, modele de mașini etc.) Aceste obiecte sunt distribuite în anumite categorii. În prezent există peste 60 de astfel de categorii. Cu ajutorul lor, motorul de căutare are în baza de date sensuri diferite cuvintele din interogările utilizatorilor. Interesant este că aceste categorii sunt verificate periodic (analiza are loc de câteva ori pe săptămână), ceea ce permite Yandex să ofere mai precis răspunsuri la întrebările puse.

Pe baza tehnologiei Spectrum, Yandex a organizat solicitări de dialog. Acestea apar sub bara de căutare în care utilizatorul introduce interogarea ambiguă. Acest rând reflectă categoriile cărora le poate aparține subiectul întrebării. Rezultatele viitoare ale căutării depind de alegerea utilizatorului pentru această categorie.

De la 15 la 30% din toți utilizatorii motorului de căutare Yandex doresc să primească doar informații locale (date din regiunea în care locuiesc). De exemplu, despre filme noi în cinematografele din orașul tău. Prin urmare, răspunsul la o astfel de solicitare ar trebui să fie diferit pentru fiecare regiune. În acest sens, Yandex își folosește tehnologia căutare bazată pe regiuni . De exemplu, acestea sunt răspunsurile pe care le pot primi rezidenții care caută un repertoriu de filme în cinematograful lor Oktyabr:

Dar acesta este rezultatul pe care locuitorii orașului Stavropol îl vor primi pentru aceeași cerere:

Regiunea utilizatorului este determinată în primul rând de adresa sa IP. Uneori, aceste date nu sunt exacte, deoarece un număr de furnizori pot lucra în mai multe regiuni simultan și, prin urmare, pot schimba adresele IP ale utilizatorilor lor. În principiu, dacă vi se întâmplă acest lucru, vă puteți schimba cu ușurință regiunea în setările din motorul de căutare. Este listat în colțul din dreapta sus al paginii de rezultate. Îl poți schimba.

Motor de căutare Yandex ru - rezultate de răspuns

Când Metasearch a pregătit un răspuns, motorul de căutare Yandex ar trebui să îl afișeze pe pagina de rezultate. Este o listă de link-uri către documente găsite cu câteva informații despre fiecare. Sarcina tehnologiei de emitere a rezultatelor este de a oferi utilizatorului cele mai relevante răspunsuri în cel mai informativ mod. Șablonul pentru un astfel de link arată astfel:

Să ne uităm la această formă de rezultat mai detaliat. Pentru titlul rezultatului căutării Yandex folosește adesea numele titlului paginii (ceea ce optimizatorii scriu în eticheta de titlu). Dacă nu este acolo, atunci cuvintele din titlul articolului sau postării apar aici. Dacă textul titlului este mare, motorul de căutare plasează în acest câmp fragmentul care este cel mai relevant pentru interogarea dată.

Foarte rar, dar se întâmplă ca titlul să nu se potrivească cu conținutul cererii. În acest caz, Yandex își formează titlul rezultatului căutării folosind textul din articol sau postare. Cu siguranță va avea cuvinte de interogare.

Pentru fragment motorul de căutare folosește tot textul de pe pagină. Selectează toate fragmentele în care este prezent răspunsul la interogare, apoi îl selectează pe cel mai relevant și inserează link-uri către document în câmpul formularului. Datorită acestei abordări, un optimizator competent îl poate reface după ce a văzut un fragment, îmbunătățind astfel atractivitatea conexiunii.

Pentru percepție mai bună rezultat al cererii utilizatorului, titlurile sunt formatate ca link-uri în text (evidențiate cu albastru cu subliniere). Pentru a face resursa web atractivă și recunoscută, se adaugă o favicon - o mică pictogramă corporativă a site-ului. Apare în stânga textului pe primul rând înainte de titlu. Toate cuvintele care au fost incluse în cerere în răspuns sunt, de asemenea, evidențiate cu caractere aldine pentru a ușura percepția.

Recent, motorul de căutare Yandex a adăugat diverse informații la fragment, care vor ajuta utilizatorul să-și găsească răspunsul și mai rapid și mai precis. De exemplu, dacă un utilizator scrie numele unei organizații în cererea sa, atunci Yandex va adăuga adresa, numerele de contact și un link către locația din hărțile geografice în fragment. Dacă motorul de căutare este familiarizat cu structura site-ului, care conține un document cu un răspuns pentru utilizator, îl va afișa cu siguranță. În plus, Yandex poate adăuga imediat cele mai vizitate pagini ale unei astfel de resurse web la fragment, astfel încât, dacă dorește, vizitatorul să poată merge imediat la secțiunea de care are nevoie, economisindu-și timpul.

Există fragmente care conțin prețul unui produs pentru un magazin online, o evaluare a unui hotel sau restaurant sub formă de stele și alte informații interesante cu diverse numere despre obiectele din documentele de căutare. Scopul unei astfel de informații este de a oferi lista plina date despre acele articole sau obiecte care sunt de interes pentru utilizator.

În general, deja de la diverse exemple Pagina de răspuns va arăta astfel:

Clasament și evaluatori

Sarcina lui Yandex include nu numai căutarea tuturor opțiuni posibile răspuns, dar și selecția celor mai bune (relevante). La urma urmei, utilizatorul nu va scotoci prin toate linkurile pe care Yandex i le va furniza ca rezultat al căutării. Procesul de organizare a rezultatelor căutării se numește clasament . Adică clasamentul este cel care determină calitatea răspunsurilor propuse.

Există reguli după care Yandex determină paginile relevante:

  • Site-urile care degradează calitatea căutării vor fi retrogradate în pozițiile din pagina cu rezultate. De obicei, acestea sunt resurse web ai căror proprietari încearcă să înșele motorul de căutare. De exemplu, acestea sunt site-uri cu pagini care conțin text fără sens sau invizibil. Desigur, este vizibil și de înțeles pentru un robot de căutare, dar nu pentru un vizitator care citește acest document. Sau site-uri care, atunci când dau clic pe un link din zona rezultatelor căutării, transferă imediat utilizatorul pe un site complet diferit.
  • Site-urile care conțin conținut erotic nu sunt incluse în rezultate sau sunt mult reduse în clasament. Acest lucru se datorează faptului că astfel de resurse web folosesc adesea metode de promovare agresive.
  • Site-urile infectate cu viruși nu sunt reduse în rezultatele căutării și nu sunt excluse din rezultatele căutării - în acest caz, utilizatorul este informat despre pericol folosind o pictogramă specială. Acest lucru se datorează faptului că Yandex presupune că astfel de resurse web pot conține documente importante la cererea unui vizitator al motorului de căutare.

De exemplu, acesta este modul în care Yandex va clasifica site-urile pentru interogarea „măr”:

Pe lângă factorii de clasare, Yandex folosește mostre speciale cu întrebări și răspunsuri pe care utilizatorii motoarelor de căutare le consideră cele mai potrivite. Nicio mașină nu poate face astfel de mostre în acest moment - aceasta este prerogativa omului. În Yandex, sunt chemați astfel de specialiști evaluatori. Sarcina lor este să analizeze complet toate documentele de căutare și să evalueze răspunsurile la întrebările specificate. Ei selectează cele mai bune răspunsuri și creează un set special de antrenament. În acesta, motorul de căutare vede relația dintre paginile relevante și proprietățile acestora. Având astfel de informații, Yandex poate selecta formula optimă de clasare pentru fiecare solicitare. Metoda de construire a unei astfel de formule se numește Matrixnet. Avantajul acestui sistem este că este rezistent la supraajustare, ceea ce vă permite să luați în considerare un număr mare de factori de clasare fără a crește numărul de evaluări și modele inutile.

La sfârșitul postării mele, vreau să vă arăt statistici interesante colectate de motorul de căutare Yandex în procesul de lucru.

1. Popularitatea numelor personale în Rusia și orașele rusești (date preluate de la bloggeri și conturi de utilizator retele socialeîn martie 2012).

Mare Văzător

În 1863, marele scriitor Jules Verne a creat următoarea sa carte, „Parisul în secolul al XX-lea”. În el, a descris în detaliu metroul, mașina, scaunul electric, computerul și chiar internetul. Cu toate acestea, editorul a refuzat să tipărească cartea și a rămas acolo timp de mai bine de 120 de ani, până când a fost găsită de strănepotul lui Jules Verne în 1989. Cartea a fost publicată în 1994.

În acest articol, voi vorbi despre ce este motorul de căutare Yandex, cum funcționează acest motor de căutare și voi da exemple de site-uri pe care motorul de căutare Yandex le limitează în clasament.

Motorul de căutare Yandex, în ceea ce privește popularitatea sa, se află pe locul 20 în lume și pe locul 1 în Rusia. Oficial, compania Yandex a fost aprobată în 1997 pe 23 septembrie, dezvoltarea sa a început în cadrul companiei Comp Tek International și deja în 2000 Yandex a început să existe ca o companie separată.

Fondatorii companiei sunt Volozh Arkady Yurievich, care este directorul general, și Segalovici Ilya Valentinovich (1964-2013), fondatorul Yandex și director de tehnologie și dezvoltare. Am aflat puțin despre istoria Yandex, acum să vorbim despre motorul său de căutare.

Și astfel, direcția principală a companiei Yandex este un motor de căutare, a cărui caracteristică distinctivă este reglarea fină a interogării de căutare. Motorul de căutare Yandex vă permite să căutați interogarea aleasă în rusă, ucraineană, belarusă, tătără, kazahă, engleză, turcă, germană și franceză, ținând cont de ortografia lor morfologică.

Yandex a dezvoltat, de asemenea, un algoritm amănunțit pentru evaluarea relevanței și a principiului verificării documentelor cu excluderea copiilor lor în diferite codificări. Spre deosebire de Google, mai exact din algoritmul său de clasare PR - PageRank, altul punct important pentru motorul de căutare Yandex, este introducerea unui index tematic de citare - TIC.

Lucrarea motorului de căutare Yandex

http://www.yandex.ru
Motorul de căutare Yandex are roboți, care sunt un program specific pentru verificarea relevanței site-urilor. Roboții de căutare merg pe site prin link-uri directe, indexând pagini noi și salvându-le în baza lor de date. Pentru ca o pagină indexată a unui site să ajungă în TOP, ceea ce este foarte important, este necesar să țineți cont de probleme de indexare precum frecvența cuvintelor cheie pe pagină, numărul de link-uri externe care duc la site-ul dvs. și greutatea totală a site-ului, care este măsurată de un indicator precum Yandex TIC.

Un exemplu de site-uri pe care sistemul Yandex le limitează în clasament

Site-uri cu conținut neunic care a fost copiat sau rescris de pe alte site-uri.

Site-uri care se leagă intens între ele în grupuri.

Site-uri cu conținut lipsit de sens.

Site-uri care folosesc tehnologie înșelătoare.

Forumuri și panouri de mesaje care conțin o mulțime de link-uri spam.

Site-uri care încearcă să câștige relevanță prin plasarea de link-uri externe care nu sunt o invitație din partea autorului de a-și vizita resursa.