ინტერნეტ საძიებო სისტემები: Yandex, Google, Rambler, Yahoo. საწყობი, ფუნქციები, მუშაობის პრინციპი. კონკრეტულად რას აკეთებს საძიებო სისტემა? 1 მოკლედ რა უნდა გავიგოთ ხმის სისტემის შესახებ

გოლოვნა / Google Play

გამარჯობა, ბლოგის საიტის თანამემამულე მკითხველებო. თუ თქვენ ხართ დაკავებული, სხვაგვარად ერთი შეხედვით, ხმის ოპტიმიზაციით, როგორც პროფესიონალურ დონეზე (კომერციული პროექტების გაყიდვა გროშებით), ასევე სამოყვარულო დონეზე (), თქვენ აუცილებლად შეძლებთ ამას, რაც აუცილებელია. მნიშვნელოვანია იცოდეთ ზოგადად მუშაობის პრინციპები საკუთარი ან სხვისი საიტის წარმატებით ოპტიმიზაციის მიზნით.

მტრები, როგორც ჩანს, პირადად უნდა ვიცოდეთ, თუმცა, რა თქმა უნდა, სუნი (RuNet-ისთვის და Yandex i-სთვის) საერთოდ არ არიან მტრები ჩვენთვის, არამედ პარტნიორები, რადგან მათი ტრაფიკის ნაწილი უმეტეს შემთხვევაში არის უპირატესი და მთავარი. და, რა თქმა უნდა, დაბრალება და სუნი აღარ ადასტურებს ამ წესს.

რა არის სნაიპი და ხმის სისტემების მუშაობის პრინციპები

მაგრამ აქ თქვენ დაგჭირდებათ დაუყოვნებლივ დაწყება და რა არის სნაიპი, რომელიც ჯერ კიდევ საჭიროა და რატომ არის ეს ასე მნიშვნელოვანი ოპტიმიზატორისთვის? ძიების შედეგები ნაჩვენებია ძიებაში გაგზავნილი დოკუმენტის შემდეგ (რომლის ტექსტი აღებულია უკვე დაწერილიდან):

როგორ snіpet vikoristovuyutsya zazvichiy shmatki ამ დოკუმენტის ტექსტი. დაწკაპუნების იდეალური ვარიანტია ავტორს მისცეს საშუალება, იფიქროს მხარეზე, იმის ნაცვლად, რომ წავიდეს (თორემ ჩვენ მას გადავდებთ, მაგრამ არა ისევ).

ფრაგმენტი ავტომატურად გენერირებულია და ტექსტის ნებისმიერი ფრაგმენტი მონიშნული იქნება ახალ ვერსიაში და, რაც მთავარია, სხვადასხვა კითხვებზე იმავე ვებ გვერდზე იქნება სხვადასხვა ფრაგმენტები.

ასევე მართალია, რომ თავად Description ტეგის ნაცვლად, მისი ძებნა (განსაკუთრებით გუგლში) შესაძლებელია სნიპეტის სახით. რა თქმა უნდა, ის ჯერ კიდევ შემორჩენილია და ამიტომაც ჩნდება რაიმე სახის ვენის სახით.

მაგალითად, აღწერა ტეგის ნაცვლად, შეგიძლიათ აჩვენოთ, მაგალითად, როდესაც ეძებთ საკვანძო სიტყვებს, სიტყვებს, რომლებიც შეიყვანეთ აღწერაში, ან ბოლოს, თუ თავად ალგორითმმა ჯერ არ იცის ტექსტის ფრაგმენტები თქვენს გვერდზე. საიტი ყველა საკვანძო სიტყვისთვის, რომელიც თქვენს გვერდს აკლია, მე ვხედავ Yandex abo Google-ს.

ამიტომ, გთხოვთ, არ წაშალოთ იგი და დაიმახსოვროთ კანის სტატუსის აღწერა ტეგის ნაცვლად. შეგიძლიათ ფულის გამომუშავება WordPress-ით აღწერილობების ვიკორიზირებით (და გირჩევთ, რომ vikorist).

თუ ჯუმლის მოყვარული ხართ, შეგიძლიათ სწრაფად დატკბეთ ამ მასალით.

Ale Snippet არ შეიძლება ამოღებულ იქნეს დაბრუნების ინდექსიდან, რადგან იქ ინფორმაცია ინახება მხოლოდ გვერდზე მოცემულ სიტყვებზე და მათ პოზიციებზე ტექსტში. თავად ღერძი ერთი და იმავე დოკუმენტის ფრაგმენტების შესაქმნელად სხვადასხვა საძიებო სისტემებში (სხვადასხვა მოთხოვნისთვის) არის ჩვენი საყვარელი Yandex და Google, გარდა დაბრუნების ინდექსისა (საჭიროა უშუალოდ საძიებლად - წაიკითხეთ ამის შესახებ ქვემოთ), შეინახეთ პირდაპირი ინდექსი, მაშინ. ვებ გვერდის ასლი.

დოკუმენტის ასლის საფუძვლად შენახვით, თქვენ შეგიძლიათ ხელით ამოჭრათ საჭირო ფრაგმენტები მათგან, ორიგინალიდან შეცვლის გარეშე.

რომ. გამოდის, რომ საძიებო სისტემები ინახავს ვებსაიტის როგორც წინა, ისე უკანა ინდექსს თავიანთ მონაცემთა ბაზაში. სიტყვის დაწყებამდე, ფრაგმენტების ფორმირება შეიძლება შუამავლობდეს ვებ სიუჟეტის ტექსტის ოპტიმიზაციის გზით, რომ ალგორითმი შეარჩევს ტექსტის იმავე ფრაგმენტს, რომელიც თქვენ გაქვთ მხედველობაში. ამაზე სხვა სტატიაში ვისაუბრებთ.

როგორ ვიმოქმედოთ საძიებო სისტემებით

ოპტიმიზაციის არსი არის საძიებო სისტემის ალგორითმების „დახმარება“, რათა თქვენს მიერ მონახულებული საიტების გვერდები მაქსიმალურად მაღალ პოზიციაზე აიწიოს ამ და სხვა მოთხოვნების თვალსაზრისით.

მე ავიღე სიტყვა "დახმარება" წინა წინადადებიდან თათიდან, რადგან ჩვენი ოპტიმიზაციის ქმედებებით, ჩვენ სრულებით არ ვეხმარებით, მაგრამ ხშირად დიდად ვეყრდნობით ალგორითმს ხედის შესაბამისი მოთხოვნის შესაქმნელად (გამოცანების შესახებ).

ეს არის ოპტიმიზატორების პური და კარაქი და საძიებო ალგორითმები არ გახდება საფუძვლიანი, ამიტომ არსებობს შიდა და გარე ოპტიმიზაციის გამოყენების შესაძლებლობა Yandex-სა და Google-ში მათი პოზიციების გასაუმჯობესებლად.

უპირველეს ყოვლისა, გადავიდეთ ოპტიმიზაციის მეთოდების შესწავლაზე, აუცილებელია ხმის სისტემების მუშაობის პრინციპების საფუძვლიანად გააზრება, რათა შემდგომში ყველა სამუშაო იყოს ცნობილი და გასაგები მომავალში. მცირე რეაქცია.

გასაგებია, რომ ჩვენთვის შეუძლებელია მათი მუშაობის მთელი ლოგიკის გაგება, რადგან არ არის საკმარისი ინფორმაცია გასამჟღავნებლად, თუ საკმარისად არ გვესმის ძირითადი პრინციპები. მოდი, ვნახოთ.

როგორ მუშაობს ხმის სისტემები? გასაკვირი არ არის, მაგრამ მათი მუშაობის ლოგიკა, პრინციპში, იგივეა და ჩნდება წინა პლანზე: გროვდება ინფორმაცია ყველა ხელმისაწვდომ ვებ გვერდზე, რომლის მიღწევაც შესაძლებელია, რის შემდეგაც ეს მონაცემები გროვდება მზაკვრული სიბრძნით. იმისათვის, რომ გამოიყენონ ისინი მოსახერხებელი b ჩაატარონ ძებნა. ღერძი, უფალო, და ყველაფერი ამ სტატიაში შეიძლება ჩაითვალოს დასრულებულად, მაგრამ მაინც დაამატეთ ცოტა დეტალი.

უპირველეს ყოვლისა, განვმარტოთ, რომ რასაც ჩვენ საიტის მხარეს ვუწოდებთ, დოკუმენტი ეწოდება. ამ შემთხვევაში, თქვენ ხართ პასუხისმგებელი თქვენს უნიკალურ მისამართზე () და, კერძოდ, ჰეშის შეტყობინება არ გენერირებულია, სანამ არ გამოჩნდება ახალი დოკუმენტი (ამის შესახებ).

სხვა გზით, თქვენ უნდა გაამახვილოთ ყურადღება ალგორითმებზე (მეთოდებზე) ინფორმაციის მოძიებაზე დოკუმენტების შეგროვებული მონაცემთა ბაზიდან.

ალგორითმები პირდაპირი და საპირისპირო ინდექსებისთვის

ცხადია, მონაცემთა ბაზაში შენახული ყველა გვერდის უბრალოდ ჩამოთვლის მეთოდი არ იქნება ოპტიმალური. ამ მეთოდს ალგორითმი ეწოდება პირდაპირი ძებნადა იმისდა მიუხედავად, რომ ეს მეთოდი საშუალებას გაძლევთ, რა თქმა უნდა, გაარკვიოთ საჭირო ინფორმაცია რაიმე მნიშვნელოვანის გამოტოვების გარეშე, ის აბსოლუტურად არ არის შესაფერისი დიდი რაოდენობით მონაცემებთან მუშაობისთვის, რადგან ძებნას მრავალი საათი დასჭირდება.

ამიტომ ეფექტური მუშაობისთვის, მონაცემთა დიდი ძალისხმევით, შემუშავდა საპირისპირო (ინვერსიული) ინდექსების ალგორითმი. და რაც მთავარია, ის თავად არის გამარჯვებული მსოფლიოს ყველა დიდებულ ხმის სისტემაში. ამიტომ, ამ მომდევნო მოხსენებაში, მოდით შევხედოთ ამ სამუშაოს პრინციპებს.

ალგორითმის გამოყენებისას დაბრუნების ინდექსებიაუცილებელია დოკუმენტების კონვერტაცია ტექსტური ფაილებიდან, რათა შეიქმნას მათში არსებული ყველა სიტყვის სია.

ასეთ სიებში სიტყვები (ინდექსის ფაილები) დალაგებულია ანბანური თანმიმდევრობით და თითოეული მათგანის თანმიმდევრობა მითითებულია ვებ გვერდზე მდებარეობის კოორდინატების ხედში, სადაც სიტყვა ჩნდება. თითოეული სიტყვისთვის დოკუმენტის პოზიციის გარშემო მითითებულია სხვა პარამეტრები, რომლებიც მიუთითებენ მის მნიშვნელობაზე.

როგორც თქვენ ალბათ მიხვდებით, ბევრ წიგნში (ძირითადად ტექნიკური ან სამეცნიერო) დანარჩენ გვერდებზე არის სიტყვების სია, რომლებიც შედის ამ წიგნში, მითითებული გვერდის ნომრებიდან, სადაც ისინი ვიწროვდება. რა თქმა უნდა, ეს სია არ შეიცავს ყველა სიტყვას, რომელიც ჩანს წიგნში, მაგრამ შეიძლება გახდეს მაგალითი ინდექსის ფაილისთვის დამატებითი ინვერსიული ინდექსების გამოყენებით.

ვაფასებ თქვენს პატივისცემას, რომ საძიებო სისტემები ეძებენ ინფორმაციას არა ინტერნეტში, და მათ მიერ მოწოდებული ვებსაიტების დაბრუნების ინდექსები. სურვილი და პირდაპირი ინდექსები (ორიგინალური ტექსტი) stinks ასევე შენახულია, რადგან ეს სასარგებლოა ფრაგმენტების დასაწერად, მაგრამ ჩვენ უკვე ვისაუბრეთ ამ პუბლიკაციის დასაწყისში.

დაბრუნების ინდექსების ალგორითმი გამოიყენება vikoryst სისტემები, რადგან ეს საშუალებას გაძლევთ დააჩქაროთ პროცესი, წინააღმდეგ შემთხვევაში იქნება ინფორმაციის გარდაუვალი დაკარგვა ინდექსის ფაილში დოკუმენტის შეყვანის პროცესში. დაბრუნების ინდექსის ფაილების შესანახად გასაადვილებლად გამოიყენეთ მათი შეკუმშვის რთული მეთოდი.

მათემატიკური მოდელი, რომელიც გამოიყენება რეიტინგისთვის.

პორტალის ინდექსების მოსაძიებლად შემუშავებულია მათემატიკური მოდელი, რომელიც შესაძლებელს ხდის გამარტივდეს საჭირო ვებსაიტების იდენტიფიკაციის პროცესი (მოკითხვის შეყვანით) და ამ მოთხოვნისთვის ნაპოვნი ყველა დოკუმენტის შესაბამისობის დადგენის პროცესი. რაც უფრო მეტი მტკიცებულება შეესაბამება მოცემულ შეკითხვას (რაც უფრო აქტუალურია იგი), მით უფრო სავარაუდოა, რომ ის აღმოჩნდება ბგერაში.

ეს ნიშნავს, რომ მთავარი ამოცანა, რომელსაც ეფუძნება მათემატიკური მოდელი, არის გვერდების მოძიება მის მონაცემთა ბაზაში პორტალური ინდექსების შესაბამისი ამ მოთხოვნასთან და მათი შემდგომი დახარისხება ამ მოთხოვნასთან შესაბამისობის შემცირების მიზნით.

მარტივი ლოგიკური მოდელის გამოყენება, თუ დოკუმენტი აღმოჩნდება, რადგან მოთხოვნილი ფრაზა გამძაფრებულია, ჩვენთვის არ გამოდგება, რადგან ასეთი ვებსაიტების დიდი რაოდენობა, როგორც ჩანს, ღირებულია.

საძიებო სისტემა პასუხისმგებელია არა მხოლოდ ყველა ვებსაიტის სიის მიწოდებაზე, რომლებზეც სიტყვები აკლია სათაურს. თქვენ შეგიძლიათ შეიყვანოთ ეს სია ამ ფორმით, თუ ყველაზე რელევანტური დოკუმენტებია ზედა (დახარისხება შესაბამისობის მიხედვით). ეს ამოცანა არ არის ტრივიალური და, ჩვენი აზრით, არ შეიძლება იყოს იდეალური.

საუბრის წინ, ნებისმიერი მათემატიკური მოდელის არასრულყოფილებით სარგებლობენ ოპტიმიზატორებიც, რომლებიც იყენებენ ამ და სხვა მეთოდებს დოკუმენტების ფორმაში რანჟირებისთვის (საიტის ხარჯზე, რომელსაც იყენებენ, რა თქმა უნდა). მათემატიკური მოდელი, რომელსაც იყენებს ყველა ხმის სისტემა, კლასიფიცირდება როგორც ვექტორული მოდელი. მას აქვს ვიკორისტვო გაგება, რომ დოკუმენტი მთლიანად გაცემულია კორისტუვაჩის მიერ.

საბაზისო ვექტორულ მოდელში მოცემული სიტყვის მიღმა არსებული დოკუმენტის სიგრძე გამოითვლება ორი ძირითადი პარამეტრის საფუძველზე: მოცემული სიტყვის მოსმენის სიხშირე (TF - ტერმინის სიხშირე) და რამდენად იშვიათად ისმის ეს სიტყვა ყველა სხვა მხრიდან. კოლექციები (IDF - ინვერსიული დოკუმენტის სიხშირე).

კოლექციის ქვემოთ მოცემულია გვერდების მთელი ნაკრები, რომელიც შედის ხმის სისტემაში. ორი პარამეტრის სათითაოდ გამრავლებით, ჩვენ ვაკლებთ დოკუმენტის მნიშვნელობას წერილობით დავალებას.

ბუნებრივია, სხვადასხვა ხმის სისტემა, გარდა TF და IDF პარამეტრებისა, გამოიყენება ხმის გაფართოებისთვის რაიმე მნიშვნელოვანი ფაქტორების გარეშე, მაგრამ არსი უცვლელი რჩება: მხარის მნიშვნელობა უფრო დიდი იქნება, რაც უფრო ხშირად არის სიტყვა The. მასში ხმოვანი ნოტა არის მკვეთრი (სიმღერამდე, რის შემდეგაც დოკუმენტი შეიძლება აღმოჩნდეს სპამად) და რამდენად მალე გამოჩნდება ეს სიტყვა ამ სისტემის მიერ ინდექსირებული სხვა დოკუმენტებში.

რობოტული ფორმულის ღირებულების შეფასება შემფასებლების მიერ

ამრიგად, გამოდის, რომ ხდება ამ და სხვა მოთხოვნების მონაცემების ფორმირება მე მივყვები ფორმულასადამიანის მონაწილეობის გარეშე. თუ რომელიმე ფორმულა იდეალურად არ მუშაობს, განსაკუთრებით დასაწყისში, მოგიწევთ მათემატიკური მოდელის მუშაობის კონტროლი.

ამ მიზნებისათვის, სპეციალურად მომზადებული ადამიანები გამოიყენება მონაცემების (კონკრეტულად საძიებო სისტემებზე, რომლებმაც დაიქირავეს ისინი) სხვადასხვა შეკითხვებისთვის და შეაფასონ ნაკადის ფორმულის სიზუსტე.

ყველა მათგანს პატივისცემით უჭერენ მხარს ადამიანები, რომლებიც პასუხისმგებელნი არიან მოდელის კორექტირებაზე. ფორმულაში ხდება ცვლილებები და დამატებები, რის შედეგადაც იზრდება ჟღერადობის ეფექტურობა. გამოდის, რომ შემფასებლები ასკვნიან ალგორითმის შემქმნელებსა და მათ კორესტუვაჩამს შორის ასეთი სახის კარიბჭე კავშირის როლს, რაც სიყვითლის აუცილებელ გაძლიერებას წარმოადგენს.

რობოტის ფორმულის ეფექტურობის შეფასების ძირითადი კრიტერიუმებია:

ხმის სისტემის სიზუსტე არის ასობით შესაბამისი დოკუმენტი (რომელიც შეესაბამება მოთხოვნას). რაც უფრო ნაკლები ვებ – გვერდი (მაგალითად, კარიბჭე), ასე რომ თქვენ არ შეგაწუხებთ ამ კითხვებს, უკეთესი იქნება იქ ყოფნა.
ხმის ტიპის სისრულე არის მსგავსი მოთხოვნების (შესაბამისი) ვებსაიტების დიდი რაოდენობა შესაბამისი დოკუმენტების მთლიან რაოდენობასთან, რომლებიც მთელ კოლექციაშია. ტობტო. გამოდის, რომ საძიებო ფორმაში ქვემოთ იქნება ნაჩვენები დოკუმენტების მთელი მონაცემთა ბაზა, რომლებიც ეძებენ ვებ გვერდებს, რომლებიც შეესაბამება მოცემულ შეკითხვას. ამ შემთხვევაში შეიძლება ვისაუბროთ გარეგნობის შეუსაბამობაზე. შესაძლებელია, რომ ზოგიერთი შესაბამისი გვერდი დაიკარგა ფილტრის ქვეშ და, მაგალითად, შეცდომით იყოს ჭუჭყიანი ან სხვა წიდა.
ხედის შესაბამისობა არის ინტერნეტში არსებული საიტის რეალური ვებ გვერდის შესაბამისობის დონე იმაზე, თუ რა წერია ამის შესახებ ძიების შედეგებში. მაგალითად, დოკუმენტი შეიძლება აღარ შეიქმნას, ან ის მნიშვნელოვნად შეიცვალოს, მაგრამ მოცემული მოთხოვნის ტიპი იქნება წარმოდგენილი, მიუხედავად მისი ფიზიკური ყოფნისა მითითებულ მისამართზე, ან ვინ იქნება სრულიად განსხვავებული მოცემული მოთხოვნისაგან. აქტუალობა მდგომარეობს იმ სიხშირეში, რომლითაც საძიებო რობოტები სკანირებენ დოკუმენტებს მათი კოლექციიდან.

როგორ აგროვებენ Yandex და Google თავიანთ კოლექციას

მიუხედავად ვებ გვერდების ინდექსირების სიმარტივისა, რაც, როგორც ჩანს, ასეა, არსებობს ბევრი ნიუანსი, რომელიც უნდა იცოდე და შემდეგ გამოიყენო საკუთარი ან სხვა საიტების ოპტიმიზაციისას (SEO). მონაცემთა ბაზის ინდექსაცია (კოლექციის კოლექცია) ხორციელდება სპეციალურად შექმნილი პროგრამით, სახელწოდებით საძიებო რობოტი (ბოტი).

რობოტი ირჩევს მისამართების საწყის ჩამონათვალს, რომლის ამოღებაზეც ის იქნება პასუხისმგებელი, დააკოპირებს ამ გვერდებს და გადასცემს ალგორითმს შემდგომი დამუშავებისთვის (ის გარდაქმნის მათ დაბრუნების ინდექსებად).

რობოტს შეუძლია არა მხოლოდ ამ სიის უკან გასვლა, არამედ ამ გვერდების შეტყობინებებზე გადასვლა და ამ შეტყობინებების უკან არსებული დოკუმენტების ინდექსირება. რომ. რობოტი იქცევა ისევე, როგორც პრემიერ მინისტრი, რომელიც ბრძანებებს ასრულებს.

გამოდის, რომ დამატებითი რობოტის დახმარებით შეგიძლიათ ინდექსირება გაუკეთოთ ყველას, რაც ხელმისაწვდომია მომხმარებლისთვის, რომელიც არის ბრაუზერი სერფინგისთვის (საძიებო სისტემები აფიქსირებენ პირდაპირი ხილვადობის დოკუმენტებს, რომლებზეც წვდომა შეუძლია ინტერნეტის ნებისმიერ მომხმარებელს).

საზღვარზე დოკუმენტების ინდექსირებასთან დაკავშირებული რამდენიმე ფუნქციაა (მახსოვს ის, რაც უკვე განვიხილეთ).

პირველი თვისება, რომლის გათვალისწინებაც შეიძლება, არის ის, რომ დაბრუნების ინდექსის გარდა, რომელიც იქმნება დროდადრო იმპორტირებული ორიგინალური დოკუმენტიდან, ხმის სისტემა ინახავს სხვა ასლს, წინააღმდეგ შემთხვევაში, როგორც ჩანს, ხმის სისტემები ინახავს სხვა პირდაპირ ინდექსს. რა არის საჭირო? მე უკვე გამოვიცანი ცოტა ადრე, რა იქნებოდა საჭირო შეყვანილი მოთხოვნის საფუძველზე სხვადასხვა ფრაგმენტების შედგენისთვის.

Yandex-ის ერთი საიტის რამდენ გვერდს აჩვენებს ფორმაში და ინდექსებში

მინდა გამოვხატო თქვენი პატივისცემა Yandex-ის მუშაობის ისეთი განსაკუთრებული მახასიათებლის მიმართ, როგორიცაა ერთზე მეტი დოკუმენტის არსებობა თითოეულ საიტზე მოცემული მოთხოვნისთვის. ეს, ერთი რესურსიდან ორ მხარეს სხვადასხვა პოზიციაზე მყოფი სახეობისთვის, ბოლო დრომდე არ შეიძლებოდა მომხდარიყო.

ეს არის Yandex-ის ერთ-ერთი ძირითადი წესი. თუ ერთ საიტზე ასობით გვერდია მოცემული მოთხოვნის შესაბამისი, მაშინ იქნება მხოლოდ ერთი (ყველაზე შესაბამისი).

Yandex მიზნად ისახავს უზრუნველყოს, რომ koristuvach შეარჩევს განსხვავებულ ინფორმაციას და არ დაწვავს ხმის ტიპის ინფორმაციის რამდენიმე გვერდს იმავე საიტის გვერდებიდან, რაც კორისტუვაჩი ამ ადამიანებისგან უმნიშვნელო ჩანდა სხვა მიზეზები.

თუმცა, მე ვაჩქარებ ლოდინს, რადგან თუ დავასრულე ეს სტატია, გავიგე რაღაც ახალი, რომ Yandex დაიწყებს დაუშვას სხვა დოკუმენტის გამოჩენა იმავე რესურსიდან, თითქოს ეს მხარე "კიდევ კარგი და სწორი" ჩანს (სხვაში სიტყვებით, ეს ძალზე მნიშვნელოვანია შეკითხვისთვის).

საყურადღებოა, რომ იგივე საიტის დამატებითი შედეგებიც დანომრილია და შესაბამისად, ამ ტოპის მეშვეობით ჩამოვარდება სხვადასხვა რესურსები, რომლებიც უფრო დაბალ პოზიციებს იკავებენ. Yandex-ის ახალი ვერსიის ღერძის კონდახი:

ისინი ცდილობენ ეტაპობრივად მოახდინოს ყველა საიტის ინდექსირება, მაგრამ ხშირად ეს ხდება არა უბრალოდ მათზე არსებული გვერდების ძალიან განსხვავებული რაოდენობის მეშვეობით (ზოგს აქვს ათი, ზოგს კი ათი მილიონი). იაკ ბუთი უ ცომუ ვიპადკუ?

Yandex შორდება ამ სიტუაციიდან რამდენიმე დოკუმენტის ურთიერთგაცვლით, რომელთა ჩამოტვირთვა შესაძლებელია ინდექსში ერთი საიტიდან.

სხვა დონის დომენური სახელების მქონე პროექტებისთვის, მაგალითად ვებსაიტი, გვერდების მაქსიმალური რაოდენობა, რომელთა ინდექსირებაც შესაძლებელია Runet სარკეში, არის ასიდან ას ორმოცდაათ ათასამდე (კონკრეტული რიცხვი ეფუძნება დავალებას ეს პროექტი).

რესურსებისთვის მესამე დონის დომენური სახელებიდან – ათიდან ოცდაათ ათას გვერდამდე (დოკუმენტები).

თუ თქვენ გაქვთ ვებსაიტი სხვა დონის დომენით () და მოგიწევთ ინდექსირება, მაგალითად, მილიონი ვებსაიტი, მაშინ ამ სიტუაციიდან ერთადერთი გამოსავალი იქნება ქვედომენების უპიროვნების შექმნა ().

სხვა დონის დომენის ქვედომენი შეიძლება ასე გამოიყურებოდეს: JOOMLA.site. სხვა ქვეყნებისთვის ქვედომენების რაოდენობა, რომელთა ინდექსირებაც შესაძლებელია Yandex-ის მიერ არის 200-ზე ოდნავ მეტი (ზოგჯერ ათასამდე), ასე რომ, ამ მარტივი გზით შეგიძლიათ რამდენიმე განათავსოთ RuNet mirror More ვებ გვერდების ინდექსში.

როგორ განთავსდება Yandex ვებსაიტებზე არარუსული დომენის ზონებში

გამომდინარე იქიდან, რომ Yandex ბოლო დრომდე დაინტერესებული იყო ინტერნეტის რუსული ნაწილით, ის ძირითადად რუსული პროექტების ინდექსირებას ახდენს.

თუ თქვენ ქმნით ვებსაიტს არა დომენის ზონებში, რომლებიც, სავარაუდოდ, მიეკუთვნება რუსულს (RU, SU და UA), მაშინ შეუძლებელია ინდექსაციის შემოწმება, რადგან შენ, ვინც ყველაფერი გინახავს, არა უადრეს ერთი თვის წინ გაგიცანი. თუ ინდექსაცია უკვე დაწყებულია, ეს მოხდება იმავე სიხშირით, როგორც რუსული დომენის ზონებში.

ტობტო. დომენის ზონა მიედინება მხოლოდ ერთი საათის განმავლობაში, რომელიც გადის ინდექსაციის დასაწყისამდე, მაგრამ არ მიედინება მის სიხშირემდე. საუბრის წინ რა სიხშირეა?

ხმის სისტემების მუშაობის ლოგიკა გვერდების ხელახალი ინდექსაციიდან მცირდება დაახლოებით იგივეზე:

ახალი გვერდის გაცნობის და ინდექსირების შემდეგ, რობოტი მასზე მეორე დღეს გადავა
გააცნობიერა რა მოხდა გუშინ და არ იცის მოვალეობები, რობოტი ისევ მოვა მასთან სამ დღეში
როგორც კი მასზე არაფერი შეიცვლება, ის მოვა ათწლეულის შემდეგ და ა.შ.

რომ. მაშასადამე, რობოტის ამ მხარეს ჩამოსვლის სიხშირე უდრის მისი განახლების სიხშირეს ან იქნება მისი ტოლი. უფრო მეტიც, რობოტის ხელახლა შესვლის საათი შეიძლება განსხვავდებოდეს სხვადასხვა საიტებზე, როგორც ჩინეთში, ასევე რუსეთში.

ეს არის ინტელექტუალური ხმის სისტემები, რომლებიც ქმნიან მიწოდების ინდივიდუალურ განრიგს სხვადასხვა რესურსის სხვადასხვა ნაწილისთვის. თუმცა, შეგიძლიათ სთხოვოთ ხმის სისტემებს ხელახლა ინდექსირება გაუკეთონ გვერდის ჩვენს ბანერებს, თითქოს მასზე არაფერი შეცვლილა, მაგრამ ამის შესახებ სხვა სტატისტიკაში.

გავაგრძელოთ ძიების პრინციპების დანერგვა არსებულ ვითარებაში, სადაც გადავხედავთ საძიებო სისტემებში წარმოშობილ პრობლემებს და შევხედავთ ნიუანსებს. რა თქმა უნდა, და ბევრი სხვა რამ, ასე რომ, ეს სხვა გზით ეხმარება.

Წარმატებას გისურვებ! მალე შევხვდებით ბლოგის საიტზე

შეიძლება გაგიჭირდეთ

Rel Nofollow და Noindex - როგორ დაბლოკოთ Yandex-ისა და Google-ის გარე შეტყობინებების ინდექსაცია საიტზე
მეტყველების მორფოლოგიის გამოჩენა და ხმის სისტემებით გამოწვეული სხვა პრობლემები, ასევე მაღალი სიხშირის, საშუალო სიხშირის და დაბალი სიხშირის შეყვანის სიხშირე
ნდობა საიტის მიმართ - რა არის ეს, როგორ გადაშენდეს XTools-ში, რა გავლენას ახდენს მასზე და როგორ გაზარდოს თქვენი საიტის ავტორიტეტი
SEO ტერმინოლოგია, სტენოგრამა და ჟარგონი
შესაბამისობა და რეიტინგი - რა არის ეს ფაქტორები, რომლებიც გავლენას ახდენენ საიტების რეიტინგზე Yandex-სა და Google-ში?
საძიებო სისტემის ოპტიმიზაციის რომელი ფაქტორები ახდენს გავლენას საიტის მუშაობაზე ამ გზით?
ტექსტების ძიების ოპტიმიზაცია - საკვანძო სიტყვების ოპტიმალური სიხშირე და თქვენი იდეალური დაბადების დღე
კონტენტი საიტისთვის - რადგან უნიკალური და უნიკალური შინაარსის დამატება ხელს უწყობს საიტების ყოველდღიურ განვითარებას
მეტა ტეგების სათაური, აღწერა და საკვანძო სიტყვები
Yandex განახლებები - რა ხდება, როგორ თვალყური ადევნოთ ძუძუს, შეცვალოთ ხმის ტიპები და ყველა სხვა განახლება

ხმის სისტემები (PS) ახლა ინტერნეტის მნიშვნელოვანი ნაწილია. დღეს ისინი ეყრდნობიან კომპლექსურ მექანიზმებს, რომლებიც არა მხოლოდ საჭირო ინფორმაციის საპოვნელად, არამედ ბიზნესისთვის ცხელ ადგილებში წვდომის ინსტრუმენტს წარმოადგენს.

კორისტუვაჩების უმეტესობას არასოდეს უფიქრია თავისი მუშაობის პრინციპებზე, კორისტუვაჩის სასმელების დამუშავების მეთოდებზე, იმაზე, თუ როგორ მზადდება და ფუნქციონირებს ეს სისტემები. ეს მასალა დაეხმარება ადამიანებს, რომლებიც დაკავებულნი არიან ხმის აპარატების მოწყობილობებისა და ძირითადი ფუნქციების ოპტიმიზაციისა და გაგებით.

პს-ის ფუნქციები და გაგება

პოშუკოვას სისტემა– ეს არის აპარატურულ-პროგრამული კომპლექსი, რომელიც გამოიყენება ინტერნეტში ძიების ამ ფუნქციისთვის და პასუხობს მომხმარებლის მოთხოვნას, რომელიც მოითხოვს მას ფორმაში შეიყვანოს ნებისმიერი ტექსტური ფრაზა (უფრო ზუსტად, საძიებო მოთხოვნა). მასზე შეკვეთების სიის შესახებ ინფორმაციის წყაროები, რომლებიც დაკავშირებულია შესაბამისობასთან. ყველაზე ფართო და უდიდესი საძიებო სისტემები: Google, Bing, Yahoo, Baidu. Runet-ს აქვს Yandex, Mail.Ru, Rambler.

მოდით, უფრო დეტალურად განვიხილოთ ყველაზე მნიშვნელოვანი რამ, უბრალოდ გასართობად, მაგალითად Yandex სისტემის გამოყენებით.

კითხვა უნდა იყოს ჩამოყალიბებული ისე, რომ სრულიად მსგავსი იყოს თქვენი ძიების საგანი, რაც შეიძლება მარტივად და მოკლედ. მაგალითად, ჩვენ გვინდა ვიცოდეთ ინფორმაცია ამ საძიებო სისტემაში: „როგორ ავირჩიოთ მანქანა თქვენთვის“. ამისათვის გახსენით მთავარი გვერდი და შეიყვანეთ ძიება "როგორ ავირჩიოთ მანქანა". მაშინ ჩვენი ფუნქციები შემოიფარგლება ამ შეტყობინებებისთვის საზღვარზე არსებულ საინფორმაციო მაგიდასთან მისვლით.

ისე, თუ თქვენ მუშაობთ ამ გზით, შეგიძლიათ და არ უარყოთ ჩვენთვის საჭირო ინფორმაცია. თუ ასეთი უარყოფითი შედეგი მივიღეთ, უბრალოდ უნდა გადავაფორმოთ ჩვენი მოთხოვნა, წინააღმდეგ შემთხვევაში საძიებო ბაზას არ აქვს რაიმე სასარგებლო ინფორმაცია ამ ტიპის მოთხოვნის შესახებ (ეს სავსებით შესაძლებელია მოთხოვნის „უნივერსიტეტის“ პარამეტრების მითითებისას, როგორიცაა: მაგალითად, "როგორ ავირჩიოთ მანქანა ანადირში").

კანის სმენის სისტემის ყველაზე მნიშვნელოვანი ამოცანაა მიაწოდოს ადამიანებს იმ ტიპის ინფორმაცია, რომელიც მათ სჭირდებათ. და პრაქტიკულად შეუძლებელია სტუდენტების ჩვევა, რომ "სწორი" ტიპის ზარები განახორციელონ ხმის სისტემებზე, ისე ფრაზები, რომლებიც შეესაბამებოდეს მათ მუშაობის პრინციპებს.

სწორედ ამიტომ, ხუმრობების ფახივცი-სპეკულანტები ცდილობენ დაანგრიონ თავიანთი რობოტების ისეთი პრინციპები და ალგორითმები, თითქოს აცნობონ ტრეიდერებს, რა არის მათთვის სასარგებლო. ეს ნიშნავს, რომ სისტემა პასუხისმგებელია „აზროვნებაზე“ ისევე, როგორც ადამიანი ფიქრობს ინტერნეტში საჭირო ინფორმაციის მოძიებისას.

როდესაც საძიებო მანქანაში შედიხართ თქვენს ძიებას, შეგიძლიათ იპოვოთ ის, რაც გჭირდებათ უმარტივესი და სწრაფი გზით. შედეგის მიღების შემდეგ, ექსპერტი იწყებს რობოტული სისტემის შეფასებას რიგი კრიტერიუმების საფუძველზე. მოახერხეთ თქვენთვის საჭირო ინფორმაციის გაგება? ყოველ შემთხვევაში, რამდენჯერ მოგიწია შეკითხვის ტექსტის გადაფორმება, რომ იცოდე? რამდენი შესაბამისი ინფორმაცია დაიკარგა? როგორ დაამუშავა ეს შვიდკო პოშუკის სისტემამ? რამდენად მარტივი იყო ძიების შედეგები? ჯერ მიიღე სასურველი შედეგი, თუ 30-ე თვეში განიცადე? რამდენი „საჭირო“ (არასაჭირო ინფორმაცია) აღმოჩნდა ერთდროულად ფონიდან? პოულობთ შესაბამის ინფორმაციას საათების მიხედვით, საათების მიხედვით, წლების მიხედვით, თვეების მიხედვით?

იმისათვის, რომ შეარჩიონ სწორი ტიპის საკვები ასეთი საკვებისთვის, მწარმოებლები ცდილობენ თანდათან გააუმჯობესონ რეიტინგის პრინციპები და მათი ალგორითმები, დაამატონ მათ ახალი შესაძლებლობები და ფუნქციები და ყველანაირად ცდილობენ შექმნან უკეთესი სამუშაო სისტემები.

ხმის სისტემების ძირითადი მახასიათებლები

მნიშვნელოვანია ძიების ძირითადი პარამეტრები:

პოვნოტა.

გამეორება ძიების ერთ-ერთი ყველაზე მნიშვნელოვანი მახასიათებელია და ის დაკავშირებულია ძიების დროს ნაპოვნი საინფორმაციო დოკუმენტების რაოდენობასთან და ინტერნეტში მათ რაოდენობასთან, რომელთა ძებნაც შესაძლებელია. მაგალითად, ხაზს აქვს 100 გვერდი, რომელიც შეიცავს სიტყვებს „როგორ ავირჩიოთ მანქანა“ და იმავე ძიების შემდეგ მთლიანი რიცხვიდან შეირჩა 60, მაშინ ამ შემთხვევაში ძიების სიხშირე ხდება 0.6. ნათელია, რომ რაც უფრო მაღალია თავად ძებნა, მით უფრო დიდია ალბათობა იმისა, რომ სტუდენტი იპოვის საჭირო დოკუმენტს, მით უმეტეს, რომ მას სძინავს.

სიზუსტე.

ხმის სისტემის კიდევ ერთი მთავარი ფუნქცია სიზუსტეა. ვონი მიუთითებს მერეჟაში იდენტიფიცირებული გვერდების მყიდველის მიმოწერის დონეს. მაგალითად, რადგან საკვანძო ფრაზა "როგორ ავირჩიოთ მანქანა" შეიცავს ას დოკუმენტს, მათი ნახევარი შეიცავს ფრაზებს, ხოლო სხვები უბრალოდ შეიცავს სიტყვებს (როგორ ავირჩიოთ მანქანის რადიო სწორად და დააინსტალიროთ იგი მანქანაში), მაშინ აღარ არის ვიდრე 50/100 = 0.5.

რაც უფრო ზუსტია ძიება, მით უფრო ზუსტია თქვენთვის საჭირო ინფორმაცია, რაც უფრო ნაკლებად მრავალფეროვანია „წინადადებები“ შედეგებს შორის, მით უფრო ნაკლებად ნაპოვნი დოკუმენტები არ არის შესაფერისი კითხვის ჩასანაცვლებლად.

შესაბამისობა.

მნიშვნელოვანია შენახვის დრო, რომელიც ახასიათებს საათს, რომელიც გადის ინფორმაციის ინტერნეტში გამოქვეყნების მომენტიდან საძიებო სისტემის ინდექსების მონაცემთა ბაზაში შესვლამდე.

მაგალითად, მეორე დღეს, მას შემდეგ, რაც გაჩნდა ინფორმაცია ახალი iPad-ის გამოშვების შესახებ, ბევრმა ადამიანმა დაიწყო მსგავსი ტიპის მოთხოვნების კითხვა. უმეტეს შემთხვევაში, ინფორმაცია ამ ახალი პროდუქტის შესახებ უკვე ხელმისაწვდომია ინტერნეტში, თუმცა დრო გავიდა მისი გამოჩენიდან. ეს ყოველთვის აშკარაა შვედური ბაზის შესანიშნავი ხმის სისტემებიდან, რომლებიც განახლდება დღეში რამდენჯერმე.

ხუმრობას ჰგავს.

ეს ფუნქცია, როგორიცაა ელასტიურობა, მჭიდრო კავშირშია ე.წ. ძიებისას უამრავი ადამიანია, ასეთი გატაცება მოითხოვს ერთი შეკითხვის დამუშავებისთვის საჭირო დროის მნიშვნელოვან შემცირებას. აქ, როგორც ხმის სისტემის, ასევე მომხმარებლის ინტერესები მთლიანად არის აცილებული: გსურთ უარი თქვათ შედეგებზე რაც შეიძლება მალე, ხოლო ხმის სისტემა პასუხისმგებელია ამ მოთხოვნის რაც შეიძლება სწრაფად დამუშავებაზე, რათა არ მოხდეს მომავალი ზედმეტად დამუშავება. ითხოვს.

Სისრულე.

თავდაპირველად, შედეგების გამოვლინება არის ყველაზე მნიშვნელოვანი ელემენტი ძიების წარმატებისთვის. კულისებში საძიებო სისტემა შეიცავს ათასობით და ზოგიერთ შემთხვევაში მილიონობით სხვადასხვა დოკუმენტს. საძიებო საკვანძო ფრაზების შემადგენლობის ბუნდოვანების ან მისი უზუსტობის გამო, ძიების ძირითადი შედეგები ყოველთვის არ იქნება საჭირო ინფორმაციის გარეშე.

ეს ნიშნავს, რომ ადამიანებს ხშირად უწევთ თავიანთი აზრების განხორციელება მოცემული შედეგების შუაგულში. PS ტიპის გვერდების სხვადასხვა კომპონენტი ხელს უწყობს ხმის შედეგების ნავიგაციას.

ხმის სისტემების განვითარების ისტორია

მას შემდეგ, რაც ინტერნეტმა დაიწყო განვითარება, მუდმივი მოვაჭრეების რაოდენობა მცირე იყო და ხელმისაწვდომობისთვის ხელმისაწვდომი ინფორმაციის რაოდენობა ჯერ კიდევ მცირე იყო. ამ სფეროს უფრო დიდი წვდომა შემოიფარგლება მხოლოდ სამეცნიერო და კვლევით სფეროებში. იმ დროს ინფორმაციის ცოდნა ისეთი აქტუალური არ იყო, როგორც ახლა.

საინფორმაციო რესურსებზე ფართო წვდომის ორგანიზების ერთ-ერთი პირველი მეთოდი იყო საიტების დირექტორიების შექმნა და მათზე შეტყობინებები თემის მიხედვით დაჯგუფება დაიწყო. რესურსი Yahoo.com, რომელიც გაჩნდა 1994 წლის გაზაფხულზე, გახდა ასეთი პირველი პროექტი. წელს, რადგან Yahoo-ს კატალოგში საიტების რაოდენობა გაიზარდა, დაემატა კატალოგში საჭირო ინფორმაციის მოძიება. მსოფლიოში ჯერ არ არსებობს სრული საძიებო სისტემა, რადგან ასეთი ძიების არეალი შემოიფარგლება მხოლოდ საიტებით, რომლებიც შედის ამ დირექტორიაში და არა ინტერნეტში არსებული ყველა რესურსით. წარსულში დიდი ხალხისთვის გაგზავნილი კატალოგები ფართოდ გამოიყენებოდა, მაგრამ ახლა მათ თითქმის მთლიანად დაკარგეს პოპულარობა.

დღევანდელი დიდი კატალოგებიც კი შეიცავს ინფორმაციას ინტერნეტში არსებული მცირე რაოდენობის საიტების შესახებ. მსოფლიოში ყველაზე პოპულარული და უდიდესი კატალოგი შეიცავს ინფორმაციას ხუთი მილიონი საიტის შესახებ, თუ Google მონაცემთა ბაზა შეიცავს ინფორმაციას 25 მილიარდზე მეტი საიტის შესახებ.

მსოფლიოში ყველაზე პოპულარული საძიებო სისტემა იყო WebCrawler, რომელიც 1994 წლით თარიღდება.

AltaVista და Lycos გამოჩნდნენ მომავალ ბედში. უფრო მეტიც, პერშა ძალიან რთული პერიოდის განმავლობაში ლიდერობდა ინფორმაციის ძიებაში.

1997 წელს სერგი ბრინმა ლარი პეიჯთან ერთად შექმნა Google საძიებო სისტემა, როგორც შემდგომი პროექტი სტენფორდის უნივერსიტეტში. დღეს Google არის ყველაზე პოპულარული საძიებო სისტემა მსოფლიოში.

1997 წლის გაზაფხულზე გამოცხადდა Yandex PS (ოფიციალურად), რადგან ის გახდა ყველაზე პოპულარული საძიებო სისტემა Runet-ში.

ხარკებისთვის გაზაფხული 2015 rokuხმოვანი სისტემების ნაწილები მთელს მსოფლიოში იყოფა შემდეგი თანმიმდევრობით:

Google – 69,24%;
Bing – 12,26%;
Yahoo! - 9,19%;
ბაიდუ – 6,48%;
AOL – 1,11%;
დასვით - 0,23%;
აგზნება - 0.00%

ხარკებისთვის მკერდი 2016 roku, ხმის სისტემების ნაწილები Runet-ზე:

Yandex - 48.40%
Google – 45.10%
Search.Mail.ru - 5.70%
Rambler - 0.40%
Bing – 0.30%
Yahoo - 0.10%

რობოტული ხმის სისტემის პრინციპები

რუსეთის მთავარი საძიებო სისტემაა Yandex, შემდეგ Google და შემდეგ [email protected]. ყველა დიდი სისტემა ეძებს თავის სტრუქტურას, რადგან ისინი განსხვავდებიან სხვებისგან. თუმცა, თქვენ მაინც შეგიძლიათ ნახოთ ძირითადი ელემენტები, რომლებიც აუცილებელია ყველა ხმის სისტემისთვის.

ინდექსირების მოდული.

ეს კომპონენტი შედგება სამი პროგრამული რობოტისგან:

ობობა(ინგლისურად pavuk) არის პროგრამა, რომელიც შექმნილია ვებ გვერდების მოსაზიდად. "პავუკი" ატყვევებს სიმღერის სიმღერას, მყისიერად ასახავს მისგან ყველა შეტყობინებას. html კოდი მოჯადოებულია პრაქტიკულად კანის მხრიდან. ამ მიზნით ვიყენებთ HTTP პროტოკოლებს.

„პავუკი“ ასე ფუნქციონირებს. რობოტი აგზავნის მოთხოვნას სერვერზე "get/path/document" და სხვა ბრძანებებს HTTP-ის გამოყენებით. საპასუხოდ, რობოტის პროგრამა ირჩევს ტექსტის ნაკადს, რომელიც ათავსებს ინფორმაციას სერვისის ხედში და, რა თქმა უნდა, დოკუმენტს.

სასურველი გვერდის URL;
საიტის შექმნის თარიღი;
სერვერის http-ვიდეო სათაური;
html კოდი, გვერდის "სხეული".

მცოცავი("მანდროს" ობობა). ეს პროგრამა ავტომატურად წვდება საიტზე ნაპოვნი ყველა შეტყობინებას და ასევე ხედავს მათ. თქვენი ამოცანაა დაადგინოთ სად შეიძლება წავიდეს ობობა შემდეგ, ამ შეტყობინებების საფუძველზე ან დატოვოს მოცემული მისამართების სია.

ინდექსატორი(Robot indexer) არის პროგრამა, რომელიც აანალიზებს ობობებს გადმოწერილი გვერდებს.

ინდექსატორი საფუძვლიანად აანალიზებს საწყობის ელემენტებს და ატარებს მათ ანალიზს, საკუთარი მორფოლოგიური და ლექსიკური ტიპის ალგორითმების გამოყენებით.

ანალიზი ტარდება გვერდის სხვადასხვა ნაწილზე, როგორიცაა სათაურები, ტექსტი, შეტყობინება, სტილი და სტრუქტურული მახასიათებლები, html ტეგები და ა.შ.

ამრიგად, ინდექსირების მოდული საშუალებას გაძლევთ გაიაროთ რესურსების განსაზღვრული რაოდენობა, გადაიღოთ გვერდები, ამოიღოთ შეტყობინებები ახალ გვერდებზე ამოღებული დოკუმენტებიდან და შეასრულოთ მათი ანგარიშის ანალიზი.

Მონაცემთა ბაზა

Მონაცემთა ბაზა(ან საძიებო სისტემის ინდექსი) - მონაცემთა დაზოგვის კომპლექსი, ინფორმაციის მასივი, რომელშიც ინახება ინდექსირების მოდულისა და შენახული დოკუმენტის მიერ შეძენილი კანის პარამეტრების დამუშავების პირველი ნაბიჯი.

ხმის სერვერი

ეს არის ამ სისტემის ყველაზე მნიშვნელოვანი ელემენტი, რადგან ალგორითმის ტიპი, რომელიც მისი ფუნქციონირების ცენტრშია, პირდაპირ შეიცავს ხუმრობის ლიკვიდობას და, განსაკუთრებით, მჟავიანობას.

ხმის სერვერი მუშაობს ჩვეულებრივად:

პირიდან ამოსვლისას ექვემდებარება მორფოლოგიურ ანალიზს. იქმნება მონაცემთა ბაზაში არსებული ნებისმიერი დოკუმენტისთვის დამახასიათებელი ინფორმაცია (მოგვიანებით გამოჩნდება სნიპეტის სახით, ინფორმაციის ველი ტექსტისთვის, რომელიც შეესაბამება ამ მოთხოვნას).
ამოღებული მონაცემები გადაეცემა შეყვანის პარამეტრებს სპეციალიზებულ რანგის მოდულს. ყველა დოკუმენტი განიხილება და თითოეული ასეთი დოკუმენტის შედეგს ენიჭება საკუთარი რეიტინგი, რაც ახასიათებს ასეთი დოკუმენტის შესაბამისობას ვაჭრისა და სხვა საწყობებისთვის.
კორესპონდენტის მიერ მინიჭებული გონებიდან გამომდინარე, ეს რეიტინგი შეიძლება მთლიანად გამოსწორდეს დამატებითი რეიტინგებით.
შემდეგ თავად სნაიპი წარმოიქმნება, მაშინ. შემაჯამებელ ცხრილში ნაპოვნი ნებისმიერი დოკუმენტისთვის აირჩიეთ სათაური, აბსტრაქტი, რომელიც ყველაზე მეტად წააგავს მოთხოვნას და შეტყობინება ამ დოკუმენტისთვის, სადაც არის ნაპოვნი სიტყვის ფორმა და ხაზგასმულია სიტყვები.
ძიების შედეგები გაზიარებულია იმ ადამიანებთან, რომლებმაც შექმნეს ისინი იმ გვერდზე, სადაც ჩანს ძიების შედეგები (SERP).

ყველა ეს ელემენტი მჭიდროდ არის დაკავშირებული ერთმანეთთან და ფუნქციონირებს, ურთიერთქმედებს, ქმნის PS-ის ფუნქციონირების მკაფიო, მაგრამ არა მარტივ მექანიზმს, რაც საჭიროებს რესურსების დიდ ინვესტიციას.

ინტერნეტი აუცილებელია მდიდარი ტრეიდერებისთვის, რათა შეარჩიონ შეყვანის და შეყვანის საშუალებები.

თითქოს არ არსებობდეს საძიებო სისტემები, კორისტუვაჩებს დამოუკიდებლად უწევდათ საჭირო საიტების მოძიება, დამახსოვრება და ჩაწერა. ასეთ სიტუაციებში, „ხელით“ ცოდნა, რაც გჭირდებათ, კიდევ უფრო რთული და ხშირად უბრალოდ შეუძლებელი იქნება.

ჩვენთვის მთელი ეს რუტინული სამუშაო კეთდება საიტებზე ინფორმაციის მოძიებით, შენახვით და დახარისხებით.

მოდით ვისაუბროთ Runet-ის ცნობილ საძიებო სისტემებზე.

საძიებო სისტემები რუსულ ინტერნეტში

1) დავიწყოთ ლორის ხმის სისტემით. Yandex მოქმედებს არა მხოლოდ რუსეთში, არამედ ბელორუსიასა და ყაზახეთში, უკრაინაში, თურქეთში. ასევე Yandex ინგლისური ენა.

2) Google საძიებო სისტემა ჩვენთან მოვიდა ამერიკიდან და აქვს რუსული ლოკალიზაცია:

3) პოპულარული საძიებო სისტემა Mail ru, რომელიც ერთდროულად წარმოადგენს სოციალურ ქსელ VKontakte-ს, Odnoklassniki-ს, ასევე My World-ს, რომელიც ჩანს Mail.ru-ზე და სხვა პროექტებზე.

4) ინტელექტუალური საძიებო სისტემა

ნიგმა (ნიგმა) http://www.nigma.ru/

2017 წლის 19 ივნისს ინტელექტუალური ნიგმა არ მუშაობს. მან შეწყვიტა ფინანსური ინტერესის წარმოდგენა მისი შემქმნელებისთვის; ისინი გადავიდნენ სხვა საძიებო სისტემაზე, სახელწოდებით CocCoc.

5) სახლში კომპანია Rostelecom-მა შექმნა Suputnik-ის საძიებო სისტემა.

და ჯოკერი Saputnik, სპეციალურად ბავშვებისთვის, რაზეც დავწერე.

6) Rambler იყო ერთ-ერთი პირველი პოპულარული საძიებო სისტემა:

მსოფლიოში არსებობს სხვა ტიპის ხმის სისტემები:

ბინგ,
Yahoo!,
ბაიდუ,
ეკოსია,

შევეცადოთ გავიგოთ როგორ მუშაობს საძიებო სისტემა და როგორ ხდება საიტების ინდექსირება, გავაანალიზოთ ინდექსირების შედეგები და ჩამოვაყალიბოთ ძიების შედეგები. ხმის სისტემების მუშაობის პრინციპები დაახლოებით იგივეა: ინფორმაციის მოძიება ინტერნეტში, შენახვა და დახარისხება მომხმარებლისგან შესაბამისი ინფორმაციის მიღების მიზნით. და ალგორითმები, რომელთა უკან მოქმედებენ ხმის სისტემები, შეიძლება ძალიან განსხვავდებოდეს. ეს ალგორითმები ინახება სიბნელეში და მათი უთანხმოება დაცულია.

ერთი და იგივე სიგნალის სხვადასხვა ხმის სისტემის რიგში ჩასმით, შეგიძლიათ აირჩიოთ სხვადასხვა ტიპები. მიზეზი ის არის, რომ ყველა საძიებო სისტემა იყენებს მძლავრ ალგორითმს.

ხმის სისტემების მეტა

ჯერ უნდა ვიცოდეთ, რომ ხმის სისტემები არის კომერციული ორგანიზაციები. ეს მეტა-ოტრიმანნაია მოგებაა. მოგება შეიძლება შეგროვდეს კონტექსტური რეკლამიდან, სხვა სახის რეკლამებიდან და არასაჭირო საიტების ზედა რიგებში განთავსებით. ბევრი გზა არსებობს.

ეს დამოკიდებულია აუდიტორიის ზომაზე და რამდენი ადამიანი იყენებს ამ საძიებო სისტემას. რაც უფრო დიდია აუდიტორია, მით მეტ ადამიანს ეჩვენება რეკლამა. როგორც ჩანს, მეტი რეკლამა იქნება. საძიებო სისტემებს შეუძლიათ გაზარდონ საძიებო სისტემების აუდიტორია რეკლამის ღირებულების შემცირებით, ასევე საძიებო სისტემების მომგებიანობის გაზრდით მათი სერვისების სიმძლავრის, ალგორითმისა და ძიების სანდოობის შემცირებით.

ყველაზე მოწინავე და რთული აქ არის სრულად ფუნქციონალური საძიებო ალგორითმის შემუშავება, რომელიც გამოიმუშავებს შესაბამის შედეგებს უფრო მეტი მომხმარებლისთვის.

საძიებო სისტემის და ვებმასტერების მუშაობა

კანის დახშობის სისტემას აქვს თავისი ძლიერი ალგორითმი, რომელიც პასუხისმგებელია ინფორმაციის გაანალიზებისას სხვადასხვა ფაქტორების დიდი რაოდენობის ჩართვაზე და ექიმის თხოვნაზე პასუხების კომპლექსური ტიპებისთვის:

ამა თუ იმ საიტის საუკუნე,
ვებსაიტის დომენის მახასიათებლები,
საიტის შინაარსი ნათელია,
ნავიგაციის თავისებურებები და საიტის სტრუქტურა,
გამოყენებადობა (სარგებლობა ბიზნესის მფლობელებისთვის),
ქცევითი თანამდებობის პირები (საძიებო სისტემის ამოცნობა შეუძლიათ მათ, ვინც იცის საიტის პასუხი, და პირი, რომელიც უბრუნდება საძიებო სისტემას და იქ ისევ ეძებს პასუხს იმავე კითხვაზე)
და ა.შ.

ეს ყველაფერი აუცილებელია იმისთვის, რომ სასმელი, რომელსაც დალევთ, იყოს მაქსიმალურად აქტუალური, რათა თქვენ მიერ დალეული სასმელი დაგაკმაყოფილებთ. შედეგად, ხმის სისტემების ალგორითმები თანდათან იცვლება და იხვეწება. როგორც ჩანს, საფუძვლიანობა არ აკლია.

მეორეს მხრივ, ვებმასტერები და ოპტიმიზატორები მუდმივად იგონებენ თავიანთი საიტების პოპულარიზაციის ახალ გზებს, რომლებიც ყოველთვის არ არის სამართლიანი. ინსტრუქციები საძიებო სისტემების ალგორითმისთვის - შეიტანეთ ცვლილებები მომდევნო ცვლილებამდე, რათა არ დაუშვათ არაკეთილსინდისიერი ოპტიმიზატორების "ბინძური" საიტების TOP-ში ჩამოთვლა.

როგორ მუშაობს საძიებო სისტემა?

ახლა მოდით ვისაუბროთ იმაზე, თუ როგორ მუშაობს ხმის სისტემა უპრობლემოდ. იგი შედგება მინიმუმ სამი ეტაპისგან:

სკანირება,
ინდექსირება,
რეიტინგში.

ინტერნეტში საიტების რაოდენობა უბრალოდ ასტრონომიულია. ხოლო კანის საიტი არის ინფორმაცია, საინფორმაციო შინაარსი, რომელიც შექმნილია მკითხველების (ცოცხალი ადამიანების) მიერ.

სკანუვანია

ეს ნიშნავს ინტერნეტის ძიებას ახალი ინფორმაციის შესაგროვებლად, შეტყობინების გასაანალიზებლად და ახალი შინაარსის მოსაძებნად, რომელიც შეიძლება მოძებნოთ თქვენს კითხვაზე პასუხის მისაღებად. სკანირებისთვის ხმის სისტემებს აქვთ სპეციალური რობოტები, რომლებსაც ხმის რობოტები ან ობობები ეწოდებათ.

საძიებო რობოტები არის პროგრამები, რომლებიც ავტომატურად მოძრაობენ ვებსაიტებზე და აგროვებენ მათგან ინფორმაციას. Skanuvannya mozhe buti pervinnim (რობოტი ჯერ ახალ საიტზე გადადის). საიტიდან ინფორმაციის თავდაპირველი შეგროვებისა და საძიებო სისტემის მონაცემთა ბაზაში შეყვანის შემდეგ, რობოტი იწყებს რეგულარულად მის გვერდებს. თუ რაიმე ცვლილება განხორციელდა (დამატებულია ახალი კონტენტი, წაშლილია ძველი), მაშინ ყველა ეს ცვლილება ჩაიწერება საძიებო სისტემის მიერ.

საძიებო სისტემის მთავარი ამოცანაა მოიძიოს ახალი ინფორმაცია და მიაწოდოს იგი საძიებო სისტემას დამუშავების შემდეგი ეტაპისთვის, შემდეგ ინდექსაციისთვის.

ინდექსირება

საძიებო სისტემას ინფორმაციის მოძიება შეუძლია მხოლოდ იმ საიტებიდან, რომლებიც უკვე ჩამოთვლილია მის მონაცემთა ბაზაში (მის მიერ ინდექსირებული). ისევე როგორც მცოცავი არის სხვა საიტიდან ინფორმაციის ძიების და შეგროვების პროცესი, ინდექსირება არის ამ ინფორმაციის საძიებო სისტემის მონაცემთა ბაზაში შეყვანის პროცესი. ამ ეტაპზე საძიებო სისტემა ავტომატურად იღებს გადაწყვეტილებებს, თუ როგორ შეიტანოს ეს და სხვა ინფორმაცია მის მონაცემთა ბაზაში და სად შეიტანოს იგი, ბაზის რომელ განყოფილებაში. მაგალითად, გუგლი ინდექსირებს ინტერნეტში მისი რობოტების მიერ მოძიებულ თითქმის ყველა ინფორმაციას, ხოლო Yandex უფრო ძლიერია და არა ყველაფერს.

ახალი საიტებისთვის ინდექსირების ეტაპი შეიძლება უფრო გრძელი იყოს, რაც ნიშნავს, რომ საძიებო სისტემების წყალობით ახალი საიტების სკანირება შესაძლებელია დიდი ხნის განმავლობაში. და ახალი ინფორმაცია, რომელიც ჩნდება ძველ, გადაუხვევ საიტებზე, შეიძლება რაც შეიძლება სწრაფად იყოს ინდექსირებული და თითქმის მაშინვე მოთავსდეს „ინდექსში“, შემდეგ საძიებო სისტემების მონაცემთა ბაზაში.

რანჯუვანია

რეიტინგი არის ინფორმაციის შერჩევა, რომელიც ადრე იყო ინდექსირებული და შეყვანილი ამა თუ იმ საძიებო სისტემის მონაცემთა ბაზაში, რანგის შემდეგ, ისე, რომ რა ინფორმაციას საძიებო სისტემა წინასწარ გვიჩვენებს თავის კორესპონდენტებს და რომელი ინფორმაცია გაიგზავნება ჩვენ ვართ ეძებს უფრო დაბალ "წოდებას". რეიტინგი შეიძლება მიიყვანოთ თქვენი კლიენტის - კლიენტის ხმის სისტემის სერვისის ეტაპზე.

საძიებო სისტემის სერვერებზე მონაცემები მუშავდება და მუშავდება სხვადასხვა მოთხოვნების ფართო სპექტრისთვის. სწორედ აქ იწყებს რობოტი ხუმრობის ალგორითმების გამოყენებას. ყველა საიტი შედის მონაცემთა ბაზაში და კლასიფიცირებულია თემების მიხედვით, თემები იყოფა მოთხოვნის ჯგუფებად. აპლიკაციების ჯგუფების კანის მიხედვით, წინა ხედი შეიძლება დაიკეცოს, რადგან შესაბამისად დარეგულირდება.

გამარჯობა, ბლოგის საიტის თანამემამულე მკითხველებო. , მაშინ უამრავ კორისტუვაჩს ჰქონდა საკმარისი სიმძლავრის სანიშნეები. თუმცა, როგორც გახსოვთ, გეომეტრიულ პროგრესირებაში ყოფნისას უფრო რთული გახდა მის მრავალფეროვნებაზე ნავიგაცია.

შემდეგ გამოჩნდა კატალოგები (Yahoo, Dmoz და სხვები), რომლებშიც მათ ავტორებმა დაამატეს და დაალაგეს სხვადასხვა საიტები კატეგორიებად. ამან მაშინვე გაუადვილა ცხოვრება მათთვის, ვინც ჯერ კიდევ აჭარბებს მომგებიანთა რაოდენობას მსოფლიო მასშტაბით. უამრავი ცოცხალი კატალოგია.

მხოლოდ ერთი საათის შემდეგ, მათი მონაცემთა ბაზების ზომა იმდენად დიდი გახდა, რომ დეველოპერებმა მაშინვე დაიწყეს ფიქრი მათ შორის ძიების შექმნაზე, შემდეგ კი ინტერნეტში ყველაფრის ინდექსირების ავტომატური სისტემის შექმნაზე, რათა ის ყველასთვის ხელმისაწვდომი ყოფილიყო. მეშინია მათი.

რუსული ინტერნეტ სეგმენტის ძირითადი ხმის სისტემები

როგორც თქვენ წარმოიდგინეთ, ეს იდეა დიდი წარმატებით განხორციელდა, გარდა იმისა, რომ ყველაფერი კარგად აღმოჩნდა მხოლოდ რამდენიმე კომპანიისთვის, რომლებმაც მოახერხეს გადარჩენა ინტერნეტში. შესაძლოა, ყველა ხმის სისტემა, რომელიც გამოჩნდა პირველ გამოცემაში, ან გამოჩნდა ან ჯერ კიდევ ცოცხალი იყო, ან შეიძინა შორეულმა კონკურენტებმა.

ხმის სისტემა ძალიან რთული და, რაც მთავარია, რესურსზე ინტენსიური მექანიზმია (სასწორზე არა მხოლოდ მატერიალური რესურსებია, არამედ ადამიანურიც). ზარის, ან Google-ის მისი ასკეტური ანალოგის მიღმა არის ათასობით ჯაშუშური პროგრამა, ასობით ათასი სერვერი და მილიარდობით დოლარის დეპოზიტები, რომლებიც აუცილებელია ამ აპარატის მუშაობის გასაგრძელებლად. დაკარგა კონკურენტული უპირატესობა.

ამ ბაზარზე ერთდროულად შესვლა და ნულიდან დაწყება უფრო უტოპიაა, ვიდრე რეალური ბიზნეს პროექტი. მაგალითად, მსოფლიოს ერთ-ერთი უმსხვილესი კორპორაცია, მაიკროსოფტი, ათწლეულების განმავლობაში ცდილობს ფეხის მოპოვებას საძიებო ბაზარზე და ახლა მისი საძიებო სისტემა Bing ნელ-ნელა იწყებს საკუთარი შეხედულებების გამართლებას. მანამდე იყო ძალიან ცოტა წარუმატებლობა და წარუმატებლობა.

რა შეგვიძლია ვთქვათ მათზე, ვისაც განსაკუთრებული ფინანსური შემოდინების გარეშე სჭირდება ამ ბაზარზე შესვლა. მაგალითად, ჩვენს ხელნაკეთ ხმის სისტემა Nigma-ს აქვს ბევრი ღირებულება და ინოვაცია თავის არსენალში და მათი ავანსები ათასობითჯერ ეძლევა რუსული ბაზრის ლიდერებს. მაგალითად, გადახედეთ Yandex აუდიტორიას:

ამასთან დაკავშირებით, შეგიძლიათ გაითვალისწინოთ, რომ RuNet-ისა და მთელი ინტერნეტის მთავარი (ყველაზე მოკლე და წარმატებული) საძიებო სისტემების სია უკვე ჩამოყალიბებულია და მთელი ინტრიგა ძირითადად მდგომარეობს იმაში, თუ ვინ მოკლეს და რაში. რათა გავყოთ ისინი არა პროცენტულად, რადგან ყველა სუნი გაქრა. და დაკარგა წყალში.

ხმის სისტემების ბაზარი რუსეთშიმართლაც კარგად გამოიყურება და აქ, მელოდიური, შეგიძლიათ ნახოთ ორი ან სამი მთავარი ხრეში და რამდენიმე სხვა. RuNet-ში შეიქმნა უნიკალური სიტუაცია, რომელიც განმეორდა, როგორც მე მესმის, მსოფლიოს მხოლოდ ორ ქვეყანაში.

მე ვსაუბრობ მათზე, რომ Google-ის საძიებო სისტემამ, რომელიც რუსეთში 2004 წელს ჩამოვიდა, ჯერ ვერ მიაღწია ლიდერობას. ფაქტობრივად, ამ პერიოდში დაიწყო სურნელების გაჩენა, იყიდე Yandex, მაგრამ იქ არ გამოვიდა და ამავდროულად „ჩვენი რუსეთი“ ჩეხეთთან და ჩინეთთან ერთად და ამ ადგილებთან ერთად, ყოვლისშემძლე Google-მა არ აღიარა. ზიანი, მაშინ მიიღე, არის სერიოზული ოპერაციები.

მართლაც, გააუმჯობესე წარმოების წისქვილი ზუსტად შუაში საუკეთესო ჯოკერები RuNet-ზეიქნებ ვინმე. ყველაფერი რაც თქვენ უნდა გააკეთოთ არის ჩასვით ეს URL თქვენი ბრაუზერის მისამართის ზოლში:

http://www.liveinternet.ru/stat/ru/searches.html?period=month;total=yes

მარჯვნივ არის ვიკორისტების უმეტესობა მათ საიტებზე და ეს URL საშუალებას გაძლევთ მიიღოთ სტატისტიკა სხვადასხვა საძიებო სისტემიდან რეკლამების წვდომის შესახებ ყველა საიტზე, რომელიც შედის RU დომენის ზონაში.

მითითებული URL-ის შეყვანის შემდეგ, თქვენ იქნებით არც თუ ისე მიმზიდველი და პრეზენტაბელური, მაგრამ უკეთ წარმოადგენთ სურათის არსს. ყურადღება მიაქციეთ პირველ ხუთ საძიებო სისტემას, საიდანაც რუსული საიტები აშორებენ ტრაფიკს:

ასე რომ, რა თქმა უნდა, რუსული შინაარსის ყველა რესურსი არ არის განთავსებული ამ ზონაში. ასევე SU, და RF და ფარულ ზონებში, როგორიცაა COM ან NET, ასევე არსებობს ინტერნეტ პროექტები, რომლებიც ორიენტირებულია RuNet-ზე, მაგრამ მიუხედავად ამისა, არჩევანი მაინც საკმაოდ წარმომადგენლობითია.

ეს კონტენტი შეიძლება უფრო სწრაფად დალაგდეს, მაგალითად, თქვენი პრეზენტაციისთვის ამ ზომით:

არსი არ იცვლება. რამდენიმე ლიდერი და მრავალი მაღალი დონის ხმის სისტემა. სანამ ვისაუბრებდი, უკვე დავწერე ბევრ მათგანზე. ხანდახან რთულია წარმატების ისტორიაში ჩაღრმავება ან, შესაძლოა, პერსპექტიული ხმის სისტემების წარუმატებლობის მიზეზების შესწავლა.

კარგი, რადგან ისინი მნიშვნელოვანია რუსეთისთვის და მთლიანად RuNet-ისთვის, მე მათ შევწყვეტ და მოკლე დემონსტრირებას გავაკეთებ:

გუგლის ძიება მოძველდა პლანეტის მდიდარი მაცხოვრებლებისთვის - მათ შესახებ, რომელთა წაკითხვაც შეგიძლიათ ამის გულისთვის. ამ საძიებო სისტემაში საჭიროა "შედეგის გადაცემის" ვარიანტი, თუ თქვენ შეაგროვეთ სიგნალები მთელი მსოფლიოდან და ასევე თქვენი ოჯახიდან, მაგრამ სამწუხაროდ, ის მიუწვდომელია (მიღებულია google.ru-ზე) .

ასე რომ, დარჩენილი დრო ნაკლებად იშურებს და მათი სახეობის ბრწყინვალებაა (საძიებო სისტემის შედეგების გვერდი). მითუმეტეს, თავიდანვე ვიწყებ RuNet mirror-ის საძიებო სისტემას (აქ, სწორედ ამ ხმაზე ვსაუბრობ მანამდე) და უბრალოდ არ ვიცი რაიმე გონივრული გზა, მივდივარ Google-ში.

შეხედე მათ გარეგნობას, ამან გამახარა, მაგრამ დანარჩენ დროს უბრალოდ მეძინება - ერთი საათის განმავლობაში გატარება ძალიან საგიჟეა. შესაძლებელია, რომ ამჟამინდელმა ბრძოლამ კონტექსტური რეკლამიდან შემოსავლის გაზრდისკენ და მუდმივი ცვლილებებით, როგორც SEO-ს პოპულარიზაციის დისკრედიტაციის გზამ, შეიძლება გამოიწვიოს შემობრუნების მომენტი. RuNet-ში არის ცნობილი კონკურენტი, რომლის საძიებო სისტემაც ასეთია.

მე ვფიქრობ, რომ ნაკლებად სავარაუდოა, რომ კონკრეტულად გადახვიდეთ Go.mail.ru-ზე Runet-ზე მოსაძებნად. ამრიგად, საძიებო სისტემის გამოყენებით მნიშვნელოვან პროექტებზე ტრაფიკი შეიძლება იყოს ბევრად უფრო მაღალი, მინიმუმ ათი ასეული. ასეთი პროექტების მფლობელებმა სისტემისადმი პატივისცემა უნდა გაზარდონ.

ამასთან, ინტერნეტის რუსულ სეგმენტში საძიებო სისტემების ბაზარზე ლიდერების მკაფიო გამონათქვამების გარდა, ასევე არის არაერთი ტრეიდერი, რომელთაგან ზოგიერთი დაბალია, მიუხედავად მათი არსებობის ფაქტისა, ეს იქნებოდა რთულია მათზე რამდენიმე სიტყვის თქმა.

მოძებნეთ RuNet სისტემები სხვა ეშელონიდან

ხმის სისტემები მთელი ინტერნეტისთვის

დიდი რახუნკოს უკან, მთელი ინტერნეტის მასშტაბით, მხოლოდ ერთი სერიოზული საფლავი დგას. Google. ეს გიჟი ლიდერია, მაგრამ კონკურენცია მაინც აქვს.

ჯერ ერთი, ისევ იგივეა ბინგრომელსაც, მაგალითად, ძალიან კარგი პოზიცია აქვს ამერიკულ ბაზარზე, მით უმეტეს, რომ მიჩნეულია, რომ მისი ძრავა ერთნაირად იმარჯვებს Yahoo-ს ყველა სერვისზე (შეიძლება მთელი ბაზრის მესამედი აშშ-ს მიხედვით).

სხვაგვარად, მსოფლიოს დიდ ნაწილში, რასაც კორისტუვაჩები ჩინეთიდან აყენებენ ინტერნეტში კორისტუვაჩების დიდ უმრავლესობას, მათ მთავარ ხმის სისტემას ე.წ. ბაიდუჩასმულია სინათლის ოლიმპოს ცენტრში. 2000 ადამიანში დაბადებული, მისი წილი ახლა ჩინეთის მთლიანი ეროვნული აუდიტორიის თითქმის 80%-ს შეადგენს.

მნიშვნელოვანია ამის გარკვევით თქმა ბაიდაზე, მაგრამ ინტერნეტში მზარდი ტენდენციაა და ამ ტოპში ადგილი უკავია არა მხოლოდ ყველაზე რელევანტურ საიტებს, არამედ მათ, ვინც გადაიხადა (არა შუაში საძიებო სისტემა), და არა SEO ოფისი). რა თქმა უნდა, კომერციულ ასპექტამდე გვიჭირს.

თუ სტატისტიკას გადავხედავთ, ცხადი ხდება, რატომ არის Google-ის სურვილი დაკარგოს თავისი მონაცემები კონტექსტური რეკლამიდან მეტი შემოსავლის სანაცვლოდ. ფაქტობრივად, დაქირავებულთა ნაკადის არ ეშინიათ, რადგან უმეტეს შემთხვევაში წასასვლელი არსად აქვთ. ეს სიტუაცია ცოტა მოგბეზრდებათ, მაგრამ გაინტერესებთ რა მოხდება შემდეგ.

საუბრის წინ, იმისათვის, რომ კიდევ უფრო გაურთულდეს ცხოვრება ოპტიმიზერებს და, შესაძლოა, საძიებო სისტემის სიმშვიდის წახალისების მიზნით, Google-მა ახლახან შემოიღო სტაგნატური დაშიფვრა ბრაუზერიდან საძიებო სისტემაში მოთხოვნის გადაცემისას. მალე აღარ იქნება შესაძლებელი ექიმებისა და ექიმების სტატისტიკაში ასახვა, თუ რა სახის შეკითხვებზე მოვიდა ხალხი Google-იდან.

რა თქმა უნდა, ამ პუბლიკაციაში ნახსენები ხმის სისტემების გარდა, არსებობს ათასობით სხვა - რეგიონალური, სპეციალიზებული, ეგზოტიკური და ა.შ. მათი ზედმეტად ახსნა და აღწერა ერთი სტატიის ფარგლებში შეუძლებელი იქნება და, გულწრფელად რომ ვთქვათ, არ არის საჭირო. მოკლედ ვთქვათ რამდენიმე სიტყვა მათ შესახებ ხუმრობა ადვილი არ არისდა არ არის ადვილი ან იაფი მისი განახლება.

მნიშვნელოვანია, რომ სისტემების უმეტესობამ იმუშაოს მსგავს პრინციპებზე (წაიკითხეთ ამის შესახებ და შესახებ) და დაიცვას ერთი და იგივე კრიტერიუმები - მიაწოდოს უკუკავშირი კლიენტებს მათი მიწოდების შესახებ. უფრო მეტიც, მტკიცებულება შეიძლება იყოს შესაბამისი (შეესაბამება კვებას), ყოვლისმომცველი და, არცთუ უმნიშვნელო, შესაბამისი (პირველადი სიახლე).

ამ პრობლემის პოვნა არც ისე მარტივია, განსაკუთრებით ექიმებისთვის, რადგან საძიებო სისტემას დასჭირდება რამდენიმე მილიარდი ინტერნეტ გვერდის, აპლიკაციების ტიპების და მათ, ვინც დაკარგა სიის ჩამოყალიბების უნარი (როგორც ჩანს) თავიდანვე იქ. იქნება ჯიშები, რომლებიც ყველაზე მეტად შეეფერება კვების კორისტუვაჩას.

ეს ზედმეტი დავალება ეფუძნება ამ გვერდებიდან სხვა ინფორმაციის დამატებით შეგროვებას რობოტების ინდექსირება. ისინი აგროვებენ შეტყობინებებს ადრე გამოქვეყნებული გვერდებიდან და იმპორტირებენ ინფორმაციას საძიებო სისტემის მონაცემთა ბაზაში. არის რობოტები, რომლებიც ახდენენ ტექსტის ინდექსირებას (პირველადი და თხევადი, რომელიც პირდაპირ ეთერშია ახალ და ხშირად განახლებულ რესურსებზე, რათა ყოველთვის იყოს წარმოდგენილი უახლესი მონაცემები).

გარდა ამისა, რობოტები იყენებენ ინდექსერებს სურათების საჩვენებლად (მათი შემდგომი ჩვენებისთვის), ფავიკონები, სარკის საიტები (მათი შემდგომი გასწორებისა და შესაძლო წებოვნებისთვის), რობოტები ამოწმებენ ინტერნეტ გვერდების ფუნქციონალურობას, როგორიცაა ძირითადი ან ვებმასტერების ინსტრუმენტების საშუალებით (აქ შეგიძლიათ წაიკითხეთ და ).

თავად ინდექსირების პროცესი და ინდექსების მონაცემთა ბაზების განახლების შემდგომი პროცესი საათებს იღებს. თუ Google-ს სურს კონკურენტებისთვის მნიშვნელოვნად მეტი კონკურენცია გაუწიოს, დაიქირავეთ Yandex, რომელიც ღირს ერთი ან ორი კვირა (წაიკითხეთ).

გამოიძახეთ ტექსტი ინტერნეტის გვერდის ნაცვლად, ხმის ძრავა არღვევს სიტყვებს ძირითად პრინციპებს, ასე რომ თქვენ შეგიძლიათ სწორი პასუხი გასცეთ სხვადასხვა მორფოლოგიურ ფორმებში მიწოდებულ სიტყვებს. ყველა მაგარი ნივთი ჰგავს Html ტეგებს, ასევე გაწმენდას. გამოსვლები წაშლილია და სიტყვები, რომლებიც აკლია, დალაგებულია ანბანის მიხედვით და მათთან ერთად მითითებულია მათი პოზიცია ამ დოკუმენტში.

ამ ხელსაწყოს ეწოდება კარიბჭის ინდექსი და საშუალებას გაძლევთ მოძებნოთ არა ვებსაიტები, არამედ სტრუქტურირებული მონაცემები, რომლებიც მდებარეობს საძიებო სისტემის სერვერებზე.

ასეთი სერვერების რაოდენობა Yandex-ში (რომელიც ძირითადად დაფუძნებულია რუსულ საიტებზე და რამდენიმე უკრაინულ და თურქულ საიტებზე) ათეულობით ან თუნდაც ასობით ათასია, ხოლო Google-ში (რომელიც ასობით სიტყვაზეა დაფუძნებული) - მილიონობით.

ბევრი სერვერი აკეთებს ასლებს, რომლებიც ემსახურება დოკუმენტების შენახვის საშუალებას და ხელს უწყობს მონაცემთა დამუშავების სიჩქარის გაზრდას (მონაცემთა დამატებითი დამუშავების დახმარებით). შეაფასეთ ხარჯები ყველას ბატონობის მხარდასაჭერად.

Zapit koristuvach nadsilatimetsya balansuvalnik navantazhennya იმ სერვერის სეგმენტზე, რომელიც ერთბაშად ყველაზე ცოტაა. შემდეგ ტარდება რეგიონის ანალიზი, თქვენი მოთხოვნის წარდგენით ხდება ხმის სისტემის მონაცემები და ტარდება მორფოლოგიური ანალიზი. თუ მსგავსი ბრძანება ახლახან დაინერგა საძიებო თანმიმდევრობაში, მაშინ თქვენ უნდა დაამატოთ მონაცემები ქეშიდან, რათა ხელი არ შეუშალოთ სერვერს.

თუ მოთხოვნა ჯერ არ არის ქეშირებული, ის გადადის რეგიონში, იშლება საძიებო სისტემის ინდექსის მონაცემთა ბაზა. თქვენ იხილავთ ყველა არსებული ინტერნეტ საიტის ჩამონათვალს, რომელთანაც შეიძლება გსურდეთ დაუკავშირდეთ კითხვამდე. დაზღვევა, როგორც პირდაპირი შესვლის, და სხვა მორფოლოგიური ფორმები და ა.შ. გამოსვლები.

იქს უნდა განახლდესრომელ ეტაპზე შედის ალგორითმი (ცალი ინტელექტი) მარჯვნივ. ფაქტობრივად, კორესპონდენტის მოთხოვნა მრავლდება მისი ინტერპრეტაციის ყველა შესაძლო ვარიანტის დიაპაზონზე და დაუყოვნებლივ იძებნება მოთხოვნების არარსებობის შემთხვევაში (საძიებო მოთხოვნების სხვადასხვა ოპერატორების დიაპაზონისთვის, რომლებიც ხელმისაწვდომია სხვებისთვის).

როგორც წესი, თითოეულ სახეობას აქვს კანის ადგილის ერთი მხარე (ზოგჯერ მეტი). დღეს კიდევ უფრო რთულია ჩინოვნიკების დიდი ნაწილის დაზღვევა. გარდა ამისა, მათი კორექტირებისთვის მათ ხელით უნდა შეაფასონ საცნობარო საიტები, რაც რობოტს საშუალებას აძლევს მთლიანად შეასწოროს ალგორითმი.

ზაგალომი, წმინდა მდინარე, რა ბნელია მარჯვნივ. პროცესის შესახებ დიდხანს შეგვიძლია ვისაუბროთ, მაგრამ ეს იმდენად ნათელია, რომ ხმის სისტემით კმაყოფილების მიღწევა ადვილი არ არის. და მომავალში იქნებიან ისეთებიც, ვისაც ეს არ ეკუთვნის, როგორც თქვენ და მე, ნაზი მკითხველებო.

Წარმატებას გისურვებ! მალე შევხვდებით ბლოგის საიტზე

შეიძლება გაგიჭირდეთ

Yandex People - როგორ უნდა ხუმრობდეს ადამიანები სოციალურ ქსელებში Apometr - უფასო სერვისი ხმის სისტემების ცვლილებების, ტიპებისა და განახლებების მხარდაჭერით DuckDuckGo - საძიებო სისტემა, რომელიც არ მოგყვებათ
როგორ შევამოწმოთ ინტერნეტის სიჩქარე (Spidtest, ინტერნეტომეტრი Yandex-დან)
Yandex ვიჯეტები - როგორ დააკონფიგურიროთ და გავხადოთ მთავარი გვერდი თქვენთვის უფრო ინფორმატიული და მოსახერხებელი
Yandex-ისა და Google-ის სურათები, ასევე მოძებნეთ სურათის ფაილი Tineye-სა და Google-ში საიტების განახლება SEObuilding.RU-ზე პოტენციური დონორების უფასო ანალიზისთვის გაგზავნილი შეძენისას Google Alerts - როგორია და როგორია?
ჩემი მარჯვნივ არის ონლაინ აღრიცხვის ან ელექტრონული დოკუმენტების მენეჯმენტის ნახვა ინტერნეტის საშუალებით
ფაილების გაზიარების უფასო სერვისები - როგორ ატვირთოთ ფოტო და ამოიღოთ შეტყობინება სურათიდან

რა არის სნაიპი და ხმის სისტემების მუშაობის პრინციპები

როგორ ვიმოქმედოთ საძიებო სისტემებით

ალგორითმები პირდაპირი და საპირისპირო ინდექსებისთვის

მათემატიკური მოდელი, რომელიც გამოიყენება რეიტინგისთვის.

რობოტული ფორმულის ღირებულების შეფასება შემფასებლების მიერ

როგორ აგროვებენ Yandex და Google თავიანთ კოლექციას

Yandex-ის ერთი საიტის რამდენ გვერდს აჩვენებს ფორმაში და ინდექსებში

როგორ განთავსდება Yandex ვებსაიტებზე არარუსული დომენის ზონებში

პს-ის ფუნქციები და გაგება

ხმის სისტემების ძირითადი მახასიათებლები

პოვნოტა.

სიზუსტე.

შესაბამისობა.

ხუმრობას ჰგავს.

Სისრულე.

ხმის სისტემების განვითარების ისტორია

რობოტული ხმის სისტემის პრინციპები

ინდექსირების მოდული.

Მონაცემთა ბაზა

ხმის სერვერი

საძიებო სისტემები რუსულ ინტერნეტში

ხმის სისტემების მეტა

საძიებო სისტემის და ვებმასტერების მუშაობა

როგორ მუშაობს საძიებო სისტემა?

სკანუვანია

ინდექსირება

რანჯუვანია

რუსული ინტერნეტ სეგმენტის ძირითადი ხმის სისტემები

მოძებნეთ RuNet სისტემები სხვა ეშელონიდან

ხმის სისტემები მთელი ინტერნეტისთვის

Რედაქტორის არჩევანი