Интернет-паук (web-spider) - Сеть и Интернет - Поисковые системы - Компьютерный форум
  Войти   Зарегистрироваться  

Компьютерный форум
С оплатой за сообщения



faqpk.ru
Гость

52.4.48.181
 

Страница 1 из 1 1
Компьютерный форум » Сеть и Интернет » Поисковые системы » Интернет-паук (web-spider) (поисковые системы)
Интернет-паук (web-spider)
Паук - это программа которая посешает заданные ему раннее сайты и сохраняет копию в свою базу данных, потом перемещает в хранилише. Робот одновременно находится на нескольких машинах, с помощью которых он читает новые сайты, которые ему ещё не известны, и в то же время на другой машине он заново читает уже имеющиеся сайты в базе более месяца илиболее года назад. И при каждом обновлении уже имеющейся копии сайта в базе, робот заново скачивает копию вашего сайта и заменяет её старую версию в своей базе. Но при всем при этом все машины использую одно и тоже хранилище для сохраненных копий сайта. Паралельная работа паука на нескольких машинах одновременно, позволяет пауку легко сканировать любое количество сраниц распределяя их по всем поисковым машинам, и все данные с сайтов размещаються в индексной базе данных.
Дата: Суббота, 13.03.2010. Сообщение # 1 Опер
Паук - это программа которая посешает заданные ему раннее сайты и сохраняет копию в свою базу данных, потом перемещает в хранилише. Робот одновременно находится на нескольких машинах, с помощью которых он читает новые сайты, которые ему ещё не известны, и в то же время на другой машине он заново читает уже имеющиеся сайты в базе более месяца илиболее года назад. И при каждом обновлении уже имеющейся копии сайта в базе, робот заново скачивает копию вашего сайта и заменяет её старую версию в своей базе. Но при всем при этом все машины использую одно и тоже хранилище для сохраненных копий сайта. Паралельная работа паука на нескольких машинах одновременно, позволяет пауку легко сканировать любое количество сраниц распределяя их по всем поисковым машинам, и все данные с сайтов размещаються в индексной базе данных. Техническая поддержка (Опер)
Администратор
Сообщений: 484
Нет на сайте
    

 
Ппц. Это ж какого размера должно быть хранилище, чтоб каждую секунду сохранять чтото новое, да и не забывать про старое...
Я даже представить себе не могу что там за системы установлены на поискавиках.
Да и никак понять не могу, каким образом поискавики так быстро вылаживают результаты поисковых запросов?
Ведь поиски должны за долю секунды вычислить все сайты которые соотаетствуют запросу.
Дата: Среда, 17.03.2010. Сообщение # 2 Bro
Ппц. Это ж какого размера должно быть хранилище, чтоб каждую секунду сохранять чтото новое, да и не забывать про старое...
Я даже представить себе не могу что там за системы установлены на поискавиках.
Да и никак понять не могу, каким образом поискавики так быстро вылаживают результаты поисковых запросов?
Ведь поиски должны за долю секунды вычислить все сайты которые соотаетствуют запросу.
Дмитрий Асмус (Bro)
Модератор
Сообщений: 196
Нет на сайте
    

 
Для этого нужен мощный серверный процессор! Их там не мало гдето шт 20 может быть.
Дата: Пятница, 29.07.2011. Сообщение # 3 nik99551645
Для этого нужен мощный серверный процессор! Их там не мало гдето шт 20 может быть.
Проверенный
Сообщений: 28
Нет на сайте
    

 
Компьютерный форум » Сеть и Интернет » Поисковые системы » Интернет-паук (web-spider) (поисковые системы)
Страница 1 из 1 1
Поиск: