Ничего больше не потерялось!
Я даже представить себе не мог, насколько классно и удобно иметь на своем компьютере полноценный локальный поиск. Но меня заставили — не только представить, но и почувствовать всю прелесть осознания того, что ничего больше не потерялось.
Началось с того, что в новеньком ноутбуке уже была установлена искалка от MSN, поэтому мне ничего не оставалось, как только наблюдать за ее работой и получать удовольствие. Спустя совсем короткое время я начал жалеть, что на домашнем компе такого нет, а еще через неделю пожалел столь сильно, что предпринял вполне конкретные шаги для изучения вопроса. Результаты этого исследования и представляю читателю.
Предмет разбирательства
В общем-то, речь идет о вполне здравой штуке — локальной поисковой машинке, которая устанавливается на собственный компьютер и работает почти как «взрослый» поисковик. Ну а первейшая радость получается от того, что можно во мгновение ока отыскать у себя нужный документ.
Соответственно, подобная штука имеет смысл для тех, у кого на компе имеются большие архивы и завалы файлов. Даже если они хорошо рассортированы — ведь просто открыть 5-10 папок в поисках нужного файла — дело не одной минуты. А уж если в документах полный бардак — лучше локальной поисковой машины ничего не найти!
В данном тесте планирую рассмотреть наиболее качественные и авторитетные сёрчеры:
- Яндекс персональный поиск;
- MSN Search Toolbar with Windows Desktop Search;
- Google Desktop Search
for Enterprises; - Yahoo Desktop
Search.
Сначала первые два, затем, когда-нибудь (при первой же возможности) — остальные.
Как работает
Работает примерно так же, как и серьезный поисковик:
- Специальная программа «паук» обшаривает компьютер и переписывает все встречающиеся в документах (и других файлах, например, музыкальных) слова — это называется индексацией;
- Все слова записываются в специальный индексный файл — получается библиотека ссылок на все хранящиеся тут же файлы;
- Поисковый запрос обрабатывается уже поисковиком, который в результате выдает ссылки на все найденные документы.
К слову, индексация происходит в фоновом «интеллектуальном» режиме — паук шарится по файлам только когда не выполняются другие действия. Поэтому неудобства наподобие тех, которые вызывает работающий антивирус Касперского — просто не возникают.
Резон
Конечно, каждый капельку грамотный пипл мне скажет, что в Винде есть собственный поиск, который вызывается из проводника комбинацией клавиш Ctrl+F. Однако, этот поиск предназначен все же для других вещей и поэтому каждый раз он будет честно обшаривать все диски и директории, а не обращаться к компактной индексной базе. А это может занять до получаса, как у меня при объеме винта 80 гектар. Настройку, которая заставила бы его индексировать документы, мне найти не удалось.
Уточнение: все же, если в проводнике кликнуть правой кнопкой мыши на диске С, или D, или любом другом и выбрать в выпавшей менюхе «Свойства», можно обнаружить запрос на разрешение индексировать диск. То есть, Винда таки что-то для поиска имеет?
Я установил «галочку» напротив пункта «Разрешить индексирование диска для быстрого поиска», и что же?
Поиск нашей тестовой фразы (смотри ниже) «Закон о рекламе» занял примерно 5 минут, что никак нельзя назвать сколько-нибудь пристойной скоростью поиска. Но в результате — не нашлось ничего! Вообще!
Дело, думаю, в том, что виндовский поисковик начисто лишен представления о морфологии. Не обнаружив точной фразы, он успокаивается.
Второй резон — даже при отлично организованной системе хранения невозможно запомнить и, соответственно, впоследствии найти, некоторые нужные файлы. По моему опыту, если файлов больше 10 — уже можно что-то забыть.
Другой вариант: информация по какой-то теме может попасть в близкую категорию (например, старинные самолеты в авиацию, хотя могли бы — в историю) и, соответственно — потеряться. Или же — файл с информацией по какой-то теме может содержать «довесок» по другой теме, который не будет учтен при классификации. Вот именно поэтому локальные поисковики в самом деле нужны.
Есть и еще один резон, актуальный лично для меня: за несколько лет работы я накопил кучу тематических статей — экстракт лучшего, что можно найти в Интернете. Для работы лучше пользоваться именно этой подборкой, поскольку при прямом Интернет–поиске приходится, так или иначе, разгребать завалы всякого мусора. Но — коллекция неумеренно разрослась… Получился мой собственный маленький Интернет — довольно хороший, у которого теперь тоже есть поисковик.
Поскольку речь идет о поиске, будем тестировать его (поиск) с помощью фразы «закон о рекламе». Первая причина — текст самого закона у меня находится в единственном экземпляре, но имеется множество упоминаний. Будучи человеком простым и необремененным, я предпочту, чтобы нужный мне файл фигнурировал в первой десятке результатов поиска (их можно охватить одним взглядом, следовательно — отыскать сразу нужный документ).
Вторая причина — это все же трудный для поиска случай, поскольку в заголовке искомого файла дословно написано «Закон Украины «О рекламе», а это не соответствует запросу. То есть, для правильного ответа сёрчер должен проявить некоторую сообразительность. Яндекс персональный поиск
Итак, поиск бесплатной программы для локального поиска привел меня на популярный поисковик Яндекс, который предлагает всем безвозмездно (то есть даром) бесплатный десктопный сёрчер. Лежит он тут:http://desktop.yandex.ru/ , размер 2,9 метра — чтобы можно было сразу же познакомиться и скачать.
После установки программа сразу же начинает искать, о чем свидетельствует «переливчастый» значок Яндекса в трее. Но ищет не слишком активно, вероятно, чтобы не помешать (думаю, есть некоторый расчет на тормозявые машынки, доступные среднему нашему пользователю). Поэтому и полная индексация происходит не очень быстро — у меня заняла
что-то около 2-3 дней.
Тем не менее, по клику правой кнопкой доступна настройка активности индексатора, предусматривающая три положения:
- Интеллектуальная (по умолчанию);
- Принудительная (если нужно его подстегнуть);
- Отключена.
Индексация — откровенно говоря, ее интеллектуальность вызывает сомнения: никто не определяет загруженность процессора, не подстраивается под темп работы юзера, а просто — индексируем, когда за компом никого нет минут 5 примерно. Принудительная же индексация никаких заметных тормозов не вызывает (у меня 4-й пень 2 ГГц и 768 метров оперативки). Индексный файл (точнее, индексная папка) занимает у меня около 70 Мб, но при установке прога сразу же требует 100 метров пространства.
Понимание русской морфологии — важное преимущество. Это значит, что как минимум будут учитываться словоформы — Саша, Сашка, Сашко и так далее. Даже понимает «иду» и «шел» — честь ему и хвала! И даже (черт побери!) — он понимает украинский — на запрос «Денис Сухинин» находит в том числе и «Денис Сухінін». Чертовски умная машинка!
Зато предложения и обороты понимать не хочет — чего же еще можно ожидать от софтины длиной всего 2,9 метра… То есть, мы имеем существенно кастрированную версию яндексовского поисковика.
Запрос — мы уже немного разобрали, как наш десктоповый сёрчер разбирается с запросами. Сюда же нужно добавить, что он вполне вменяем к универсальным операторам поиска, что делает машинку удобной и для бывалого интернетчика. Открывается в окне браузера, который по умолчанию — не очень удобно, поскольку нужно ждать его загрузки или держать в фоне, если поиск приходится делать часто.
Архивы — немаловажно, что он не брезгует покопаться в Раровских и Зиперских архивах. А в ответ на клик по ссылке, открывает архивленный файл, то есть, работает удобно.
Разборчивость — обнаружился неожиданный недостаток, который я признал критичным. ОН НЕ ВИДИТ КАРТИНОК!!!! А ведь у меня немаленький архив фотографий. Тут нужно пояснить, если кто не знает: файлы фото, видео и музыки могут содержать довольно большой объем скрытой информации — название, описание, комментарии, ключевые слова для индексации (вот оно!!!). Поскольку эта
проблема для меня критична, буду менять Яндекс на что-то другое. Скорее всего — Google Desktop Search.
Пример — запрос «Закон о рекламе» обрабатывается посредственно — файл с текстом закона оказался на пятой позиции списка, чего себе не позволяет дажеMSN Search Toolbar with Windows Desktop Search. Причем, при традиционной форме представления результатов (когда по умолчанию на странице представлен поиск в документах, файлах, письмах), которая включается при запуске, ссылка на нужный файл оказалась за пределами поискового поля. Вражеский MSN
На самом деле довольно дружелюбный, хоть и весит 8,8 Мб.MSN Search Toolbar with Windows Desktop Search мне достался в ноутбуке, хотя, для личных целей его опять-таки бесплатно можно взять прямо на сайте.
Первое, что бросается в глаза при использовании — возможность искать прямо из панели задач, для чего там имеется поисковая строка (и которая отсутствует уЯндекс персональный поиск). Это довольно удобно, поскольку не нужно ждать, пока загрузится браузер — достаточно просто ввести слово. Но даже и более того — поиск по индексной базе происходит довольно шустро: вслед за каждой введенной буквой в специальном окошке тут же появляются отсортированные ссылки. То есть, важное преимущество — оперативность.
Для более глубокого и объемного поиска все же открывается браузер, который уже предоставляет полный функционал: сортировка файлов, картинок, писем и так далее, сортировка по релевантности, отсылка к поиску в Интернете (его можно настраивать, хотя, кажется, из полезных нам поисковиков, есть только Google).
Индексация субъективно происходит быстро и незаметно, только по окончании процесса всплывает специальное указующее окошко. Все файлы в ноутбуке — примерно пятая часть от количества оных в домашнем компе — были проиндексированы за 3-4 часа примерно. Также имеется возможность выбрать тип индексации, но можно смело утверждать, что она происходит намного эффективнее и интеллектуальнее, чем у Яндекса.
Запрос — понятливость относительно морфологии, боюсь, ограничена английскими словоформами. Поэтому высокий ключ поиска будет нам недоступен. Однако, лично мне не пришлось от этого страдать — среди своей избранной коллекции файлов делать поиск можно и по единственному поисковому слову. Кроме того, MSN Search Toolbar отказывается использовать управляющие символы, что довольно большое свинство — я же их выучил! Может быть, в поиске по-английски он настолько умен, что эти символы не нужны, но я не настолько силен в английском.
Просмотр — программа оснащена просмотром отысканных файлов (то есть, их как бы не нужно открывать, скажем, в Ворде каждый раз, чтобы узнать, что же внутри). Это как бы хорошо, наверное. Если бы работала эта смотрелка хоть на 10% так же быстро, как все остальное. На самом же деле, открытие в браузере вордовского документа занимает не меньше времени, чем открытие его в Ворде — смысл функции просмотра теряется. Хотя, html-ки он открывает немного быстрее.
Архивы — умеет.
Пример — упомянутый уже запрос «Закон о рекламе», на котором сломал зубы Яндекс персональный поиск, отработан отлично. Текст закона оказался на первой позиции по релевантности, как это и должно быть.
Google Desktop Search for Enterprises

Согласно словарю Enterprise — это предприимчивость, находчивость, смелость. Должен сказать, что Гуглю этих качеств не занимать. Потому что когда я поставил его взамен Яндекса, то только и мог, что все время повторять «Вау» и целый день напролет изучать эту штукенцию. Потому что не смотря на размер файла всего-то 2,2 Мб,Google Desktop Search for Enterprises реально рулит.
Индексация происходит довольно шустро — за пару часов он прошерстил 40% моих файлов. Но это — в режиме принудительного поиска. А вообще-то, GDS (будем так его называть для краткости) сообщил мне о полной индексации всех файлов компьютера на третий день после установки (фактически, индексация заняла 2 дня).
Кроме того, GDS понимает важность всего нового и быстренько индексирует все, чего накопировали и насоздавали. Не прошло и минуты (!!!!!), как новые только что добавленные файлы можно найти! Также оперативно (несколько секунд) он удаляет из индекса
упоминания об удаленных файлах, что приятно и удобно, поскольку не приходится кликать по «дохлым ссылкам».
Запрос — относительно понятливости к русской морфологии, ситуация та же, что и у MSN — с великим и могучим не дружим. Однако, как уже было сказано, для локального поиска в этом нет особой проблемы. Наш традиционный тестовый запрос «Закон о рекламе» показал нешуточную релевантность — текст закона был на второй ссылке, а на первой — эта самая статья (в ней искомая комбинация слов хоть и не находится в заголовке, но наиболее полно соответствует форме запроса, а в искомом тексте написано «Закон Украины «О рекламе»«, что очень мало напоминает текст запроса). В общем, можно сказать, что по релевантностиGDS экзамен сдал.
Просмотр — тоже хорошая и полезная штука. Как только вводишь запрос, открывается окошко результатов. Правда, в отличие от MSN, результаты не разбиваются на категории, поэтому немного труднее воспринимаются в эдакой «окрошке». По нажатию Enter поиск открывается в окне браузера в полноценном варианте.
Advanced Search становится доступным в окне браузера — что-то вроде «продвинутого поиска». Он позволяет настраивать предъявление результатов: по дате, типу файлов (письма, веб, чат и так далее), а также по ключевым словам (можно устанавливать не только те, которые обязательно должны быть в письме, но и те, которых там быть не должно).
Архивы — умеет индексировать zip-архивы, однако, нетрудно скачать и установитьгаджет, который позволяет усовершенствовать работу с архивами.
Функционал — такого пункта нет в характеристиках других сёрчеров, однако, для GDS пришлось его ввести. Поскольку функциональность программы просто беспредельная. Прежде всего, это касается настройки — такое впечатление, что настраивать можно все. Настройка происходит через web-интерфейс, поэтому не составляет никаких трудностей.
Однако, есть в этом и недостаток — поначалу наличие многих возможностей (а в особенности — необходимость все читать по-аглицки) немного нервирует и раздражает. Но это — примерно на протяжении одного дня, не больше.
Строка запроса — даже такую простую штуку нужно подробно описать, поскольку GDS реализовал ее просто отлично. Запрос можно сделать из командной строки в панели инструментов, из плавающей строки (floating deskbar), из панельки Quick Search Box, которая вызывается двойным нажатием на Ctrl, и из боковой панели.
Боковая панель (Sidebar) — пришлось вынести в отдельную категорию. Потому что она позволяет совершенно дикую функциональность за счет оснащения сменными гаджетами (по терминологии GDS). По сути, они похожи навиджеты, которые не очень удачно реализованы в Опере 9.02. Здесь они на месте и не поглощают бесконтрольно ресурсы системы.
Сама панель может гибко настраиваться, сюда можно встраивать новые панельки, или убирать ненужные. Например, у меня пока стоят:
- строка поиска
- записная книжка (напоминалки)
- часики (аналоговые)
- подборка новостей в формате RSS или Atom с определенных интересных мне сайтов
- слайд-шой из моих фотографий
- монитор трафика
- погода в Киеве
- список дел
- быстрый показ посещенных страниц (можно настраивать последние посещенные или часто посещаемые)
Настройка — поначалу меня раздражало большое количество старых писем, напоминаний и заметок из календаря в результатах поиска (другие сёрчеры такого не допускали). Пришлось лезть в настройки, где я обнаружил широкие возможности настройки индексации типа файлов. Написано даже, что можно индексировать защищенные паролями документы Office, что лично у меня вызвало некоторые вопросы. Однако, не будем лезть поперед бацька в пекло.

Интеграция — внимательный читатель, конечно же, заметил, что результаты поиска открываются вОпере.GDS этот браузер не признает: говорит «Your browser is not currently supported by Google Desktop» — что-то наподобие «…у вас неправильный браузер», однако, работает вполне корректно.
Единственная проблема — через Оперу не устанавливаются дополнительные папки на других дисках для индексирования — придется воспользоватьсяIE.
Все, чего не хватает, можно закачать и установить дополнительно. Достаточно заглянуть в раздел About Google Desktop в преференсах. Мне не хватало индексирования раровских архивов — я установил соответствующий гаджет. Также я установил гаджет для сканирования истории и ссылокОперы, и еще один для того, чтобы можно было составлять индексыCD и DVD дисков.
Результаты — представление оных в веб-интерфейсеGDS-а не отличается наглядностью (отсутствует четкое, зрительно-воспринимаемое разделение категорий), однако, тут есть широчайшие возможности по сортировке. Можно выбрать просмотр всего, писем, файлов, истории посещенных веб-страниц, чатов и прочего. Если выбрать меню «файлы», то открывается подменюха, которая позволяет отбирать файлы определенного типа: doc, ppt, xls, jpg, avi, html, pdf и др.
Если же выбрать пункт email, то подменю сортировки позволяет отсортировать от кого и к кому письма. К тому же, просмотр всех отысканных писем, визитных карточекOutlook, Задач, превьюшек фотографий и так далее происходит тут же в браузере (и его же ресурсами), что значительно сокращает время.
Вот, скажем, MSN Search Toolbar with Windows Desktop Search для просмотра файлов открывает соответствующую программу, даже если просмотр происходит в нем же. А это каждый раз требует пару секунд. В процессе поиска, когда приходится листать найденные ссылки, эти секунды складываются в минуты. Да к тому же — просто бесят.
Удаление файлов из индекса — очень важная и удобная штука. Например, в результатах поиска мы видим несколько одинаковых файлов (например, старых из архива). GDS позволяет удалить файлы по выбору из результатов поиска и индексного файла. Последнее также имеет значение из соображений безопасности, ведь получивший доступ к индексному файлу злоумышленник многое про нас может узнать.
Результат — GDS на сегодня безусловный лидер.
Индейцы что-то не вкурили
Следующий подсудимый вызвал у меня чувство искреннего и даже какого-то детского недоумения: ожидая от знаменитой Яхи примерно той же крутизны, что и от Гугля, я жестоко обманулся. Кстати, скачать эту красавицу можно тут:Yahoo Desktop Search, но делать это категорически не советую. Дело в том, что Яхнутый десктоповый сёрчер, кажется, делали изрядно пьяные индейцы (вдруг кто-то не знает: Yahoo будто бы означает боевой крик индейцев), потому что понять что-либо просто невозможно. Но — обо всем по порядку.
Индексация — при том, что все остальные участники теста колупались с индексацией в среднем 2-3 дня, наш другYDS (будем его так называть для краткости) заявил про окончание индексации через 10 минут!!!!!!!!!!!. О чем это может говорить?…
Стандартная поисковая фраза — разумеется, ее никто не нашел, как никто не нашел ни одного другого запроса (сейчас у меня закралось подозрение, что отсутствие желания что-либо искать происходит из-за идиосинкразии к русскому языку, но проверить это уже невозможно).
Собственно, я сделал три честные попытки понять, как же работает эта штука. И ни разу эти попытки не увенчались успехом. Разумеется, я не настолько мазохист, чтобы продолжать дальше, поэтомуYDS был без всякого сожаления срублен, убит и расстрелян, как
социально вредный и полностью бесполезный продукт. Вот и вся недолга. Безопасность
Как правило, локальные поисковики сами по себе не представляют никакой опасности для пользователя. Однако, некоторые угрозы все же имеются, но происходят они прежде всего от неграмотности самого юзера.
Так, Google Desktop Search может хранить индексный файл не на локальном компьютере пользователя, а на сервере, что может представлять некоторую теоретическую опасность, в случае, если кто-то прознает пользовательский пароль. — было написано на некоем форуме. Разумеется, я обеспокоился и стал искать информацию. Нашел — это неправда. Есть там правда функция поиска на нескольких компьютерах (Search Across Computers — например, у меня домашний компило, на работе компло, да еще и нотебяка чтобы на даче не скучать). Думаю, в этом случае индексный файл всех трех компов будет лежать таки в нете (и/или дублироваться на каждом из них).
Яндексовский сёрчер считает, что гарантия безопасности — это ограничение доступа к определенным папкам. Где-то он прав.
Резюме
Кажется, уже есть чего подытожить. В лидеры вырвалсяGoogle Desktop Search for Enterprises как по функциональности, так и по удобству. Единственный его недостаток — неумение индексировать rar-архивы. Ну и что же… Будем все хранить в zipах.




