Издательский дом ООО "Гейм Лэнд"ЖУРНАЛ ХАКЕР #102, ИЮНЬ 2007 г.

Пингвинья ищейка

Сергей «grinder» Яремчук

Хакер, номер #102, стр. 102-102-1

(grinder@ua.fm)

Beagle: приложение для организации поиска персональных данных на локальной машине

Объемы современных жестких дисков позволяют хранить колоссальное количество самой разнообразной информации. Но без определенной систематизации и наличия быстро работающей программы поиска весь архив может превратиться в бесполезные залежи, занимающие место на диске и не приносящие никакой пользы. Пользователи, работающие в Windows, уже давно используют удобные приложения, позволяющие найти любую информацию в локальной системе: Google Desktop, Ищейка, AVSearch, Spotlight. Теперь приложения с подобной функциональностью (и даже лучше) есть и для Linux.

Что было раньше

Начинающие пользователи Linux обычно теряются, столкнувшись с проблемой поиска нужного файла или отрывка текста. Исторически сложилось так, что во всех *nix-системах преобладают текстовые, а не бинарные форматы, для редактирования которых достаточно обычного текстового редактора. Здесь даже в офисных пакетах, появившихся несколько позже, используется XML-подобный, то есть текстовый, формат. Для поиска информации в документах LaTeX, веб-файлах html, текстовых, конфигурационных файлах и некоторых других применяются обычные утилиты, алгоритм работы которых оттачивался годами. Поэтому для поиска текстового фрагмента в любой книге или форуме тебе предложат попробовать что-то из grep, slocate и find. Используя эти утилиты, можно найти все и вся в любую погоду, время суток и при любом настроении. Например, чтобы найти все скрипты в /etc, в которых упоминается утилита iptables, вводим:

$ sudo grep -r "iptables" /etc

Либо:

$ sudo find /etc -name '*.conf' -print | xargs grep "iptables" /dev/null

Но так было во времена, когда системой пользовались исключительно профессионалы. Смена ориентировки на обычного пользователя потребовала соответствующих приложений, которые могут найти информацию в документах разного типа, внутри архивов, тэгах музыкальных файлов и т.д. Все это должно работать быстро, быть удобным и понятным простому пользователю.

Поисковая машина Beagle

Приложение Beagle (beagle-project.org) - это уникальная поисковая машина, написанная на Mono (свободной альтернативе Microsoft .NET для Linux), которая предоставляет пользователям Linux довольно мощную и удобную систему поиска любой информации в свалках каталогов. Его основой послужила free/open source кроссплатформенная библиотека Lucene (lucene.apache.org), первоначально разработанная на Java, а затем перенесенная на другие языки: Perl, PHP, C++, Python, Ruby и C#. Порт для последнего - Lucene.Net (incubator.apache.org/projects/lucene.net.htm) - и используется при индексации.

Проект Beagle был назван самым ожидаемым продуктом 2005 года. После того как компания Ximian, которая разрабатывала Beagle, была выкуплена Novell, проект получил значительную поддержку (в том числе и финансовую) и стал развиваться значительно быстрее. И хотя в настоящий момент разработка еще далека до финального релиза, включение пакетов Mono и использующих их приложений в такие дистрибутивы, как Fedora Core и OpenSuse, вселяет надежду, что Ищейка будет развиваться и дальше.

Содержание  Вперед на стр. 102-102-2
ttfb: 23.593902587891 ms