Неотъемлемой частью сайта, является поиск. В этом уроке мы научимся с Вами оздавать поиск для сайта. Мы попытаемся сделать скрипт не очень большим и сложным.
ОБРАБОТКА СТРОКИ ПОИСКА
Первое, что мы делаем с запросом – это обрезаем строку поиска функцией substr:
$search = substr($search, 0, 64);
64 символа вполне хватит пользователю для поиска по сайту.
Теперь наступает очеред вырезать все опасные и не нужные нам символы из строки:
$search = preg_replace("/[^(w)|(x7f-xff)|(s)]/", " ", $search);
По идее, разрешать пользователям искать по сайту небольшими запросами из 1-2 символом нельзя – при большой посещаемости это может стать причиной большой нагрузки на сервер, поэтому ограничим поиск поисковыми фразами только больше 2 символов.
Итак, разрешим искать только по словам, которые длиннее двух букв (если ограничение больше, надо заменить "{1,2}" на "{1, кол-во символов}"):
$good = trim(preg_replace("/s([^s]{1,2})s/", " ", ereg_replace("[ ]+", " "," $search")));
Затем после замены ненужных символов неплохо было бы убрать двойные пробелы из нашего запроса (они были сделаны специально для корректного поиска коротких слов):
$good = ereg_eplace("[ ]+", " ", $good);
ЛОГИКА ПОИСКОВОГО ЗАПРОСА
Допустим, мы хотим предоставить пользователю возможность выбирать логику поиска — искать все слова или только одно из нескольких. Если вы хотите сделать как в Яндексе — два амперсанта означают "И" (слово1&&слово2&&слово3) или как-то еще, то я не советчик. Шаманство со строками на небольшом сайте imho не оправдывает затраченного времени. Поэтому форму для поиска рисуем так: искать любое из слов или искать все слова
А в поисковом скрипте лишний раз проверяем, что пользователь ввел:
if ($logic!="and" && $logic!="or") $logic = "or";
РЕЛЕВАНТНОСТЬ ПОИСКА
Наверное, в том же Яндексе все видели ссылочку "сортировать по релевантности". Это оно и есть. Сортировка результатов по количеству совпадений слов.
Отчасти, кстати, такая сортировка снимает проблему обработки логики поиска. Но с БД mysql делать такую сортировку очень сложно. Надо сперва выбрать, где есть все слова, потом записи, где разные слова (исключив предыдущие). Если у вас постраничный вывод — то вообще дело труба!
СТАТИСТИКА ПОИСКА
Неплохо будет сразу информировать пользователя, сколько он нашел строк таблицы. Для этого делается дополнительный запрос в базу:
$query = "select id from table where field like ‘%". str_replace(" ", "%’ or field like ‘%", $good). "%’";
Для статистики по отдельным словам можно сделать следующее:
$word = explode(" ", $search); while (list($k, $v) = each($word)) { if (strlen($v)>2) $stat[]="$v:". mysql_num_rows(mysql_query("select id from table where field like ‘%$v%’")); else $stat[]="$v: <font color=#cc0000>короткое</font>"; }; $word_stats ="Статистика слов: ". implode("", $stat). "<br />"; unset($stat);
ПОСТРАНИЧНЫЙ ВЫВОД РЕЗУЛЬТАТОВ
Ну, когда у нас есть макет для поиска и количество строк результата поиска, сделать постраничный поиск — пара пустяков. Проверяем переменную $page (не меньше 0, не больше $results_amount/$rows_in_page).
В запрос, который подсчитывает количество строк (смотри выше), пишем нужные нам поля и поля для сортировки. А потом дописываем
if ($page==0) $request .= "limit $rows_in_page"; else $request .= "limit ".$page*$rows_in_page. ",". $rows_in_page; (синтаксис: limit <кол-во строк> либо limit <кол-во строк отступа>, <кол-во строк>)
В результате выполнения подобного запроса мы получим именно те самые строки, которые надо выводить на странице.
Для навигации можно либо рисовать ссылки на следующую и предыдущую страницы, либо, что сложнее, делать панель навигации на несколько страниц.
if ($page>0) print ("<a href=search.php?search=". rawurlencode($good). "&page=". ($page-1). ">предыдущая страница</a>"); if ($page<$results_amount/$rows_in_page) print ("<a href=search.php?search=". rawurlencode($good). "&page=". ($page+1). ">следующая страница</a>");
ПОДСВЕТКА ПОИСКОВЫХ ФРАЗ
Для того, что бы подсветить поисковые запросы жирным шрифтом (а может быть определённым цветом, кому как больше нравиться), необходимо сделать всего лишь следующее:
$highlight = "(". str_replace(" ", "|", $good). ")";
Пробелы (а они у нас между словами стоят поодиночке, и нигде двойной пробел не встречается, к тому же с концов строки мы их тоже вырезали) достаточно заменить на вертикальную черту – разделитель вариантов в регулярных выражениях. "Плохие" слова мы не подсвечиваем, потому что в базе их не ищем :).
В коде, который выводит текст пишем:
$row["text"] = ereg_replace($highlight, "<font color=#cc0000>1</font>",$row["text"]);
Если же у вас в тексте встречаются html теги, то следует поступить вот так:
$text = eregi_replace(">([^<]*)$words", ">1<font color=#cc0000>2</font>3<", $text);
И в завершении я бы посоветовал сделать отдельную функцию, которая бы вырезала не только из поиска, но и вообще из всех полей ввода слова: INSERT, SELECT, DELETE и другие SQL команды, которые могут вызвать неприятности.
ПОДВОДИМ ИТОГ
Применяя все эти приёмы в совокупности (а именно так я и советую), можно добиться вполне неплохого поиска на собственном сайте, а вместе с этим сделать его безопасным для сайта и не дать пользователю, который хотел бы навредить сайту:
а) узнать программную структуру сайта;
б) вызвать перегрузку сервера бессмысленными запросами к базе данным;
в) пользовать не увидит ошибки, если в запрос попал запрещённый символ…
А ещё мы помогли пользователю скорее сориентироваться, сделав подсветку поисковых фраз и разделив найденный текст по страницам.