Парсинг, то есть синтаксический анализ сайтов, это функция, автоматически производимая специальной программой, скриптом под названием парсер. Характер парсинга определяется заданием с заранее заданными параметрами анализа, цель которого получить со страниц сайта определенную информацию. Далее собранную информацию при помощи выбранного языка программирования предоставляют в определенном виде.
Логичными стадиями процесса парсинга являются три фазы:
- пунктуальный сбор информации, к примеру, кода интернет-страниц;
- анализ данных, с последующей их обработкой, преобразованием в требуемый формат;
- предоставление результата с выводом данных.
Чаще всего основу парсинга составляет система регулярных выражений.