Содержание
Содержание 2
Список сокращений 3
Введение 4
1. Анализ HTML-формата 7
1.1 HTML-формат 7
1.2 История возникновения HTML-формата 8
1.3 Преимущества и недостатки HTML-формата 10
1.4. Структура HTML-формата 11
1.5. HTML и CSS 13
1.6. HTML и JavaScript 15
Вывод по главе 17
2. Анализ методов и способов автоматического сбора информации в сети Интернет 18
2.1 Определение автоматического сбора информации в сети 18
Интернет 18
2.2 Веб-краулеры и парсеры веб-страниц 20
2.3 Как работают веб-краулеры популярных поисковых систем 25
2.4 Юридические аспекты автоматического сбора информации в сети Интернет 27
2.5 Инструменты для парсинга веб-страниц HTML-формата 28
Вывод по главе 30
3. Разработка программного обеспечения для автоматического сбора информации в сети Интернет и оценка его эффективности 31
3.1 Определение целей и планирование разработки, VPN 31
3.2 Разработка программного обеспечения для автоматического сбора информации в сети Интернет 35
3.3 Проверка свойств алгоритма 43
Вывод по главе 44
4. Расчеты экономической эффективности 45
4.1 Расчет трудоемкости проекта 45
4.2 Затраты на выполнение проекта 46
4.3 Расчет эффективности работы программного обеспечения 50
Вывод по главе 51
Заключение 53
Литература 54
Приложение А – Листинг разработанного ПО 57