Парсинг документов с помощью Python
Заманчиво думать о интернете преимущественно как о сборнике текстовых веб-сайтов, чередующихся с новомодным мультимедийным контентом Web 2.0, который в основном можно игнорировать для целей веб-скрапинга. Однако, интернет прежде
Школа Виктора Комлева
Фреймворк Scrapy
Предыдущие статьи  представили некоторые техники и шаблоны для создания крупных, масштабируемых и (самое главное!) поддерживаемых веб-скрейперов. Хотя это можно сделать вручную достаточно легко, многие библиотеки, фреймворки и даже
Школа Виктора Комлева
Хранение данных для парсинга сайтов
Хотя вывод на терминал может быть веселым занятием, это не особенно полезно, когда речь идет о сборе и анализе данных. Чтобы сделать большинство веб-скрейперов действительно полезными, нужно иметь
Школа Виктора Комлева
Написание Веб-пауков (краулеров)
В этой статье вы начнете изучать реальные задачи, где краулеры (пауки) будут проходить по нескольким страницам и даже нескольким сайтам. Веб-пауки называются так потому, что они «ползут» по
Школа Виктора Комлева
Веб скрапинг (парсинг) данных
Что такое веб-скрапинг? Автоматизированный сбор данных из интернета существует почти столько же времени, сколько и сам интернет. Сегодня общее мнение склоняется в пользу термина «веб-скрапинг», поэтому я буду
Школа Виктора Комлева
Парсинг сайтов с помощью Beautiful Soup
В мире, где информация является ключевым активом, умение эффективно извлекать данные из интернета становится незаменимым навыком. Представьте, что вы можете автоматически собирать актуальные новости, анализировать рыночные тренды или
Школа Виктора Комлева