Парсер документации PEP

О проекте

Scrapy парсер официальной документации Python. Поддерживает следующие режимы:

Получение информации о всех доступных версиях Python и их статусах.
Сбор статистики количества по статусам всех PEP-документов.

Используемый стек

Python 3.9+
Scrapy
lxml
pytest
flake8

Установка

Клонируйте репозиторий и перейдите в директорию проекта:

git clone [email protected]:abramov-v/scrapy_parser_pep.git
cd scrapy_parser_pep

Создайте и активируйте виртуальное окружение:

python -m venv venv
source venv/bin/activate

Установите зависимости:

pip install -r requirements.txt

Примеры использования

Запустите парсер:

scrapy crawl pep

После обработки документации, парсер сохранит два .csv файлы в папку results по маске pep_ДатаВремя.csv и status_summary_ДатаВремя.csv

Пример документа status_summary_ДатаВремя.csv

Статус	Количество
Active	35
Draft	39
Accepted	21
Final	338
Provisional	1
Superseded	25
Rejected	126
Withdrawn	68
Deferred	38
April Fool!	1
Total	692

Автор

Валерий Абрамов

GitHub: @abramov-v

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
pep_parse		pep_parse
results		results
tests		tests
.flake8		.flake8
.gitignore		.gitignore
README.md		README.md
pytest.ini		pytest.ini
requirements.txt		requirements.txt
scrapy.cfg		scrapy.cfg

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Парсер документации PEP

О проекте

Используемый стек

Установка

Примеры использования

Автор

About

Uh oh!

Releases

Packages

Languages

abramov-v/scrapy_parser_pep

Folders and files

Latest commit

History

Repository files navigation

Парсер документации PEP

О проекте

Используемый стек

Установка

Примеры использования

Автор

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages