Извлекайте текст из сложных документов

PDF, сканы, фотографии – даже с сохранением структуры! Мощное API для распознавания текста.

Запустить демо сейчас

Как работает PageR-WEB

📤

Загрузите файл

PDF, JPG, PNG до 50 МБ. Выберите файл в демо-интерфейсе

⚙️

Настройте параметры

Включите/отключите определение физической структуры (текст, заголовок, таблицы, фигуры, списки)

📥

Получите результат

Просматривайте, копируйте или скачивайте в DOCX для проверки или JSON для разработки

Увидели = поверили. Проверьте сами!

Гибкое API для интеграций

Пример запроса


{
    "file": string($binary)
    "process": '{"only_text": false}'
}
            

Пример ответа


{
    "document": "string",
    "pages": [
        {
            "number": "integer",
            "width": "integer",
            "height": "integer",
            "regions": [
                {
                    "x_top_left": "integer",
                    "y_top_left": "integer",
                    "width": "integer",
                    "height": "integer",
                    "text": "string",
                }
            ],
            "tables": [...],
            "images": [...],
            "words": [...]
        }
    ]
}

            

Готовы автоматизировать извлечение текста?

Мы готовы разработать специально для Вас API, который бы удовлетворял Вашим требованиям.
Напишите нам it-daniil@yandex.ru, а пока ждете попробуйте демо.