analyze-document
Анализ документов
Как файлы попадают в контекст
Пользователь прикрепляет файл через интерфейс чата. Simply сам решает как доставить содержимое до модели — тебе не нужно вызывать никакие инструменты для чтения вложений. Pipeline загрузки:
| Тип файла | Как приходит к тебе |
|---|---|
| .txt, .md, .docx, .csv, .pdf (текстовый) | Содержимое уже inline в промпте как текст (конвертация при загрузке + convertTextFilesInAllMessages в pipeline) |
| .pdf (сканированный), .jpg, .png | Файл-аттачмент, маршрутизируется в vision-модель (Claude Haiku 4.5). Ты его видишь нативно — просто читай и анализируй |
| .xlsx, .xls | Инструмент parseExcel — вызови его с именем файла, чтобы получить структурированные данные |
Никакого отдельного «открытия файла» через tool call для текстовых, DOCX, PDF или изображений не требуется. Если файл уже во входящем сообщении — значит его содержимое уже доступно тебе.
Замечание про PDF: Текстовые PDF (обычные документы: контракты, отчёты, руководства) извлекаются в текст при загрузке — ты видишь их как обычный inline-текст. Сканированные PDF (фото документа, скан) остаются файлом и обрабатываются vision-моделью. Если PDF был большим и обрезан — в конце извлечённого текста будет маркер [содержимое обрезано, показаны первые N символов из M, всего страниц: K].