multimodal-rag

Installation

SKILL.md

Multimodal RAG ()

Build retrieval-augmented generation systems that handle images, text, and mixed content.

Overview

Image + text retrieval (product search, documentation)
Cross-modal search (text query -> image results)
Multimodal document processing (PDFs with charts)
Visual question answering with context
Image similarity and deduplication
Hybrid search pipelines

Architecture Approaches

Installs

11

Repository

yonatangross/orchestkit

GitHub Stars

193

First Seen

Jan 22, 2026

Security Audits

Gen Agent Trust HubFail

multimodal-rag — yonatangross/orchestkit