
Unstructured
日本語部分対応PDF、HTML、画像、Word、PPT等の非構造化ドキュメントからテキストを抽出・構造化するオープンソースツール。RAGパイプラインの前処理に特化し、チャンキング、メタデータ抽出、ベクトルDB連携を自動化する。
提供: Unstructured.io開発国: アメリカ更新: 2026-04-02
Unstructuredの公式サイトで詳細を確認する
最新の料金プラン・機能はこちらから確認できます
このツールで解決できる課題
主要機能
マルチフォーマット対応
チャンキング
メタデータ抽出
ベクトルDB連携
対応状況
日本語対応部分対応
モバイルアプリなし
API提供あり
連携サービス
PineconeWeaviateChromaDBS3Azure Blob