
Unstructured
日本語部分対応PDF、HTML、画像、Word、PPT等の非構造化ドキュメントからテキストを抽出・構造化するオープンソースツール。RAGパイプラインの前処理に特化し、チャンキング、メタデータ抽出、ベクトルDB連携を自動化する。
提供: Unstructured.io開発国: アメリカ更新: 2026-04-02無料プラン:あり最安値: ¥0.03/月〜

製品概要
| 提供形態 | クラウド / SaaS |
| 日本語対応 | 部分対応 |
| API提供 | あり |
| モバイルアプリ | なし |
| 提供元 | Unstructured.io |
| 開発国 | アメリカ |
| 最終更新 | 2026-04-02 |
このツールで解決できる課題
主要機能
マルチフォーマット対応
チャンキング
メタデータ抽出
ベクトルDB連携
料金プラン
| プラン | 料金 | 主な機能 |
|---|---|---|
| Free | 無料 |
|
| Pay-As-You-Go | $0.03 / page |
|
| Business | Custom |
|
対応状況
日本語対応部分対応
モバイルアプリなし
API提供あり
連携サービス
PineconeWeaviateChromaDBS3Azure Blob