Unstructured

Unstructured

日本語部分対応

PDF、HTML、画像、Word、PPT等の非構造化ドキュメントからテキストを抽出・構造化するオープンソースツール。RAGパイプラインの前処理に特化し、チャンキング、メタデータ抽出、ベクトルDB連携を自動化する。

提供: Unstructured.io開発国: アメリカ更新: 2026-04-02無料プラン:あり最安値: ¥0.03/月〜
Unstructuredの画面

製品概要

提供形態クラウド / SaaS
日本語対応部分対応
API提供あり
モバイルアプリなし
提供元Unstructured.io
開発国アメリカ
最終更新2026-04-02

このツールで解決できる課題

主要機能

マルチフォーマット対応
チャンキング
メタデータ抽出
ベクトルDB連携

料金プラン

プラン料金主な機能
Free無料
  • 15,000 Free Pages (No Expiration)
  • No Minimums
  • Completely Free
  • All Features
Pay-As-You-Go$0.03 / page
  • Pay only for what you process
  • Flat rate for any file type and any pipeline
  • All Features
BusinessCustom
  • Custom Pricing
  • Multi-user accounts
  • All Features
  • Dedicated Instance, VPC or Multi-Tenant SaaS

対応状況

日本語対応部分対応
モバイルアプリなし
API提供あり

連携サービス

PineconeWeaviateChromaDBS3Azure Blob

このツールを使っている業界

タグ

代替ツール