最近更新
2026-06-16
GitHub Stars
6,661
关于 Unstract
Unstract 使用 LLM 从文档中提取结构化 JSON——PDF、图片、扫描件均可。通过自然语言提示定义提取内容,并部署为 API 或 ETL 管道。
编辑总评
一款开源且可自托管的编码智能体,拥有 6.7k GitHub stars。Unstract 是一款开源无代码平台,专为使用 LLM 从非结构化文档中高精度提取数据而设计。轻松部署 API 和 ETL 管道处理非结构化数据。
功能特性
Linux 或 macOS (Intel 或 M 系列)
- Docker 和 Docker Compose
Git
### 本地运行
访问 [http
用户名登录
开始提取数据!
## 其他部署选项
### D
详细评分
易用性 7.7
性价比 8.2
功能 8.0
技术支持 7.4
性能 8.1
综合评分
8.0 /10
优缺点
优点
- 开源——完全可自托管和审计
- 活跃的社区,6.7k GitHub stars
- Git ### 本地运行
- 访问 [http
缺点
- 需要技术配置;相比托管方案,上手引导较少
- 第三方评测和基准测试有限
应用场景
代码生成代码审查调试重构
适合谁使用?
希望获得软件开发自动化能力、重视开源灵活性和可控性的团队和个人
#AI 智能体#数据工程#文档 AI#生成式 AI#IDP#what
常见问题
Unstract 是什么?
Unstract 使用 LLM 从文档中提取结构化 JSON——PDF、图片、扫描件均可。通过自然语言提示定义提取内容,并部署为 API 或 ETL 管道。
Unstract 多少钱?
Unstract 是开源的,可免费自托管。安装说明见 https://github.com/Zipstack/unstract。
Unstract 是开源的吗?
是的——Unstract 是开源的,拥有 6.7k stars。源码在 GitHub:https://github.com/Zipstack/unstract。
Unstract 适合谁?
希望获得软件开发自动化能力、重视开源灵活性和可控性的团队和个人。