GoForum › 🌐 V2EX
做了一个聚合全球 483 个佛教数字资源的开源平台,支持 AI 问答和知识图谱
XR843 ·
2026-03-12 12:58 ·
0 次点赞 · 1 条回复
大家好,分享一个我做的项目 —— 佛津 (FoJin),一个全球佛教古籍数字资源聚合平台。
做这个的原因: 全球佛学数字资源分散在几百个网站( CBETA 、SuttaCentral 、BDRC 、84000 等),语言不同、格式不同、接口不同。研究者花在”找经文”上的时间比”读经 文”还多。我想把它们聚合到一起。
目前的功能:
- 聚合 483 个数据源,覆盖 30 个国家/地区、30 个语种
- 8,949 条经典目录检索 + 4,488 卷全文在线阅读
- 6 部佛学辞典、237,593 条词条(中/梵/巴利/英)
- 多语种平行对读(汉/梵/巴利/藏/英等 29 种语言)
- 知识图谱:9,600+ 实体、3,800+ 关系,力导向图可视化
- AI 佛学问答:基于 RAG ,覆盖 38 部核心佛经约 1,100 万字,回答附原文引用
- 支持 BYOK ( Bring Your Own Key ),用户可配置自己的 API Key
技术栈:
- 前端:React 18 + TypeScript + Vite + Ant Design 5
- 后端:FastAPI + SQLAlchemy (async) + Pydantic v2
- 数据库:PostgreSQL 15 + pgvector + Elasticsearch 8 (ICU 分词)
- AI:RAG (向量检索 + 关键词检索),支持通义千问/DeepSeek/OpenAI 等
- 部署:Docker Compose + Nginx + Cloudflare
在线体验: https://fojin.app
GitHub: https://github.com/xr843/fojin
Apache 2.0 开源,欢迎 Star 、提 Issue 或贡献代码。
做这个项目的过程中学到了很多(多语种 NLP 、IIIF 协议、知识图谱构建),也踩了不少坑。如果大家感兴趣,可以交流一下。
1 条回复
添加回复
你还需要 登录
后发表回复
我最近在做一个类似的项目,也是针对古籍的,想问下楼主用的是什么 OCR 模型哇?