GoForum🌐 V2EX

做了一个聚合全球 483 个佛教数字资源的开源平台,支持 AI 问答和知识图谱

XR843 · 2026-03-12 12:58 · 0 次点赞 · 1 条回复

大家好,分享一个我做的项目 —— 佛津 (FoJin),一个全球佛教古籍数字资源聚合平台。

做这个的原因: 全球佛学数字资源分散在几百个网站( CBETA 、SuttaCentral 、BDRC 、84000 等),语言不同、格式不同、接口不同。研究者花在”找经文”上的时间比”读经 文”还多。我想把它们聚合到一起。

目前的功能:

  • 聚合 483 个数据源,覆盖 30 个国家/地区、30 个语种
  • 8,949 条经典目录检索 + 4,488 卷全文在线阅读
  • 6 部佛学辞典、237,593 条词条(中/梵/巴利/英)
  • 多语种平行对读(汉/梵/巴利/藏/英等 29 种语言)
  • 知识图谱:9,600+ 实体、3,800+ 关系,力导向图可视化
  • AI 佛学问答:基于 RAG ,覆盖 38 部核心佛经约 1,100 万字,回答附原文引用
  • 支持 BYOK ( Bring Your Own Key ),用户可配置自己的 API Key

技术栈:

  • 前端:React 18 + TypeScript + Vite + Ant Design 5
  • 后端:FastAPI + SQLAlchemy (async) + Pydantic v2
  • 数据库:PostgreSQL 15 + pgvector + Elasticsearch 8 (ICU 分词)
  • AI:RAG (向量检索 + 关键词检索),支持通义千问/DeepSeek/OpenAI 等
  • 部署:Docker Compose + Nginx + Cloudflare

在线体验: https://fojin.app

GitHub: https://github.com/xr843/fojin

Apache 2.0 开源,欢迎 Star 、提 Issue 或贡献代码。

做这个项目的过程中学到了很多(多语种 NLP 、IIIF 协议、知识图谱构建),也踩了不少坑。如果大家感兴趣,可以交流一下。

1 条回复
haloandspike · 2026-03-12 13:38
#1

我最近在做一个类似的项目,也是针对古籍的,想问下楼主用的是什么 OCR 模型哇?

添加回复
你还需要 登录 后发表回复

登录后可发帖和回复

登录 注册
主题信息
作者: XR843
发布: 2026-03-12
点赞: 0
回复: 0