Caden
Home
Projects
Experience
Blog
CadenCaden

全栈开发者 & AI 爱好者,专注于构建优雅的数字体验。

© 2026 Caden Chen. All rights reserved.

导航

  • 首页
  • 项目
  • 经历
  • 博客

社交

  • GitHub
  • LinkedIn
  • X
  • 邮箱

资源

  • 简历
  • RSS
  • 站点地图
Back to Projects
Featured

医疗 GraphRAG 私有化落地

围绕医疗投标与演示需求,搭建私有化 LLM 工作流与 GraphRAG 检索体系。

View Source
医

Tech Stack

LangChainLlamaIndexGraphRAGNebulaGraphOracleDifyOllamaDeepSeek

Project Details

围绕医疗投标与演示需求,搭建私有化 LLM 工作流与 GraphRAG 检索体系。

项目定位

项目面向医疗场景的智能化投标和演示需求,搭建私有化 LLM 工作流与 GraphRAG 检索体系,重点解决医疗问答中检索召回不足、实体关系缺失、私有化部署与国产化适配问题。

架构链路

数据接入层:以 Oracle 结构化数据为起点,规划数据抽取、清洗、字段映射与后续 ETL 扩展链路。

索引构建层:使用 LlamaIndex/LangChain 完成数据加载、切分、Embedding 与检索编排。

图谱增强层:将医疗实体与关系写入 NebulaGraph,用图关系补足纯向量检索难以表达的上下游/关联实体问题。

应用交付层:通过 Dify/Ollama/DeepSeek 等组件验证私有化推理、演示编排与后续微调/监控路径。

技术亮点

实现 Oracle → LlamaIndex → LangChain → NebulaGraph 的医疗 GraphRAG 全链路,内部样例集准确性提升约 30%。

完成图数据库国产化选型与落地,用 NebulaGraph 替代 Neo4j,满足信创/私有化交付约束。

集成 Easy Dataset、LLaMA-Factory、SwanLab、Ollama、DeepSeek、Dify 等组件,形成私有化 LLM 底座。

搭建 SeaTunnel + Doris/Spark 的湖仓 ETL 流程,为上层 AI 应用提供高质量数据基础。

Quick Links

Source Code

View on GitHub

Project Info
StatusFeatured
Technologies8
TypeOpen Source

Other Projects

View All
MemNet

面向 AI Agent 的长期记忆层,解决多层级记忆管理、检索和治理问题。

PythonGraphRAGNeo4j+3
Wan Prompt Lab

把文生视频 Prompt 生产流程做成可配置、可复用、可协作的 Prompt Studio。

Next.jsCloudflare WorkersTypeScript+2
SocSim-Lab

基于 ABM 的社会模拟可视化平台,支持大规模 Agent 仿真与实时分析。

ReactTypeScriptPixiJS+3