# InsightFlow 开发状态 **最后更新**: 2026-02-25 12:00 ## 当前阶段 Phase 8: 商业化与规模化 - **进行中 🚧** ## 部署状态 - **服务器**: 122.51.127.111:18000 ✅ 运行中 - **Neo4j**: 122.51.127.111:7474 (HTTP), 122.51.127.111:7687 (Bolt) ✅ 运行中 - **Git 版本**: 待推送 ## 已完成 ### Phase 1-6 (已完成 ✅) - FastAPI 项目框架搭建 - SQLite 数据库设计 - 阿里云听悟 ASR 集成 - OSS 上传模块 - 实体提取与对齐逻辑 - 关系提取 - 项目 CRUD API - 音频上传与分析 API - D3.js 知识图谱可视化 - 实体列表展示 - 转录文本中实体高亮显示 - 图谱与文本联动 - Agent 助手 - 知识溯源 - 知识推理与问答增强 - 实体属性扩展 - 时间线视图 - Neo4j 图数据库集成 - 导出功能 - API 开放平台 ### Phase 7 - 全部任务 (已完成 ✅) - ✅ 任务 1: 智能工作流自动化 - ✅ 任务 2: 多模态支持 - ✅ 任务 3: 数据安全与合规 - ✅ 任务 4: 协作与共享 - ✅ 任务 5: 智能报告生成 - ✅ 任务 6: 高级搜索与发现 - ✅ 任务 7: 插件与集成 - ✅ 任务 8: 性能优化与扩展 ### Phase 8 - 任务 1: 多租户 SaaS 架构 (已完成 ✅) - ✅ 创建 tenant_manager.py - 多租户管理模块 - TenantManager: 租户管理主类 - Tenant: 租户数据模型 - TenantDomain: 自定义域名管理 - TenantBranding: 品牌白标配置 - TenantMember: 租户成员管理 - TenantContext: 租户上下文管理器 - 租户隔离(数据、配置、资源完全隔离) - 多层级订阅计划支持(Free/Pro/Enterprise) - 资源限制和用量统计 - ✅ 更新 schema.sql - 添加租户相关数据库表 - tenants: 租户主表 - tenant_domains: 租户域名绑定表 - tenant_branding: 租户品牌配置表 - tenant_members: 租户成员表 - tenant_permissions: 租户权限定义表 - tenant_usage: 租户资源使用统计表 - ✅ 更新 main.py - 添加租户相关 API 端点 - POST/GET /api/v1/tenants - 租户管理 - POST/GET /api/v1/tenants/{id}/domains - 域名管理 - POST /api/v1/tenants/{id}/domains/{id}/verify - 域名验证 - GET/PUT /api/v1/tenants/{id}/branding - 品牌配置 - GET /api/v1/tenants/{id}/branding.css - 品牌 CSS - POST/GET /api/v1/tenants/{id}/members - 成员管理 - GET /api/v1/tenants/{id}/usage - 使用统计 - GET /api/v1/tenants/{id}/limits/{type} - 资源限制检查 - GET /api/v1/resolve-tenant - 域名解析租户 ## 待完成 ### Phase 8 任务清单 | 任务 | 名称 | 优先级 | 状态 | 计划完成 | |------|------|--------|------|----------| | 1 | 多租户 SaaS 架构 | P0 | ✅ | 2026-02-25 | | 2 | 订阅与计费系统 | P0 | 🚧 | 2026-02-26 | | 3 | 企业级功能 | P1 | ⏳ | 2026-02-28 | | 4 | AI 能力增强 | P1 | ⏳ | 2026-03-02 | | 5 | 运营与增长工具 | P1 | ⏳ | 2026-03-04 | | 6 | 开发者生态 | P2 | ⏳ | 2026-03-06 | | 7 | 全球化与本地化 | P2 | ⏳ | 2026-03-08 | | 8 | 运维与监控 | P2 | ⏳ | 2026-03-10 | - ✅ 创建 workflow_manager.py - 工作流管理模块 - WorkflowManager: 主管理类 - WorkflowTask: 工作流任务定义 - WebhookNotifier: Webhook 通知器(支持飞书、钉钉、Slack) - 定时任务调度(APScheduler) - 自动分析新上传文件的工作流 - 自动实体对齐和关系发现 - 工作流配置管理 - ✅ 更新 schema.sql - 添加工作流相关数据库表 - workflows: 工作流配置表 - workflow_tasks: 任务执行记录表 - webhook_configs: Webhook 配置表 - workflow_logs: 工作流执行日志 - ✅ 更新 main.py - 添加工作流相关 API 端点 - GET/POST /api/v1/workflows - 工作流管理 - GET/POST /api/v1/webhooks - Webhook 配置 - GET /api/v1/workflows/{id}/logs - 执行日志 - POST /api/v1/workflows/{id}/trigger - 手动触发 - GET /api/v1/workflows/{id}/stats - 执行统计 - POST /api/v1/webhooks/{id}/test - 测试 Webhook - ✅ 更新 requirements.txt - 添加 APScheduler 依赖 ### Phase 7 - 任务 2: 多模态支持 (已完成 ✅) - ✅ 创建 multimodal_processor.py - 多模态处理模块 - VideoProcessor: 视频处理器(提取音频 + 关键帧 + OCR) - ImageProcessor: 图片处理器(OCR + 图片描述) - MultimodalEntityExtractor: 多模态实体提取器 - 支持 PaddleOCR/EasyOCR/Tesseract 多种 OCR 引擎 - 支持 ffmpeg 视频处理 - ✅ 创建 multimodal_entity_linker.py - 多模态实体关联模块 - MultimodalEntityLinker: 跨模态实体关联器 - 支持 embedding 相似度计算 - 多模态实体画像生成 - 跨模态关系发现 - 多模态时间线生成 - ✅ 更新 schema.sql - 添加多模态相关数据库表 - videos: 视频表 - video_frames: 视频关键帧表 - images: 图片表 - multimodal_mentions: 多模态实体提及表 - multimodal_entity_links: 多模态实体关联表 - ✅ 更新 main.py - 添加多模态相关 API 端点 - POST /api/v1/projects/{id}/upload-video - 上传视频 - POST /api/v1/projects/{id}/upload-image - 上传图片 - GET /api/v1/projects/{id}/videos - 视频列表 - GET /api/v1/projects/{id}/images - 图片列表 - GET /api/v1/videos/{id} - 视频详情 - GET /api/v1/images/{id} - 图片详情 - POST /api/v1/projects/{id}/multimodal/link-entities - 跨模态实体关联 - GET /api/v1/entities/{id}/multimodal-profile - 实体多模态画像 - GET /api/v1/projects/{id}/multimodal-timeline - 多模态时间线 - GET /api/v1/entities/{id}/cross-modal-relations - 跨模态关系 - ✅ 更新 requirements.txt - 添加多模态依赖 - opencv-python: 视频处理 - pillow: 图片处理 - paddleocr/paddlepaddle: OCR 引擎 - ffmpeg-python: ffmpeg 封装 - sentence-transformers: 跨模态对齐 ### Phase 7 - 任务 7: 插件与集成 (已完成 ✅) - ✅ 创建 plugin_manager.py - 插件管理模块 - PluginManager: 插件管理主类 - ChromeExtensionHandler: Chrome 扩展 API 处理 - 令牌创建、验证、撤销 - 网页内容导入 - BotHandler: 飞书/钉钉机器人处理 - 会话管理 - 消息接收和发送 - 音频文件处理 - WebhookIntegration: Zapier/Make Webhook 集成 - 端点创建和管理 - 事件触发 - 认证支持 - WebDAVSync: WebDAV 同步管理 - 同步配置管理 - 连接测试 - 项目数据同步 - ✅ 更新 schema.sql - 添加插件相关数据库表 - plugins: 插件配置表 - plugin_configs: 插件详细配置表 - bot_sessions: 机器人会话表 - webhook_endpoints: Webhook 端点表 - webdav_syncs: WebDAV 同步配置表 - chrome_extension_tokens: Chrome 扩展令牌表 - ✅ 更新 main.py - 添加插件相关 API 端点 - GET/POST /api/v1/plugins - 插件管理 - POST /api/v1/plugins/chrome/tokens - 创建 Chrome 扩展令牌 - GET /api/v1/plugins/chrome/tokens - 列出自令牌 - DELETE /api/v1/plugins/chrome/tokens/{id} - 撤销令牌 - POST /api/v1/plugins/chrome/import - 导入网页内容 - POST /api/v1/plugins/bot/feishu/sessions - 创建飞书会话 - POST /api/v1/plugins/bot/dingtalk/sessions - 创建钉钉会话 - GET /api/v1/plugins/bot/{type}/sessions - 列出会话 - POST /api/v1/plugins/bot/{type}/webhook - 接收机器人消息 - POST /api/v1/plugins/bot/{type}/sessions/{id}/send - 发送消息 - POST /api/v1/plugins/integrations/zapier - 创建 Zapier 端点 - POST /api/v1/plugins/integrations/make - 创建 Make 端点 - GET /api/v1/plugins/integrations/{type} - 列出集成端点 - POST /api/v1/plugins/integrations/{id}/test - 测试端点 - POST /api/v1/plugins/integrations/{id}/trigger - 手动触发 - POST /api/v1/plugins/webdav - 创建 WebDAV 同步 - GET /api/v1/plugins/webdav - 列出同步配置 - POST /api/v1/plugins/webdav/{id}/test - 测试连接 - POST /api/v1/plugins/webdav/{id}/sync - 执行同步 - ✅ 更新 requirements.txt - 添加插件依赖 - webdav4: WebDAV 客户端 - urllib3: URL 处理 - ✅ 创建 Chrome 扩展基础代码 - manifest.json: 扩展配置 - background.js: 后台脚本(右键菜单、同步) - content.js: 内容脚本(页面提取) - content.css: 内容样式 - popup.html/js: 弹出窗口 - options.html/js: 设置页面 - README.md: 扩展说明文档 ### Phase 7 - 任务 3: 数据安全与合规 (已完成 ✅) - ✅ 创建 security_manager.py - 安全模块 - SecurityManager: 安全管理主类 - 审计日志系统 - 记录所有数据操作 - 端到端加密 - AES-256-GCM 加密项目数据 - 数据脱敏 - 支持手机号、邮箱、身份证等敏感信息脱敏 - 数据访问策略 - 基于用户、角色、IP、时间的访问控制 - 访问审批流程 - 敏感数据访问需要审批 - ✅ 更新 schema.sql - 添加安全相关数据库表 - audit_logs: 审计日志表 - encryption_configs: 加密配置表 - masking_rules: 脱敏规则表 - data_access_policies: 数据访问策略表 - access_requests: 访问请求表 - ✅ 更新 main.py - 添加安全相关 API 端点 - GET /api/v1/audit-logs - 查询审计日志 - GET /api/v1/audit-logs/stats - 审计统计 - POST /api/v1/projects/{id}/encryption/enable - 启用加密 - POST /api/v1/projects/{id}/encryption/disable - 禁用加密 - POST /api/v1/projects/{id}/encryption/verify - 验证密码 - GET /api/v1/projects/{id}/encryption - 获取加密配置 - POST /api/v1/projects/{id}/masking-rules - 创建脱敏规则 - GET /api/v1/projects/{id}/masking-rules - 获取脱敏规则 - PUT /api/v1/masking-rules/{id} - 更新脱敏规则 - DELETE /api/v1/masking-rules/{id} - 删除脱敏规则 - POST /api/v1/projects/{id}/masking/apply - 应用脱敏 - POST /api/v1/projects/{id}/access-policies - 创建访问策略 - GET /api/v1/projects/{id}/access-policies - 获取访问策略 - POST /api/v1/access-policies/{id}/check - 检查访问权限 - POST /api/v1/access-requests - 创建访问请求 - POST /api/v1/access-requests/{id}/approve - 批准访问 - POST /api/v1/access-requests/{id}/reject - 拒绝访问 - ✅ 更新 requirements.txt - 添加 cryptography 依赖 ## 待完成 Phase 7 任务 4: 协作与共享 ## 技术债务 - 听悟 SDK fallback 到 mock 需要更好的错误处理 - 实体相似度匹配目前只是简单字符串包含,需要 embedding 方案 - 前端需要状态管理(目前使用全局变量) - ~~需要添加 API 文档 (OpenAPI/Swagger)~~ ✅ 已完成 - 多模态 LLM 图片描述功能待实现(需要集成多模态模型 API) ## 部署信息 - 服务器: 122.51.127.111 - 项目路径: /opt/projects/insightflow - 端口: 18000 ## 最近更新 ### 2026-02-23 (午间) - 完成 Phase 7 任务 7: 插件与集成 - 创建 plugin_manager.py 模块 - PluginManager: 插件管理主类 - ChromeExtensionHandler: Chrome 插件处理 - BotHandler: 飞书/钉钉/Slack 机器人处理 - WebhookIntegration: Zapier/Make Webhook 集成 - WebDAVSync: WebDAV 同步管理 - 创建完整的 Chrome 扩展代码 - manifest.json, background.js, content.js - popup.html/js, options.html/js - 支持网页剪藏、选中文本保存、项目选择 - 更新 schema.sql 添加插件相关数据库表 - 更新 main.py 添加插件相关 API 端点 - 更新 requirements.txt 添加插件依赖 ### 2026-02-23 (晚间) - 完成 Phase 7 任务 3: 数据安全与合规 - 创建 security_manager.py 安全模块 - SecurityManager: 安全管理主类 - 审计日志系统 - 记录所有数据操作 - 端到端加密 - AES-256-GCM 加密项目数据 - 数据脱敏 - 支持手机号、邮箱、身份证等敏感信息脱敏 - 数据访问策略 - 基于用户、角色、IP、时间的访问控制 - 访问审批流程 - 敏感数据访问需要审批 - 更新 schema.sql 添加安全相关数据库表 - audit_logs: 审计日志表 - encryption_configs: 加密配置表 - masking_rules: 脱敏规则表 - data_access_policies: 数据访问策略表 - access_requests: 访问请求表 - 更新 main.py 添加安全相关 API 端点 - 更新 requirements.txt 添加 cryptography 依赖 ### 2026-02-23 (早间) - 完成 Phase 7 任务 2: 多模态支持 - 创建 multimodal_processor.py 模块 - VideoProcessor: 视频处理(音频提取 + 关键帧 + OCR) - ImageProcessor: 图片处理(OCR + 图片描述) - MultimodalEntityExtractor: 多模态实体提取 - 创建 multimodal_entity_linker.py 模块 - MultimodalEntityLinker: 跨模态实体关联 - 支持 embedding 相似度计算 - 多模态实体画像和时间线 - 更新 schema.sql 添加多模态相关数据库表 - 更新 main.py 添加多模态相关 API 端点 - 更新 requirements.txt 添加多模态依赖 ### 2026-02-24 (晚间) - 完成 Phase 7 任务 8: 性能优化与扩展 - 创建 performance_manager.py 性能管理模块 - CacheManager: Redis 缓存层(支持内存回退) - DatabaseSharding: 数据库分片管理 - TaskQueue: 异步任务队列(Celery + Redis) - PerformanceMonitor: 性能监控器 - 更新 schema.sql 添加性能相关数据库表 - 更新 main.py 添加性能相关 API 端点 - 更新 requirements.txt 添加 redis 和 celery 依赖 - 创建 test_phase7_task6_8.py 测试脚本 ### 2026-02-24 (晚间) - 完成 Phase 7 任务 6: 高级搜索与发现 - 创建 search_manager.py 搜索管理模块 - FullTextSearch: 全文搜索引擎(FTS5) - SemanticSearch: 语义搜索引擎(sentence-transformers) - EntityPathDiscovery: 实体关系路径发现(BFS/DFS) - KnowledgeGapDetector: 知识缺口检测器 - 更新 schema.sql 添加搜索相关数据库表 - 更新 main.py 添加搜索相关 API 端点 - 更新 requirements.txt 添加 sentence-transformers 依赖 ### 2026-02-23 - 完成 Phase 7 任务 1: 工作流自动化模块 - 创建 workflow_manager.py 模块 - WorkflowManager: 主管理类,支持定时任务调度 - WorkflowTask: 工作流任务定义 - WebhookNotifier: Webhook 通知器(支持飞书、钉钉、Slack) - 工作流配置管理 - 更新 schema.sql 添加工作流相关数据库表 - 更新 main.py 添加工作流相关 API 端点 - 更新 requirements.txt 添加 APScheduler 依赖 ### 2026-02-21 (晚间) - 完成 Phase 6: API 开放平台 - 为现有 API 端点添加认证依赖 - 前端 API Key 管理界面实现 - 测试和验证完成 - 代码提交并部署 ### 2026-02-21 (午间) - 开始 Phase 6: API 开放平台 - 创建 api_key_manager.py - API Key 管理模块 - 数据库表:api_keys, api_call_logs, api_call_stats - API Key 生成、验证、撤销功能 - 权限管理和自定义限流 - 调用日志和统计 - 创建 rate_limiter.py - 限流模块 - 滑动窗口计数器 - 可配置限流参数 - 更新 main.py - 集成 Swagger/OpenAPI 文档 - 添加 API Key 认证依赖 - 实现限流中间件 - 新增 API Key 管理端点 - 新增系统信息端点 ### 2026-02-20 (晚间) - 完成 Phase 5 前端图分析面板 - 新增侧边栏 "图分析" 按钮 - 图统计信息展示(节点数、边数、密度、连通分量) - 度中心性分析排名展示 - 社区发现可视化(D3.js 力导向图) - 最短路径查询和可视化 - 邻居节点查询和可视化 - Neo4j 连接状态指示 - 数据同步到 Neo4j 功能 - 提交代码到 git 仓库 - 部署到服务器: 122.51.127.111:18000 ### 2026-02-20 (晚间) - 完成 Phase 5 导出功能 - 新增 export_manager.py 导出管理模块 - 知识图谱导出 SVG/PNG (支持矢量图和图片格式) - 实体数据导出 Excel/CSV (包含所有自定义属性) - 关系数据导出 CSV - 项目报告导出 PDF (包含统计、实体列表、关系列表) - 转录文本导出 Markdown (带实体标注) - 项目完整数据导出 JSON (备份/迁移用) - 前端知识库面板添加导出入口 - 新增依赖: pandas, openpyxl, reportlab, cairosvg ### 2026-02-20 - 完成 Phase 5 实体属性扩展功能 - 数据库层: - 新增 `entity_attributes` 表存储自定义属性 - 新增 `attribute_templates` 表管理属性模板 - 新增 `attribute_history` 表记录属性变更历史 - 后端 API: - `GET/POST /api/v1/projects/{id}/attribute-templates` - 属性模板管理 - `GET/POST/PUT/DELETE /api/v1/entities/{id}/attributes` - 实体属性 CRUD - `GET /api/v1/entities/{id}/attributes/history` - 属性变更历史 - `GET /api/v1/projects/{id}/entities/search-by-attributes` - 属性筛选搜索 - 支持的属性类型: text, number, date, select, multiselect, boolean ### 2026-02-19 (晚间) - 完成 Phase 5 知识推理与问答增强功能 - 新增 knowledge_reasoner.py 推理引擎 - 支持四种推理类型:因果、对比、时序、关联 - 智能项目总结 API(全面/高管/技术/风险) - 实体关联路径发现功能 - 前端推理面板 UI 完整实现 - 提交代码到 git 仓库 - 部署到服务器: 122.51.127.111:18000 ### 2026-02-19 - 完成 Phase 5 时间线视图功能 - 后端 API: `/api/v1/projects/{id}/timeline` - 前端时间线面板,支持按日期分组显示 - 实体提及和关系建立事件可视化 - 实体筛选功能 - 统计卡片展示 - 修复静态文件路由覆盖 API 路由的问题 - 修复模块导入路径问题 - 部署到服务器: 122.51.127.111:18000 - 更新 README 开发清单