SQLBot Version
v1.9.0
Run Mode
Docker
Describe the bug
上传包含较多 Sheet 的 Excel 文件后,例如 60 多个 Sheet,问数时只能识别到部分 Sheet。由于 Excel 的每个 Sheet 会导入为一张表,问数阶段构造表结构时如果启用了表向量召回,表数量会被 TABLE_EMBEDDING_COUNT 截断,导致模型无法看到完整 Sheet 对应的表结构。
To Reproduce
- 上传一个包含较多 Sheet 的 Excel 文件,例如 60 多个 Sheet。
- 将这些 Sheet 作为 Excel 数据源导入 SQLBot。
- 发起一个需要使用部分靠后 Sheet 的问数请求。
- 可以看到问数时只能识别到部分 Sheet,缺失的 Sheet 无法参与 SQL 生成。
Expected behavior
Excel 数据源问数时,应能识别全部已导入 Sheet 对应的表结构,避免多 Sheet 场景下只有部分表进入模型上下文。
Additional context
该问题与 Excel 数据源的多 Sheet 场景相关。非 Excel 数据源仍应保持现有表向量召回行为。
Related PR: #1204
SQLBot Version
v1.9.0
Run Mode
Docker
Describe the bug
上传包含较多 Sheet 的 Excel 文件后,例如 60 多个 Sheet,问数时只能识别到部分 Sheet。由于 Excel 的每个 Sheet 会导入为一张表,问数阶段构造表结构时如果启用了表向量召回,表数量会被
TABLE_EMBEDDING_COUNT截断,导致模型无法看到完整 Sheet 对应的表结构。To Reproduce
Expected behavior
Excel 数据源问数时,应能识别全部已导入 Sheet 对应的表结构,避免多 Sheet 场景下只有部分表进入模型上下文。
Additional context
该问题与 Excel 数据源的多 Sheet 场景相关。非 Excel 数据源仍应保持现有表向量召回行为。
Related PR: #1204