Skip to content

Excel 多 Sheet 数据源问数时只识别部分 Sheet #1203

@kaolenmea

Description

@kaolenmea

SQLBot Version
v1.9.0

Run Mode
Docker

Describe the bug
上传包含较多 Sheet 的 Excel 文件后,例如 60 多个 Sheet,问数时只能识别到部分 Sheet。由于 Excel 的每个 Sheet 会导入为一张表,问数阶段构造表结构时如果启用了表向量召回,表数量会被 TABLE_EMBEDDING_COUNT 截断,导致模型无法看到完整 Sheet 对应的表结构。

To Reproduce

  1. 上传一个包含较多 Sheet 的 Excel 文件,例如 60 多个 Sheet。
  2. 将这些 Sheet 作为 Excel 数据源导入 SQLBot。
  3. 发起一个需要使用部分靠后 Sheet 的问数请求。
  4. 可以看到问数时只能识别到部分 Sheet,缺失的 Sheet 无法参与 SQL 生成。

Expected behavior
Excel 数据源问数时,应能识别全部已导入 Sheet 对应的表结构,避免多 Sheet 场景下只有部分表进入模型上下文。

Additional context
该问题与 Excel 数据源的多 Sheet 场景相关。非 Excel 数据源仍应保持现有表向量召回行为。

Related PR: #1204

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions