Qwen3.6 35B A3B 无法独自填写纸质表格。但如果给它配备 NVIDIA 的 LocateAnything-3B—HuggingFace 上排名第一的热门模型—作为它的“眼睛”,这两个小模型就能一起完成任务。
设置:
> Qwen 是大脑(主模型),LocateAnything 是眼睛(辅助模型作为工具)。
> 屏幕上的蓝色框是它的检测结果。看看它们有多精确—每个字段都精准命中。
结果:
> Qwen3.6 35B A3B + LocateAnything-3B:表格填写完成,姓名、出生日期、身份证、性别、婚姻状况...:全部落入正确的字段区域。
惊喜之处:
> Qwen 单独无法完成这个测试。附加一个专门做一件事的 3B 模型 > 定位
> 小模型的组合可以完成单个大模型的工作。
设置:
> Qwen 是大脑(主模型),LocateAnything 是眼睛(辅助模型作为工具)。
> 屏幕上的蓝色框是它的检测结果。看看它们有多精确—每个字段都精准命中。
结果:
> Qwen3.6 35B A3B + LocateAnything-3B:表格填写完成,姓名、出生日期、身份证、性别、婚姻状况...:全部落入正确的字段区域。
惊喜之处:
> Qwen 单独无法完成这个测试。附加一个专门做一件事的 3B 模型 > 定位
> 小模型的组合可以完成单个大模型的工作。
夜雨聆风