造价AI周报:拆解"幻觉"风险

本周结论
本周行业核心矛盾浮出水面:AI正在为造价咨询导入一种新型风险——”幻觉”数据。
波兰承包商Exdrog因AI在投标澄清文件中编造不存在的税务文件,被国家上诉委员会裁定废标,一个价值超1500万兹罗提的道路养护项目就此旁落。
这不是技术事故,而是管理事故:当一线团队”野生”使用AI生成标书,而总部审核机制未能跟上,AI的”自信”就成了公司的”盲区”。
这提醒我们:在追求效率之前,必须先建立一套验证AI输出的护栏。全过程咨询与跟踪审计的”杀招”,将不再是简单”用AI”,而是”审AI”。
本周重点
1. 行业警报:AI正在工程领域”编故事”
发生了什么:
-
波兰承包商Exdrog在道路养护项目中投出异常低价,提交了280页AI生成的澄清文件,其中引用的”税务文件”在波兰公共数据库中根本不存在。竞争对手揭发后,标书被裁定废标[1]。
-
佐治亚理工学院研究指出:AI可能将旧版地质报告解读为合规依据,忽略后续关键修订,且 AI生成错误的速度和”权威语气”比错误本身更危险[2]。
对造价行业的启示:
当AI给出一个”专业”的土方单价时,它可能在编造。对于全过程咨询和跟踪审计而言,必须建立”AI输出复核清单”。
所有AI生成的价格、定额、工期信息,必须附带可追溯的原始来源(如造价信息网、定额截图),否则AI的”幻觉”会成为审计报告中的致命陷阱。
中国国家审计署在2026年1月发布的指南中已明确将”AI幻觉与欺骗导致结论失真”列为大模型在审计应用中的五大风险之一[3]。
2. 新解法:用”私有知识库”根治造价AI的胡说八道
解决方案路径:
-
给AI加上”外挂数据库”:将历史审计底稿、地方调价文件、企业成本数据库上传,让AI只在这些真实材料中检索回答,而非自由发挥。
-
广联达造价圈研究院建议的三步法:
①精细化整理知识素材(清单规范、当地定额、高频政策);
②选择工具(如腾讯IMA)搭建知识库;
③场景化验证与持续迭代[4]。
-
国网湖南电力已落地实践:采用”数据治理—知识增强—智能应用”体系,覆盖土建、电气、造价等领域的专业知识库,推理准确率达90%。
对跟踪审计的启发:
在大型项目群管控中,部署内部 RAG 系统能有效消灭”凭空编数据”的风险。AI只应在划定范围内作答,超出知识库边界的问题应主动”说不知道”。
3. 实战数据:AI 提量效率真实,但 50% 复核率是底线
最新数据:
-
广联达AI提量(土建)准确率达 98%以上,编制效率提升50%-70%,智能清标将3-5天工作量压缩至4小时内[6]。
-
中关村科金×宁夏交建的”灵筑”平台采用”行业知识库+大模型+RAG”架构,成本核算表公式准确率高达 98.7%[7]。
“50%人工复核率”才是关键:
效率提升是真实的,但2%左右的误差率在工程结算中意味着什么?一个5000万的项目,2%就是100万的偏差。
这意味着在跟踪审计中,AI应定位为”扫描仪”而非”终审员”。
建议用AI先完成”可疑项标记”(如单价异常、工程量偏差超10%),再集中精力处理这些标红项,而非全盘信任AI的结论。
一句话总结
造价AI这一周经历了从”神话破灭”到”方法论落地”:
少听AI的”结论”,多查AI引用的”来源”。
Exdrog的280页投标书在AI看来”天衣无缝”,在现实中却是废标的铁证。
参考资料
-
GoalFore《”AI幻觉”,刚刚废掉了一个国际工程标》
-
Construction Dive《When AI chatbots hallucinate, infrastructure pays》
-
国家审计署《生成式大语言模型在审计中的应用:场景、风险及对策》
-
广联达造价圈《AI时代,造价人如何拥有第二大脑?》
-
国网湖南电力《技经智能体启动试点应用》
-
新华社《广联达DATA+AI全新解决方案发布》
-
中关村科金《”灵筑”平台:驱动工程行业智能化转型》
👉以上,既然看到这里了,如果觉得不错,随手给个点赞、分享、推荐三连吧~谢谢你看我的文章,愿你天天歪瑞古德。我们,下次再见。
夜雨聆风