DAY.08
今日关键词|表格结构·数据类型·引用方法
你有没有过这种体验:同事发来一个Excel表,你打开一看——M列藏着一个"备注",D列里混着文本和数字,某个单元格的公式拖不动、一拉就报错……你心想:"这张表到底是给人看还是给机器算的?"。这个问题,恰恰点中了今天内容的核心。先讲一件事:表格结构数据的骨骼长什么样。这件事决定了一张表是"能算"还是"只能看",也是整个CDA数据分析工具链的入口。今天我们用大白话拆开它。

一
🏗️ 表格的"骨骼":三层父子级结构
一个关键区分:表格结构数据 ≠ 表结构数据。
表格结构数据就是你在WPS表格/Excel里打开的那个东西。它有三层父子级关系:工作簿(.xlsx文件)是顶层,包含多个工作表(Sheet1、Sheet2...), 每个工作表由单元格区域组成 ,每个区域又由单元格构成。这就像一栋楼:工作簿是整栋楼,工作表是楼层,单元格是房间。
表结构数据则是数据库里的东西(MySQL、Oracle等),用SQL查询语言操作。表格结构数据"没有数据模型的概念,难以进行多个数据集的联合操作"——而表结构数据正是为"多表联合、数据模型"而生的。两者适用的工具和场景完全不同。
这个区分不是咬文嚼字。它直接决定了你能不能用VLOOKUP跨表查、能不能做透视表、能不能用Power Query合并——表格结构数据是为"直观操作和快速分析"设计的,而不是为"海量关联查询"设计的。认清楚手里数据的"骨骼类型",是选择分析工具的第一步。
二
🎨 表格的"皮肤":数字格式 ≠ 实际值
一个极易被忽视但极易出错的要点:单元格的显示格式不等于它存储的值。举个例子:一个单元格你看着是"125%",但它的实际值可能是1.25。你用这个单元格做SUM,加的是1.25而不是125。相反,你看着"3,000"(千位分隔符),它存的还是3000的数字值。格式的分类有:
数字格式影响计算结果(货币、百分比、日期等会改变显示但保留真实值);
显示格式仅影响视觉效果(字体、颜色、边框、对齐——纯粹是"穿衣服",不改变数据的本质)。
对于条件格式和图标集:红绿灯图标集只是基于数值的视觉映射,不会改变底层数据。
三
🩸 表格的"血液":四种数据类型
四种基础数据类型:
数值型(纯数字):可以做加减乘除。还有虽然是数字的不一定是数值型——身份证号、电话号码应该当字符型存储(因为不需要计算)。
字符型(文本型):汉字、字母、数字字符串。文本型单元格默认左对齐(数值型默认右对齐)。用来标识别,不能直接做数学运算。
逻辑值:只有TRUE和FALSE两个值。Excel中TRUE=1、FALSE=0(在参与数值运算时自动转换)。IF函数的核心判断依据就是逻辑值。
日期型:本质上是一个序列号——1900年1月1日为第1天。所以"2026-05-08"减去"2026-05-01"等于7,是序列号算术。
四
🔗 单元格引用:当你"拉公式"时到底发生了什么
相对引用(如A1):公式复制时,引用位置随公式移动而同步移动。你从B1复制到B2,A1自动变成A2。不是固定地址,是相对位置关系。
绝对引用(如A$1):无论公式复制到哪,永远指向A1。符号钉住了列也钉住了行。
混合引用(如A1或A$1):一边钉住一边不钉。A1钉住了列不钉行,横向拉不动纵向可以动;A1钉住了行不钉列,纵向拉不动横向可以动。
五
🤖 分析师与AI协作
今天的内容看起来"基础",但它回答了一个根本问题:你为什么能在Excel里做数据分析?因为表格有一套严格的规则系统——数据类型定义了什么能算、按什么规则算;引用方法定义了什么能被拖动、按什么逻辑联动;格式定义了什么能看见、以什么形态呈现。AI可以帮你写SUMIF,但它不知道你的A1到底是数值型还是文本型——只有你知道这个字段"应该"是什么。
点击蓝字 关注我们
夜雨聆风