技术与标准 | 基于互联网教育应用软件的多维信息编码设计及应用
作者简介
常浩伦
中国信息通信研究院技术与标准研究所工程师,主要从事个人信息保护政策、标准研制等方面的研究工作。
臧磊
中国信息通信研究院技术与标准研究所副总工程师,高级工程师,主要从事个人信息保护、信息通信技术等方面的研究工作。
周颖
北京师范大学教育学部副教授,主要从事人工智能教育应用等相关研究工作。
论文引用格式:
常浩伦, 臧磊, 周颖. 基于互联网教育应用软件的多维信息编码设计及应用*[J]. 信息通信技术与政策, 2025, 51(10): 87-91.
基于互联网教育应用软件的多维信息编码设计及应用
常浩伦1 臧磊1 周颖2
(1 中国信息通信研究院技术与标准研究所, 北京 100191;
2 北京师范大学教育学部, 北京 100875)
摘要:当前,互联网教育应用软件存在底数不清、质量不一、个人信息保护能力参差不齐等问题,建立一种能够便捷识别互联网教育应用软件多维信息的编码方法,并以此完善互联网教育应用程序质量管理机制,能够帮助用户更好地选择使用合规好用的应用软件,也能够有效支撑管理部门进行监管治理。
关键词:互联网教育;应用软件信息编码;个人信息保护
0 引言
当前,互联网教育应用软件(Application,App)数量已达数千款,成为数字教育的主要载体。与此同时,用户对互联网教育App内容不规范、侵害用户隐私等问题的投诉也明显增多,主要面临3方面的问题:一是App分发方式较多,同类应用同质化严重,用户难以快速定位符合需求的产品;二是质量参差不齐,教育内容适配度、个人信息保护情况等用户使用前无法感知;三是监管治理复杂,省、市、县校等多级监管机构合规审查与风险管控成本高,缺乏高效的信息协同机制。构建能够表征互联网教育App基本信息、内容质量、安全能力等的多维信息编码,实现互联网教育App的唯一性标识与属性量化,并通过多维信息编码在监管机构、检测机构、App分发平台中的应用,可以提升互联网教育App的分发管理与质量管理水平。
1 多维信息编码的内容
1.1 互联网教育App信息表征维度
对互联网教育App进行多维信息编码是为了便捷、准确地识别不同互联网教育App,展示各个互联网教育App的质量评估结果,以此实现后续在互联网教育App分发和质量管理中的有效利用。因此,需在编码中体现4种信息。一是App识别属性信息:表征App的基础特征信息,并确保所选取的特征信息不可变更且不可混淆,同时需表征App开发者的相关信息,如开发者名称、所属地区等。二是App质量评估信息:表征用户重点关心的在使用教育服务过程相关的App质量和安全能力,通常包含教育内容适配情况、个人信息保护能力、应用功能成熟度等内容。三是App使用者信息:表征App教育内容或功能所适配的用户群体。四是App监管者信息:表征App的监管责任方。
1.2 互联网教育App识别属性信息
互联网教育App不可混淆的识别属性信息通常包括应用的开发者信息和应用自身相关特征信息,因不同应用形态自身特征信息不同,需在编码过程中对不同应用形态建立不同特征信息编码方式。App识别属性信息通常包括其名称、开发者、版本号、包名(Package Name)、安装包MD5(Message-Digest Algorithm 5)值等[1],其中包名和安装包MD5值通常用于对App的唯一识别。
包名是Android应用程序的唯一标识字符串,通常采用反域名(Reverse Somain Name)的命名方式,以确保包名的全局唯一性。包名由3个部分组成(如com。example。appname),三者之间用点来分割,各部分的含义为:“com”表示商业组织的包名前缀,而不是个人或其他类型的组织,前缀还可以为“net”(表示网络组织)、“org”(表示非营利组织)等;“example”是商业组织的域名(或代表组织的名称),App开发者需要写自己组织的域名(如公司名),以确保全局的唯一性;“appname”为应用名,是App开发者应用程序的特定标识,用于区分不同的应用程序。在iOS系统中,Bundle ID与Android中的包名相同,同样能够识别唯一的应用程序。
App安装包的MD5值作为一种哈希算法在软件分发场景中承担文件完整性校验功能[2],其通过将 App 安装包映射为 128 位十六进制哈希值(即 MD5 值),利用哈希函数的抗碰撞特性(不同文件难以生成相同哈希值)和敏感性(任意字节修改都会改变哈希值),构建了一套可靠的数字校验机制。在实际应用中,客户端通过二次哈希计算并比对服务器预存值,可以实现对文件篡改、传输错误的有效识别。
1.3 互联网教育App质量评估信息
互联网教育App质量评估信息是指对互联网教育App在不同维度上的评估情况,用以综合评价互联网教育App质量,通常从互联网教育App个人信息保护能力、教育内容适配情况、应用功能成熟度、社会评价情况等方面进行评估。通过将各项评估结果作为互联网教育App信息编码的要素,可以使用户通过编码了解互联网教育App综合质量情况,便捷选择使用互联网教育App。
个人信息保护能力是指对用户在使用互联网教育App的过程中,应用收集、使用、传输、加工等个人信息处理全生命周期的保护能力[3]。当前,部分互联网教育App超范围收集、不当共享、过度使用个人信息问题日益突出,对用户(尤其是未成年人)合法权益造成侵害,通过评估App是否能在当前法律法规要求下,按照其自身业务功能以最小必要、知情同意等个人信息保护基本原则开展个人信息处理活动,是评估互联网教育App能否高质量服务用户的重要指标之一。
教育内容适配情况是指互联网教育App中文本、图片、音视频类教学内容与其适用人群的适配程度,以及教育内容中是否存在不当教学内容、不良信息等方面的情况。通过评估教学材料和教学方法能否有效呈现教学内容,是否存在超标、惰化学生思维能力、影响学生独立思考、无效重复性作业等不当学科教学内容,是否存在低俗恶俗、教唆诱导、校园霸凌、商业广告、网络游戏等不良信息,能够有效应对教学内容表现形式多样、场景复杂、演化速度快、不良内容影响青少年健康成长等互联网教育内容方面的关键问题。
应用功能成熟度是指互联网教育App的功能完备性、易用性、稳定性和兼容性等方面的情况,具体包括用户界面设计是否能够适配不同年龄段学生的认知能力、审美偏好和操作习惯;应用是否能够在较大压力下保持流畅运行,避免出现卡顿、崩溃等现象;是否能够兼容手机、平板、电脑等多种终端,以及各类主流操作系统。
社会评价情况是衡量互联网教育App综合影响力的重要依据,涵盖学生、家长、教师等不同用户人群,以及行业管理部门、专家学者等多元主体的反馈与评价。学生作为直接使用者,更关注应用的趣味性、互动性以及对学习效果的提升;家长侧重于内容的安全性、教育理念的正确性和孩子学习习惯的培养;教师能够从教学适配性、资源专业性和辅助教学的有效性角度给出评价。行业管理部门基于政策合规性、数据安全性和行业规范,对应用进行监管与评估;专家学者凭借专业知识,从教育理论创新性、技术前瞻性和应用可持续发展等层面提出见解。这些不同角度的评价,共同构建起全面客观的社会评价结果。
1.4 互联网教育App使用者和监管者信息
互联网教育App的使用者(即适用对象)主要包括教育管理者、教师、学生、家长等,具体对于每一个互联网教育应用的注册用户,多数应用开发者也会在其服务端侧为每一个用户生成单独用户ID,以实现用户区分。互联网教育App的监管者是指对互联网教育应用履行应用备案、内容审核、网络和数据安全管理的相关机构,包括省、市、县校及其委托的执行机构。
2 多维信息编码的设计
2.1 识别属性信息编码设计
基于前文所述,对App识别属性信息进行编码的目的是实现对互联网教育App唯一性标识,App自身具有一定的常用特征信息(包括其名称、开发者、版本号、包名),相结合虽可识别唯一App,但上述元素均由应用开发者自行设定,针对恶意篡改或故意混淆的情况无法实现应用的唯一识别[4]。通过App国际标准包名规则与哈希算法,如安卓应用包名搭配其安装包MD5或SHA-256生成固定长度摘要,可以确保应用二进制文件的唯一性与完整性,以及通过数字签名技术对开发者颁发数字签名证书,包含证书颁发机构、序列号与签名哈希值,实现开发者身份的不可抵赖性。但不论对应用包名和安装包进行摘要值生成,还是对开发者进行数字签名,均存在编码字段较长的问题,如安装包MD5值通常以32位十六进制字符形式呈现[5],以此作为应用特征信息编码,并考虑后续与使用者、监管者信息相结合,将导致互联网教育App多维信息编码过长,不便于后续使用。
考虑App识别属性信息编码后既服务于用户对于互联网教育应用的检索(需具备一定可读性),也应用于分发和管理(需具备唯一性、不可篡改性),对App特征信息编码的设计可以采用应用开发者所属地区和应用安装包MD5值作为编码字段,两者信息的结合可以唯一识别互联网教育App,同时在应用分发平台或应用管理平台中将此编码作为索引,便于用户根据此编码快速检索经过核验的应用名称、开发者名称、评价信息等内容。对于应用开发者所属地区字段,考虑到互联网教育应用多数可以识别至省份而非县区,可以采用行政区划代码的前两位作为地区字段编码。对于应用安装包MD5值,考虑32位十六进制字符不便于展示,且互联网教育App数量有限,可以采用数据截断的方式对应用安装包MD5值进行有损压缩,压缩后的编码值结合开发者地区仍可以在一定程度内实现该编码值的索引作用。按上述方式对App特征信息编码的方式可以为8位字符,如110a501e,前两位为地区编码,后六位为截断后的应用安装包MD5值。
2.2 质量评估信息编码设计
为将互联网教育App质量评估信息融入多维信息编码,实现用户对互联网教育App质量的了解,可以采用可读性编码方式将互联网教育App多维测评结果进行编码展示。基于前述互联网教育应用质量评估维度,预留5位编码,每位编码为一项测评结果,每项评测结果归一量化为10分,即0~9编码代表1~10分;对于某些测评结果为空的,以n作为编码。
2.3 使用者信息编码设计
使用者信息编码采用角色类型、机构代码、用户序列号的三层结构。角色类型涵盖教师(T)、学生(S)、家长(P)、管理者(M)。机构代码可以引用行政区划代码与学校自定义编码;用户序列号按注册时间生成递增编号。例如,T-110101-SY012-0345251可表示北京市东城区编号为SY012学校中编号为0345251的用户。同时,可以将用户编码与权限矩阵绑定,学生用户自动关联内容浏览、作业提交等权限,教师用户则额外关联学情分析、资源上传等权限,通过编码前缀快速匹配权限规则,提升后台管理效率。考虑到大部分互联网教育App非机构所属,且在应用分发场景中对应用内分配的用户编号无法掌握,在一般编码过程中可以仅考虑使用者角色类型,同时考虑部分互联网教育App面向多个使用者角色提供服务,可以使用最长4位、最短1位的机构使用者编码,并以数字0代表未明确使用者的空值,如TP表示使用者为教师、家长,T表示使用者为教师,0表示未明确使用者。
2.4 监管者信息编码设计
监管者信息编码遵循国家—省—市—县—学校的五级结构,结合行政区划代码与教育部相关管理办法。国家级监管机构编码为CN-00-00-00-0000,省级机构如广东省教育厅编码为CN-44-00-00-0000,市级机构如广州市教育局编码为CN-44-01-00-0000,学校监管部门则在行政区划代码基础上添加学校自定义编码。此外,为每个监管动作分配唯一编码,如合规审查为SC、数据安全评估为DS、用户投诉处理为CP,通过监管机构编码与任务编码组合,实现监管流程的全链路追溯。考虑到大部分互联网教育应用监管机构以省划分,可以仅使用省份代码。
2.5 多维信息编码设计结果
综合上述App识别属性信息、质量评估信息、使用者信息、监管者信息编码设计,考虑互联网教育App多维信息编码使用场景,以混合方式形成16~19位互联网教育App多维信息编码可以满足当前互联网教育App管理,如110a501e-1234n-T-11,表示归属北京市、安装包MD5截断值0a501e、个人信息保护能力为1、教育内容适配情况为2、应用功能成熟度为3、社会评价情况为4、使用者为教师、监管机构为北京市的互联网教育App,且通过安装包MD5截断值0a501e可以在已建立的互联网教育App数据库中查询对应的应用名称、开发者名称、详细检测结果等信息(见图1)。

图1 互联网教育应用多维信息编码示例
3 多维信息编码的应用方法
3.1 构建教育App多维信息编码库
依托互联网教育App多维信息编码方法,可以建立针对互联网教育应用快速检索的多维信息编码库。其中对于App识别属性信息可以基于当前教育类App备案库获取部分应用基本信息,同时可从手机终端应用分发平台获取到各类互联网教育App安装包及其在工业和信息化部的备案信息,通过对上述互联网教育App信息的获取,可以通过工具解析App包名、获取安装包MD5摘要值等内容,并根据其功能和教学内容分析其使用对象。对于互联网教育App测评信息,当前多数第三方检测机构已开展互联网教育应用相关测评工作,通过对测评结果的接入和归一化处理可以获取满足多维信息编码需求的测评结果。基于上述信息的获取及分析完成信息编码,并以信息编码作为主键索引构建多维信息编码数据库,可以为互联网教育App行业提供全面的信息查询和展示渠道。当前,中国信息通信研究院、北京师范大学依托国家重点研发计划“互联网教育应用的个人信息保护审查技术”课题,初步搭建了互联网教育App的多维信息编码库,已有数千款App完成编码入库。
3.2 建立教育App信息编码共享机制
互联网教育App多维信息编码库可以与应用分发平台、检测机构、监管部门共享编码结果,多方共同以多维信息编码作为App管理和分发展示的重要因素,并且多方共同维护多维信息编码库中数据,在各项业务开展过程中通过多维信息编码库实时查询详细信息,可以帮助不同分发平台统一App信息、帮助监管机构及时了解App质量、帮助用户直观选择适合自身的互联网教育App。
3.3 依托信息编码构建教育App分发管理机制
在互联网教育App分发管理中,手机终端上的各应用分发平台承担了重要角色,通常用户主要通过应用分发平台获取互联网教育App相关信息,并在平台进行下载使用。在互联网教育App上架过程中应用分发平台会对其合规性进行审核,依托互联网教育App多维信息编码及信息共享机制,应用分发平台可以根据编码中的唯一值确定是否存在相同安装包更换名称的套壳上架行为,并且根据多维信息编码中各项测评属性,结合当前用户特征和偏好建立个性化搜索推荐方法。同时,在展示过程中,对质量较高的App优先推荐,对不同用户屏蔽不适合的App产品,以此帮助用户获取到更适合的互联网教育App。
3.4 依托信息编码构建教育App检测监管机制
在对互联网教育App检测监管过程中,通常会遇到不同检测机构、不同监管方对互联网教育App质量认定的结果存在差异或结果不能互认的问题。在互联网教育App多维信息编码中可以结合不同检测机构的App测评结果进行综合判断,使结果更具有权威性。同时,依托信息编码共享机制可以帮助监管机构通过统一信息编码互通App质量评价,避免不同属地监管机构间的信息不畅问题,并且在监管过程中可以依托信息编码动态调整监管策略,例如对于连续多版本质量评估较低的App可进一步加强管理要求和手段,对于持续质量评估较高的App予以一定程度的免检或作为优秀案例进行推广。
4 结束语
互联网教育App的高效管理和质量提升是互联网教育行业高质量发展的关键环节。本文对互联网教育App特性、质量评价、管理机制进行了研究,提出了针对互联网教育App质量管理的多维信息编码方法,通过该方法在互联网教育App信息管理、分发管理和监管治理等方面的应用,可以进一步提升互联网教育App的内容合规和信息安全,为学生、家长、教师的App选择和使用提供便利。
Research on the design and application method of multi-dimensional information coding of internet education Apps
CHANG Haolun1, ZANG Lei1, ZHOU Ying2
(1 Technology and Standards Research Institute, China Academy of Information and Communications Technology, Beijing 100191, China;
2 Faculty of Education, Beijing Normal University, Beijing 100875, China)
Abstract: Currently, internet education apps face problems such as unclear inventories, inconsistent quality, and uneven capabilities in personal information protection. Establishing an encoding method that can conveniently identify the multi-dimensional information of internet education apps, and improving the quality management mechanism for such apps based on this method, can help to users better select and use compliant and user-friendly apps. It can also effectively support regulatory authorities in carrying out supervision and governance.
Keywords:internet education; application software information encoding; personal information protection

本文刊于《信息通信技术与政策》2025年 第10期

主办:中国信息通信研究院
《信息通信技术与政策》是工业和信息化部主管、中国信息通信研究院主办的专业学术期刊。本刊定位于“ 信息通信技术前沿的风向标,信息社会政策探究的思想库 ”,聚焦信息通信领域技术趋势、公共政策、 国家/产业/企业战略,发布前沿研究成果、焦点问题分析、热点政策解读等,推动6G、新型工业化、人工智能、脑机接口、先进算力等技术产业的创新与发展,引导国家技术战略选择与产业政策制定,搭建产、学、研、用的高端学术交流平台。
期刊荣誉与收录情况
AMI(2022版)A刊扩展期刊
RCCSE中国核心学术期刊
入选中国科协信息通信领域高质量科技期刊分级目录
为进一步提高期刊信息化建设水平,为广大学者提供更优质的服务,我刊官方网站(http://ictp.caict.ac.cn)已正式投入运行,欢迎投稿!
推荐阅读

夜雨聆风
