
科学研究与应用
Journal of Scientific Research and Applications
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-7071(P)
- ISSN:3080-0757(O)
- 期刊分类:科学技术
- 出版周期:月刊
- 投稿量:4
- 浏览量:386
相关文章
暂无数据
基于图书馆数据分类分级机制研究——以佛山市图书馆为例
Research on Classification and Grading Mechanism Based on Library Data: Take Foshan Library as an Example
引言
全球一体化背景下,数据作为数字经济时代的核心要素,已成为推进数智化发展的重要生产资料,是国家基础性战略资源,其规模庞大、种类繁多、状态多变。随着信息化的快速发展,图书馆的业务系统积累了大量数据,数据的共享和流通给读者带来便捷,同时也衍生出数据安全问题,读者个人信息泄露和数据违规使用等问题尤为突出,让数据安全问题成为关注的焦点。目前图书馆领域尚缺乏统一性的数据分类分级指南或细则,如何构建一个系统且全面的数据分类分级保护体系成为图书馆急需解决的难题。数据分类分级作为数据治理重要环节,通过建立数据保护与利用之间的桥梁关系,为数据保护工作提供坚实的基础。最后通过引入业务导向型的人工智能自动化技术,能更加精准地识别和评估数据的安全风险,从而制定出更为科学有效的数据保护措施,实现图书馆数据“管”和“用”两手抓,为图书馆智慧化转型业务提供强有力数据支撑。
1 图书馆数据分类分级概述
1.1 国内数据分类分级政策现状
我国数据分类分级制度体系已初步形成。2021年《数据安全法》第十九条首次以法律形式确立数据分类分级保护制度。随后,《数据二十条》进一步要求建立三类数据的分类分级确权授权机制,《网络数据安全管理条例》则细化规定了重要数据目录管理制度,为制度实施提供了法律保障。
在标准建设方面,2024年,《数据安全技术 数据分类分级规则》(GB/T43697-2024)构建了统一的技术框架。各行业结合自身特点制定了专门标准,如金融领域的《金融数据安全数据安全分级指南》、工业领域的《工业数据分类分级指南(试行)》等。地方层面,贵州(2016)、上海(2019)、重庆(2021)等地相继出台公共数据分类分级指南,在分类维度(主题/行业/对象)和分级标准(公开/受限/敏感/涉密)等方面各具特色。
这些法律标准和实践表明,我国数据分类分级工作已从政策引导转向全面实施,形成了多层次、多领域的制度体系,为数据要素市场化奠定了坚实基础。
1.2 数据分类分级概念
当前,数据分类与分级虽未形成统一定义,但业界普遍认为二者属于不同维度的概念。本文基于现有法律法规和行业标准,系统梳理其核心内涵。
国家标准《GB/T38667-2020 信息技术大数据数据分类指南》指出,数据分类是依据大数据的属性或特征,按照特定原则与方法进行的类别划分。《DB33/T2351-2021 数字化改革 公共数据分类分级指南》(浙江地标)进一步明确,数据分类是按公共数据的共有属性或特征加以归类的过程;而数据分级则是依据数据被破坏所产生影响的程度来确定其级别。全国信息安全标准化技术委员会《网络安全标准实践指南(TC260/PG—20212A)》提出以“面分类法”在不同维度上划分数据类型,再通过“线分类法”细化具体类别;其数据分级理念基本一致,即根据数据受损后对不同对象造成的影响,将其划分为一般数据、重要数据和核心数据三级。结合图书馆数据特点,可将数据分类理解为:基于公共数据的属性与特征,遵循既定原则与方法,建立分类体系与排序方式,以实现更高效管理与使用的过程。而数据分级则指:依据数据的重要性及其在遭受篡改、破坏、泄露或非法使用时,对国家安全、公共利益或个人、组织权益可能产生的危害程度,划分为若干级别,进而确定相应的保护措施。
2 图书馆数据分类分级机制研究意义
在当前数字化进程中,数据在驱动经济社会发展的同时,也带来了诸如个人隐私泄露、敏感数据非法交易与非授权使用等一系列安全问题,已逐渐演变为系统性风险。为此,数据分类分级保护机制作为一项重要的制度性安排被提出并在实践中广泛应用。公共图书馆作为典型的公共文化服务机构之一,在日常运营与服务提供过程中积累了大量用户数据与业务数据,其在执行数据分类分级方面的实践意义体现在以下三方面:其一,顺应《中华人民共和国数据安全法》等相关法规日趋严格的监管要求,通过对数据进行科学归类与定级,明确重要数据和核心数据范围,建立差异化保护体系与数据流动负面清单,从而实现精准防护与依法有序流通的统一;其二,依托分类分级过程实现对机构内部数据资产的系统梳理,进而设定差异化的审批权限与保护程序,并将风险评估前置于数据处理环节,依据数据重要性、敏感度及所涉个人信息规模等因素,系统提升数据安全管理的全过程能力;其三,面向智慧图书馆建设的现实需求,在广泛应用物联网、人工智能与大数据的背景下,构建基于分类分级的数据治理框架,不仅是应对合规挑战的必要举措,也为实现数据资源的有序流动与价值释放奠定了制度基础。
3 图书馆数据分类分级方法研究实践
3.1 图书馆数据现状
1993年,佛山市图书馆重建开馆正式从传统手工迈向自动化时代。佛山市图书馆自动化系统经历ZSLAIS、ILAS、Unionlib直至现今的Uilas,历经蜕变,实现了显著的进步与发展。在信息化浪潮的强劲推动下,一系列配套对外服务系统如雨后春笋般涌现,紧密贴合图书馆自动化系统的需求,共同构筑起一个日益成熟且功能全面的系统生态架构。在这个过程中提供的公共服务与管理业务日益增多,因此积累了大量的数据。这些数据具有数据量大、数据类型复杂多样、数据增长速度快的特点。
3.2 数据分类和分级的方法
数据分类分级工作是一项涉及数据全生命周期、全业务范畴以及全员参与的持续性工作。图书馆在依法提供公共文化服务过程中收集、产生的数据属于公共数据。数据分类先从组织经营维度、再业务属性的方式进行分类,结合行业主管部门指南按主题域(见),对图书馆数据分为四大主题域,按业务分为十个业务域,每个业务系统按业务类型划分到不同的业务域中。针对结构化数据,从业务系统-功能模块-功能点-数据表-数据字段对业务系统进行逐步降维,形成图书馆数据分类规则。
数据分级是基于分级要素进行综合判定,主要从影响对象、影响程度两个要素进行分级。图书馆数据不涉及国家安全,影响对象可分为无影响、轻微影响、一般影响、严重影响;影响对象包含社会稳定、公共利益、组织权益、个人权益四个对象。设定安全等级为1级、2级、3级、4级共四个级别。
3.3 数据分类分级流程
图书馆数据分类分级工作流程可分为数据资产清单梳理、数据分类分级规则制定、重要数据识别与管理、数据动态管理,流程如图所示。数据分类分级工作的实施流程可分为四个关键环节:首先,需对图书馆全域数据资产进行全面识别与系统梳理,建立包含结构化、半结构化和非结构化数据在内的完整资产清单。对于结构化数据,应当详细记录其来源业务系统、数据库/表信息、字段中英文对照、技术说明及业务属性等元数据。其次,依据既定的数据分类框架,将识别出的数据资产科学划分至相应的主题域和业务域,同时按照行业规范标注主数据,并将涉及个人信息的数据明确标识为敏感数据予以重点保护。在数据分级环节,需要综合运用定性与定量分析方法,系统评估数据遭受侵害后可能产生的对象、范围与程度等多维影响,从而建立科学的分级标准。特别需要强调的是,图书馆在提供公共借阅服务过程中积累的用户数据和借阅记录,因其公共属性和规模效应,应当被纳入重要数据目录进行严格管理,并参照国家和行业标准制定相应的保护措施。最后,为确保数据分类分级工作的持续有效性,必须建立动态更新机制,将此项工作纳入常态化管理体系,并配套相应的政策支持和考核机制,以实现数据资产目录的持续优化和长效维护。
4 人工智能技术赋能图书馆数据分类分级
数据分类分级作为数据治理与安全合规的核心环节,在实施过程中面临数据资产识别困难、资源目录生成复杂以及分类分级准确性不足等挑战。传统人工标注方法存在效率低下、主观偏差显著以及动态调整滞后等问题,亟需引入人工智能技术重构工作流程。研究表明,基于DeepSeek-R1等大语言模型的智能解决方案可显著提升数据处理效率:其高效推理能力可优化复杂数据类型的动态识别,智能标注系统能降低资源投入,批量处理功能则大幅超越传统方法的处理效率。
在图书馆数据治理场景中,人工智能技术可在三个关键环节发挥重要作用:首先,通过结合规则引擎与AI模型引擎,利用元数据解析技术和自然语言处理(NLP)能力,实现跨数据库(MySQL、Oracle等)的自动化数据识别与语义建模,构建准确的数据资产清单;其次,借助上下文感知与动态迭代技术,基于字段元数据和语义分析实现重要数据的智能识别,特别是对身份证号等敏感信息的正则匹配;最后,通过实时监控与智能分析功能,动态调整分类分级策略,自动检测数据不一致性问题并提供优化建议,持续提升数据质量管理水平。这种智能化改造不仅解决了传统方法的效率瓶颈,更通过知识库支持与学习机制,使分类分级工作具备持续优化的能力,为图书馆业务提供更可靠的数据基础。
数据分类分级是数据治理与安全合规的核心环节,是一项长期工程。在实施过程中面临流程长、涉及范围广,缺乏专业技术人员等挑战,数据分类分级存在数据资产识别和梳理难、数据资源目录生成难和分类分级准确率不高问题挑战。传统人工标注需逐项解读海量字段,命名不规范字段易产生主观偏差,动态调整机制滞后难以应对数据频繁变化场景,亟需通过人工智能技术重构流程,提升数据分类分级工作的效率和准确性。
5 总结
通过对图书馆的数据分类和分级治理进行了深入研究,总结政府和行业经验,并结合当前数据现状,提出了数据分类分级的框架和安全等级与判别标准,最后制定了数据分类分级的工作流程。随着DeepSeek大模型的发展和应用,在数据梳理、敏感数据识别以及数据动态管理方面,通过提升算法效率和加强大模型学习,推进数据分类分级自动化流程,从而提升图书馆数据治理水平,为图书馆数据孪生工作提供高质量数据基础。
参考文献:
- [1] 夏义堃.数据管理视角下的数据经济问题研究[J].中国图书馆学报,2021,47(06):105-119.
- [2] 中华人民共和国国家互联网信息办公室.中华人民共和国数据安全法[EB/OL].(2021-06-10)[2025-05-22].https://www.cac.gov.cn/2021-06/11/c_1624994566919140.htm.
- [3] 中华人民共和国中央人民政府.中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见[EB/OL].(2022-12-19)[2025-05-22].https://www.gov.cn/gongbao/content/2023/content_5736707.htm.
- [4] 网络数据安全管理条例[N].人民日报,2024-10-10(015).
- [5] 全国网络安全标准化技术委员会(SAC/TC260).数据安全技术 数据分类分级规则:GB/T43697-2024[S].北京:中国标准出版社,2024.
- [6] 浙江省市场监督管理局.数字化改革 公共数据分类分级指南:DB33/T2351-2021[S].杭州:浙江省市场监督管理局,2021.
- [7] 全国金融标准化技术委员会(SAC/TC180).金融数据安全 数据安全分级指南:JR/T0197-2020[S].北京:全国金融标准化技术委员会,2020.
- [8] 工业和信息化部办公厅.关于印发《工业数据分类分级指南(试行)》的通知[EB/OL].(2020-02-27)[2025-05-22].https://www.cac.gov.cn/2020-03/08/c_1585210563153197.htm.
- [9] 贵州省质量技术监督局.政府数据 数据分类分级指南:DB52/T1123-2016[S].贵阳:贵州省质量技术监督局,2016.
- [10] 上海市经济信息化委.关于印发《上海市公共数据开放分级分类指南(试行)》的通知.[EB/OL].(2019-11-07)[2025-05-22].https://app.sheitc.sh.gov.cn/xxfw/684077.html.
- [11] 重庆市大数据应用发展管理局.关于印发《重庆市公共数据分类分级指南2.0(试行)》的通知.[EB/OL].(2023-07-23)[2025-05-22].https://www.cqca.edu.cn/uploadfile/ueditor/file/202308/1691897739c822d4.pdf.
- [12] 信安标委发布《网络安全标准实践指南——网络数据分类分级指引》[J].自动化博览,2022,39(01):6.
- [13] 黄海,李正强.佛山市图书馆集成系统的应用与迁移(1993-2016)——兼论图书馆集成系统的选型[J].图书馆论坛,2017,37(07):68-73.
- [14] 刘斌,黄婧,李峰,等.大数据环境下高校图书馆数据管理与分析应用实践——以北京师范大学图书馆为例[J].数字图书馆论坛,2018(10):54-59.
- [15] 卢启刚,杨克松,王建,等.企业数据分类分级自动化路径研究[J].网络安全与数据治理,2024,43(06):47-52.
- [16] IT之家.DeepSeek-R1模型发布,性能对标OpenAIo1正式版[EB/OL].(2025-01-20)[2025-05-22].https://baijiahao.baidu.com/s?id=1821775242356587266&wfr=spider&for=pc.
- [17] 中孚信息.基于大模型进行数据分类分级实操指南[EB/OL].(2025-01-30)[2025-05-22].https://blog.csdn.net/m0_59163425/article/details/145400208.
