(19)中华人民共和国国家知识产权局
(12)发明专利说明书
(10)申请公布号 CN 104123370 A
(43)申请公布日 2014.10.29
(21)申请号 CN201410356492.8
(22)申请日 2014.07.24
(71)申请人 杭州安恒信息技术有限公司
    地址 310051 浙江省杭州市滨江区通和路浙江中财大厦15层
(72)发明人 刘海卫 范渊 python正则表达式判断
(74)专利代理机构 杭州中成专利事务所有限公司
    代理人 周世骏
(51)Int.CI
      G06F17/30
                                                                  权利要求说明书 说明书 幅图
(54)发明名称
      数据库敏感信息探测方法及系统
(57)摘要
      本发明涉及信息安全技术领域,旨在提供数据库敏感信息探测方法及系统。该数据库敏感信息探测方法包括步骤:扫描数据库的系统视图,获取所有的用户表,对每一个用户表每个字段抽取一部分数据做为样本,对样本进行分析匹配,判断是否是敏感信息;该数据库敏感信息探测系统包括系统表、扫描模块、判断模块和显示模块,扫描模块和数据库连接,判断模块分别与敏感信息特征库、扫描模块相连,判断模块与显示模块连接。本发明基于正则表达特征库,通过特征库对数据库里的用户数据进行扫描探测,能够发现手机号、银行卡号、身份证号以及邮箱等敏感信息所在的位置,并提供详细的扫描报告,使数据库管理员能够重点防护和审计。
法律状态
法律状态公告日
法律状态信息
法律状态
权 利 要 求 说 明 书
1.数据库敏感信息探测方法,其特征在于,具体包括下述步骤:           
(1)扫描数据库的系统视图,获取所有的用户表;           
(2)对每一个用户表每个字段抽取一部分数据做为样本;           
(3)对样本进行分析匹配,判断是否是敏感信息;           
所述步骤(1)具体包括下述步骤:           
步骤A:连接数据库;           
步骤B:用SELECT语句获取数据库的系统视图里,数据库所有的表名,并排除系统            表,剩下用户表;           
步骤C:将步骤B中获得的用户表列表返回;           
所述步骤(2)具体包括下述步骤:           
步骤D:在步骤C返回的用户表列表中,取一个用户表名;           
步骤E:用SELECT语句和分页查询的方法,获取步骤D中选取的用户表中所有字段            的部分数据;所述部分数据是指取一个表开头的N条记录;           
步骤F:将步骤E中获取的所有字段的部分数据,作为样本数据返回;           
所述步骤(3)具体包括下述步骤:           
步骤G:取步骤F返回的一个字段的样本数据;           
步骤H:对步骤G中选取的样本数据,采用正则表达式匹配的方法判断样本数据是            否
属于敏感信息,判断方法为:如果样本数据全部跟敏感信息特征库中的敏感信息匹配,            认为样本数据是敏感数据字段,得出判断结果是;如果样本数据跟敏感信息特征库中的            敏感信息不低于80%的比例匹配,得出判断结果疑是;如果样本数据跟敏感信息特征库            中的敏感信息全部不匹配或者低于20%的比例匹配,则得出判断结果否;           
步骤I:循环执行步骤D、步骤E、步骤F、步骤G、步骤H,直至完成对步骤C返            回的所有用户表进行判断,然后将步骤H中得出的判断结果返回,并显示包含有判断结            果的扫描报告,且当判断结果为疑是或者是时,扫描报告中还包括敏感信息字段清单。           
2.根据权利要求1所述的数据库敏感信息探测方法,其特征在于,所述步骤H中            的敏感信息特征库是用于判断敏感信息的正则表达式的一个集合;敏感信息是指需要防            护和审计的数据,包括手机号、银行卡号、身份证号和邮箱。           
3.根据权利要求2所述的数据库敏感信息探测方法,其特征在于,所述敏感信息            特征库中的正则表达式能进行自定义添加,用于敏感信息的匹配判断;正则表达式是公            开通用的字符串匹配方法。           
4.实现权利要求1所述的数据库敏感信息探测方法的系统,其特征在于,包括系            统表、扫描模块、判断模块和显示模块,扫描模块和数据库连接,判断模块分别与敏感            信息特征库、扫描模块相连,判断模块与显示模块连接;