1 / 14
文档名称:

信息安全技术 声纹识别数据安全要求.docx

格式:docx   大小:350KB   页数:14页
下载后只包含 1 个 DOCX 格式的文档,没有任何的图纸或源代码,查看文件列表

如果您已付费下载过本站文档,您可以点这里二次下载

分享

预览

信息安全技术 声纹识别数据安全要求.docx

上传人:书籍1243595614 2025/5/5 文件大小:350 KB

下载得到文件列表

信息安全技术 声纹识别数据安全要求.docx

相关文档

文档介绍

文档介绍:该【信息安全技术 声纹识别数据安全要求 】是由【书籍1243595614】上传分享,文档一共【14】页,该文档可以免费在线阅读,需要了解更多关于【信息安全技术 声纹识别数据安全要求 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。
CCS L 80
中华人民共和国国家标准
GB/T XXXXX—XXXX
     
信息安全技术 声纹识别数据安全要求
Information security technology — Security requirements of voiceprint recognition data
     
(征求意见稿)
(本稿完成时间:2021年4月28日)
在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。
(本稿完成日期:)
XXXX - XX - XX发布
XXXX - XX - XX实施
GB/T XXXXX —XXXX
1
信息安全技术 声纹识别数据安全要求
范围
本文件规定了声纹识别数据的基本安全要求、安全处理和安全管理要求。
本文件适用于声纹识别数据控制者安全开展声纹识别数据相关业务。
规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 35273-2020 信息安全技术 个人信息安全规范
GB/T AAAAA-AAAA 信息安全技术 网络数据活动安全要求
GB/T BBBBB-BBBB 信息安全技术 生物特征识别信息保护基本要求
JR/T 0164-2018 移动金融基于声纹识别的安全应用技术规范
术语和定义
GB/T 35273-2020、 GB/T AAAAA-AAAA、GB/T BBBBB-BBBB和JR/T 0164-2018 中界定的以及下列术语和定义适用于本文件。
数据主体data subject
声纹识别数据所标识或者关联的自然人。
[来源:GB/T 35273-2020, ,有修改]
数据控制者data controller
有能力决定声纹识别数据处理目的、方式等的组织或个人。
[来源:GB/T 35273-2020, ,有修改]
语音样本 speech sample
语音的数字化表示。
直接从数据主体采集的语音样本中蕴含数据主体的声纹信息。
声纹是对语音样本中所蕴含的、能表征和标识数据主体的语音特征,以及基于这些特征(参数)所建立的语音模型的总称。
GB/T XXXXX —XXXX
2
声纹语音样本 voiceprint speech sample
与数据主体直接或间接关联的,可通过声纹来识别数据主体唯一身份的语音样本或语音样本的聚集。
智能语音交互过程中所采集的语音样本如未经过特殊处理,可用于识别数据主体,也属于声纹语音样本。
可以通过某些技术手段消除或破坏语音样本中的声纹信息,这时的语音样本无法通过声纹来识别数据主体身份,不属于声纹语音样本。
声纹特征 voiceprint feature
从数据主体的声纹语音样本中所提取的,可以表征该数据主体语音个性特点的参数。
常用的特征参数包括频谱(spectrum)、倒频谱(cepstrum)、线性预测系数(LPC)、音高(pitch)、声调(tone)、共振峰(formant)、音质(voice quality)、声韵(prosody)、习语(phoneme/word idiolect)等各种层次的信息。
声纹特征具有不可逆性,无法还原出声纹语音样本。
[来源:JR/T 0164-2018,,有修改]
声纹模型 voiceprint model
对声纹特征进行描述的数学模型或模型参数的取值。
常用的数学模型有:高斯混合模型(Gaussian mixture model)、基于通用背景模型的高斯混合模型(Gaussian mixture model-universal background model)、隐马尔可夫模型(hidden Markov model)、人工神经网络(artificial neural network)、支持向量机(support vector machine)等。
一些数学模型可以生成表征和标识数据主体的参数,这些参数常常对应具体某个数据主体的模型参数的取值,也简称为声纹模型。
[来源:JR/T 0164-2018,,有修改]
声纹识别数据 voiceprint recognition data
声纹语音样本及其处理得到的,可单独或结合其他信息识别数据主体身份的数据。
声纹识别数据包括声纹语音样本、声纹特征和声纹模型。
匿名化 anonymization
通过对个人信息的技术处理,使得数据主体无法被识别或者关联,且处理后的信息不能被复原的过程。
个人信息经匿名化处理后所得的信息不属于个人信息。
[来源:GB/T 35273-2020,,有修改]
GB/T XXXXX —XXXX
3
概述
声纹识别数据活动典型场景
声纹识别数据活动典型场景包括声纹识别应用场景、科学实验场景、非声纹识别的语音应用场景等(见附录A),在各场景中声纹识别数据活动所涉及的角色,以及数据控制者所控制的数据内容不同。
声纹识别应用场景
声纹识别数据用于识别数据主体身份的场景。根据具体实现声纹识别的方式不同,此场景可细分为独立实现声纹识别和合作实现声纹识别两种情况。
在独立实现声纹识别的场景中,只有1类数据控制者,控制的数据包括声纹语音样本、声纹特征和声纹模型,通常还包括其他个人信息,。
典型应用场景如:移动设备声纹解锁屏、声纹门禁、声纹锁、远程声纹身份认证等。
在合作实现声纹识别的场景中,有2类数据控制者,数据控制者A控制声纹语音样本,通常还包括其他个人信息,数据控制者B控制声纹特征和声纹模型,。
典型应用场景如:应用服务商(数据控制者A)在所提供的服务中嵌入声纹识别功能,声纹识别功能由声纹识别服务商(数据控制者B)提供,包括手机银行APP、社保APP等。
科学实验场景
声纹识别数据用于开展与语音有关的科学实验活动的场景。在此场景中有1类主要的数据控制者,控制的数据包括声纹语音样本、声纹特征和声纹模型,通常还包括其他。当该数据控制者收集声纹语音样本时,可能会引入第三方和其他数据控制者,。
典型应用场景如:科研机构(数据控制者)委托第三方采集或标注声纹语音样本并开展研究工作,包括高校进行声纹技术处理研究等。
非声纹识别的语音应用场景
声纹语音样本未用于识别数据主体身份的场景。在此场景中只有1类数据控制者,控制的数据是声纹语音样本,可能包括其他个人信息,。
典型应用场景如:提供智能语音技术应用但不涉及声纹识别的场景,包括智能音箱语音唤醒、智能语音系统交互、自动语音翻译、根据语音样本识别数据主体的年龄、性别、口音、情感、健康信息等。
基本安全要求
声纹识别数据控制者应遵循GB/T 35273-2020、GB/T AAAAA-AAAA和GB/T BBBBB-BBBB的相关安全要求。
安全处理要求
通用安全处理要求
采集
对数据控制者的要求包括:
采集声纹语音样本前,应告知数据主体使用声纹语音样本、声纹特征、声纹模型等声纹识别数据的目的、方式和范围,以及存储时间等信息,并征得数据主体的明示同意。
GB/T XXXXX —XXXX
4
采集声纹语音样本时,应使用安全的语音采集设备。
安全的语音采集设备是指具备保证其应用方数据支配权、产品控制权、产品选择权等不受损害的信息技术产品。
采集声纹语音样本时,应通过人工监督的方式确保语音内容不包含数据主体完整的身份证号码、姓名、手机号码、账号口令等个人信息。
声纹语音样本采集有现场监督人员时,监督人员应提供指导,确保不采集非授权人员的信息、以及现场没有其他非授权人员和设备录制语音。
声纹语音样本采集无现场监督人员时,应提前告知采集注意事项,布置特定场所进行采集的,应设置单独隔音的空间,确保不采集非授权人员的信息、以及周围没有其他非授权人员和设备录制语音。
传输和存储
对数据控制者的要求包括:
应使用必要的隔离,或采用加密技术、使用安全的硬件存储设备等,确保声纹识别数据传输和存储时的信息安全。
必要的隔离包括虚拟专网、物理专网等。
存储和传输声纹识别数据时,不应在文件名中出现能识别数据主体的信息;宜嵌入声纹识别数据的处理时间、处理设备、处理软件、数据控制者等信息,便于安全事件发生后的追溯。
不应存储声纹语音样本,经安全影响评估达到必要的数据安全能力要求并获得数据主体书面授权的除外;获得授权同意存储时,不应与声纹特征、声纹模型直接关联,且不应超出授权存储期限。
书面授权指通过合同书、信件、电报、传真、电子数据交换和电子邮件等方式进行授权。
未经明示授权的程序不应对存储在终端设备内部的数据有读、写、修改和删除权限。
确需存储数据主体的身份信息、声纹特征和声纹模型时,应采用物理或逻辑隔离的方式分别存储这三类信息,并且数据主体的身份信息不应与声纹特征、声纹模型直接关联。
删除
对数据控制者的要求包括:
应提供数据主体撤回授权、明示停止使用声纹识别数据的方法并保持方法有效。
在数据主体撤回授权、授权到期、明示停止使用声纹识别数据后,应对声纹识别数据进行删除或匿名化处理。
应确保被删除的声纹识别数据不可恢复。
声纹识别应用场景安全处理要求
,对数据控制者的要求还包括:
不应将收集声纹语音样本作为使用产品或服务的前提条件,提供产品或服务基本业务功能所必须的情况除外。
基本业务功能是满足数据主体选择使用产品和服务的最主要需求和根本期待的业务或功能。
开展声纹身份识别相关业务时,应同时提供声纹识别以外的其他身份识别方式,并由数据主体主动选择,收集声纹语音样本是提供产品或服务基本业务功能所必须的情况除外。
在数据主体拒绝使用声纹识别方式进行身份识别时,不应频繁提示数据主体应用声纹识别功能。
采集声纹语音样本用于声纹注册时,应先对用户进行身份核验。
不同应用场景适用不同的核验要求。
GB/T XXXXX —XXXX
5
应采用相关技术手段防止针对声纹身份识别应用的呈现干扰攻击。
具体技术手段包括: 语音鉴伪、语音质量检测、语音内容识别等。
不应共享、转让声纹识别数据。因业务需要,确需共享、转让的,应单独向数据主体告知目的、涉及的声纹识别数据类型、数据接收方的具体身份和数据安全能力等,并获得数据主体的书面授权。
声纹识别数据不应用于除身份识别之外的其他目的,包括但不限于评估或预测数据主体的年龄、性别、口音、情感、兴趣、偏好、健康信息等。
科学实验场景安全处理要求
,对数据控制者的要求还包括:
不应以欺诈、诱骗、误导的方式收集声纹语音样本。
不应从非法渠道收集声纹语音样本。
采集声纹语音样本前,应向数据主体展示“科学实验场景知情同意书”(示例见附录C),并获得数据主体的书面授权。
应单独向数据主体告知科学实验目的,保证不直接用于商业目的,获得数据主体书面授权后,应妥善保管授权材料以便未来追溯。
应制定科学的研究实验计划,明确说明研究目的、意义及必要性,相关实验设计、研究过程中可能涉及到的合作及相关数据委托、共享需求,并依照最小必要原则,制定采集数量、声纹识别数据及其关联信息的采集方法等。
不应使用概括性语言综述声纹识别数据的用途,如“用于科研目的”此类描述,而应明确写明,如“用于进行防录音攻击算法的研究”等此类描述。
不应过度收集数据主体的个人信息,应只记录与科学实验目的有关的必要的个人信息。
必要的个人信息包括年龄、性别、口音、情感、健康信息等。
声纹识别数据和关联信息应仅用于获得授权的研究开发活动。
委托第三方收集声纹语音样本或对声纹语音样本进行标注的,应在 “科学实验场景知情同意书”中指明并获得数据主体的授权同意。
涉及委托事项的“科学实验场景知情同意书”要求如下:
应明确告知数据主体委托的具体信息和期限;
不应要求获得对声纹语音样本委托事项以外的处理授权;
应明确要求被委托者完成数据交付后及时删除存储的声纹语音样本和其他个人信息。
涉及共享的“科学实验场景知情同意书”要求如下:
应明确告知数据主体共享的方式、对象和期限;
应明确要求接受共享者完成科学实验后及时删除存储的声纹识别数据和其他个人信息;
应明确要求接受共享者不得再次共享或转让存储的声纹语音样本。
不应转让声纹语音样本。
通过共享方式收集声纹语音样本的,应规定共享使用的期限,且不应再次共享。
应对声纹识别数据进行去标识化处理,科学实验目的完成后应及时删除声纹识别数据。
非声纹识别的语音应用场景安全处理要求
,对数据控制者的要求还包括:
应明示告知数据主体产品或服务所具有的收集声纹语音样本的功能,并声明和承诺所收集的声纹语音样本不用于声纹识别。
应通过语音转换等技术手段消除或破坏语音样本中的声纹信息后再进行处理。
GB/T XXXXX —XXXX
6
原则上不应存储声纹语音样本,确需存储的,应限定存储期限,另行明示告知并获得授权后方可进行存储,且应采用物理或逻辑隔离的方式分别存储声纹语音样本与数据主体的身份信息。
不应向第三方共享或转让声纹语音样本。
安全管理要求
对数据控制者的安全管理要求包括:
应在应用声纹识别技术前,开展应用场景安全评估,评估内容包括但不限于应用声纹识别技术的必要性、适当性,以及数据主体自愿性等,并形成评估报告。
应根据相关标准定期对涉及声纹识别数据的系统开展安全检测,形成安全检测报告,采取措施应对发现的安全问题。
在我国境内收集或产生的声纹识别数据,应在境内存储,因业务需要确需出境的,应遵循国家相关规定和相关标准的要求。
在发生或者可能发生声纹识别数据泄露、损毁、丢失的情况时,应立即采取补救措施,按照规定及时告知数据主体,并向相关主管部门报告。
安全事件发生后,应及时追溯声纹识别数据来源,并采取补救措施,包括通知数据主体,删除或撤销已泄露数据,重建不同的声纹模型等。
应制定声纹识别数据保护策略,清晰、准确、完整地描述对于声纹识别数据的处理行为并公开发布,确保数据主体易于理解。
应采取措施确保数据主体权利,包括但不限于获取声纹识别数据使用情况、撤回授权、注销账号、投诉、获得及时响应等。
GB/T XXXXX —XXXX
7
(资料性)
声纹识别数据活动的典型场景
声纹识别应用场景
采用声纹识别技术识别数据主体身份的应用场景,根据具体实现声纹识别的方式不同,分为独立实现声纹识别和合作实现声纹识别两种情况。
独立实现声纹识别时,:
独立实现声纹识别的应用场景
合作实现声纹识别时,:
GB/T XXXXX —XXXX
8
合作实现声纹识别的应用场景
科学实验场景
声纹识别语音用于开展与语音有关的科学实验活动的场景,如果进行声纹识别技术的科学实验,还会涉及声纹特征和声纹模型。:
GB/T XXXXX —XXXX
9
科学实验场景
非声纹识别的语音应用场景
声纹语音样本用于除识别数据主体身份以外的其他智能语音应用场景。:
非声纹识别的语音应用场景

最近更新