当前位置:首页 > 乒乓球资讯 > 正文内容

ICLR 2020 | 加密算法也可以不那么复杂:上交大提出面向中层特征隐私保护的复数神经网络

杏彩体育2年前 (2022-12-01)乒乓球资讯36

人工智能顶会 ICLR 2020 将于 4 月 26 日于埃塞俄比亚首都亚的斯亚贝巴举行。在最终提交的 2594 篇论文中,有 687 篇被接收,接收率为 26.5%。本文介绍了上海交通大学张拳石团队的一篇接收论文——《Interpretable Complex-Valued Neural Networks for Privacy Protection》。在本文中,研究者提出了一种面向中层特征的新型隐私保护机制。

打开凤凰新闻,查看更多高清图片

论文链接: https://arxiv.org/abs/1901.09546

深度神经网络的训练和推断过程中,往往伴随着数据集信息的泄露。随着各类机器学习服务的发布和推广,用户通常只需要在本地对数据进行预处理、提取浅层特征后,发送到第三方平台或云端进行进一步的学习。但该过程中,用户的隐私数据面临着巨大的泄露风险:攻击者可以通过对第三方平台所收集到的中层特征进行攻击,恢复出用户的输入数据,如人脸信息、指纹信息等。因此,研究者希望提出一种新型隐私保护机制,使得即使攻击者知道神经网络内部参数,也无法从中层特征恢复出输入数据。

该工作的核心在于研究一种中层特征可加密的神经网络。神经网络的中层特征往往包含丰富的信息,在整个神经网络中起到承上启下的作用。对中层特征加密,一方面要求加密后的特征无法泄露用户的敏感信息(输入数据等),另一方面需要使加密后的特征能够继续通过神经网络,完成下游任务。这要求在数据的隐私性和网络模型的精度之间找到一个平衡点。

在本文中,来自上海交大的研究者提出使用复数神经网络实现隐私保护,将目标隐私信息编码隐藏到复值特征的特定相位之中,从而实现隐私保护。总的来说,本文提出的算法类似于同态加密,但是相比于传统同态加密算法的极高的计算复杂度,该复数神经网络可以非常高效地进行运算,仅仅将计算复杂度提高到传统网络的两倍,提升了加密算法的应用潜力。一般来说,即使攻击者破解了神经网络的内部参数和中层特征,也无法破译隐私信息。

核心算法

研究者提出使用复数神经网络实现隐私保护,并通过一系列可能的攻击测试了该网络的安全性。具体而言,他们将神经网络原始的实数特征(实数表示的中层特征)转化为复数特征,搭建了复数神经网络,如下图(a)所示。

该复数神经网络可分为三个模块:

本地的编码模块。输入图片 I 首先通过编码器 g 提取浅层特征 a=g(I);再旋转一定角度进行加密,从而将真实特征隐藏到复值特征的特定相位之中:

其中θ为随机旋转角度,b 为干扰项,不包含任何与 a 有关的信息;最后将加密结果 x 发送到云端。

位于云端的处理模块。处理器Φ对用户发来的加密数据 x 进行处理,获取深层信息 h=Φ(x),并将处理结果发送回本地用户端。

本地的解码模块。收到云端的处理结果 h 后,先对 h 进行逆向旋转解密,再通过解码器 d 对解密后的信息进行解码,得到最终的输出:

,其中 R(⋅) 表示复数的实部。

注意,如果将特征 a+bi 旋转θ角度,其在处理模块Φ中对应的所有特征都应该被旋转了相同的角度,这样才能确保对 h 旋转解密后再解码,从而得到正确的结果。因此处理模块的操作需要满足下式,其中Φ_j 表示处理模块的第 j 层,f_j 为第 j 层的输出。

为确保该式成立,需要调整神经网络内部各层的实现细节。对于卷积层,需要将偏置项 bias 删去;对于 ReLU 层,使用

作为替代;对于 batch-normalization 层,有

;对于 max-pooling 层,根据实部和虚部选择各个特征中模长最大的点;对于 dropout 层,随机选择一些特征并丢掉。

为了进一步提高隐私保护的能力,使攻击者无法猜测出真实的特征 a,研究者利用 GAN 的思想对编码器 g 进行训练。若用 a表示使用随机角度θ解密得到的特征,即

,那么理想情况下 a 和 a应该服从相同的分布,使攻击者无法分辨出真实的特征。因此他们引入一个辨别器 D,并使其无法分辨 a 和 a。基于 WGAN 的编码器训练时损失函数如下:

复数神经网络的总 Loss 可以写成下式:

实验设计

研究者基于 ResNet-20/32/44/56/110、LeNet、VGG-16 和 AlexNet 等网络结构,在 CelebA、CIFAR-10、CUB-200 等数据集上开展实验,针对不同的攻击方式做了测试,结果证明,本文提出的复数神经网络可以有效抵御各种攻击,保证了用户数据的安全性,同时不破坏网络的分类能力。

他们设计了三种网络结构作为 baseline 进行比较实验,如上图 b 所示。Original network 指普通的深度神经网络;With noises 指在原始的网络中,通过直接对真实特征 a 加噪实现加密,γ为控制噪音振幅的参数;With additional layers 指在原始网络中加入 GAN 中所包含的多余层数。由于在复数神经网络的编码部分引入了 GAN 的结构,为了公平比较,在这里也对网络结构进行同样的修改,但不引入对抗训练。

研究者针对以下几种攻击方式设计了实验:

基于重建图像的攻击

此类攻击可能直接使用加密后的特征进行图像重建,也可能利用辨别器找到最佳角度θ ̂后,用解密后的特征 a^*=dec(R(xe^(-iθ ̂ ))) 重建图像。部分重建结果如下图所示。

对于利用辨别器找到最佳角度θ ̂的攻击方法,下图提供了在 CelebA 数据集上使用不同角度进行解密后的特征重建图片的结果,同时,他们统计了使用辨别器所找出的最佳角度与真实角度的差值,如下表所示,可以看出,辨别器无法准确地找出正确的旋转角度。

基于敏感信息的攻击

输入图片中的某些特征可能是敏感信息(如性别,肤色),传统的神经网络对敏感特征无法有效地隐藏,导致攻击者可以利用中层特征训练一个新的分类器,获得敏感信息。研究者设计了一系列实验以评测复数神经网络对敏感信息的保护作用。此类攻击可以分为以下几种类型:

使用用户数据集的原始图片训练分类敏感信息的分类器,通过 dec(a^* ) 重建输入图片后,输入分类器提取敏感信息;

直接使用 a^*训练一个分类器,并提取敏感信息;

使用 dec(a^*) 重建的图片训练分类器,并提取敏感信息;

利用 k-NN 算法,为 a^*寻找数据集中最接近的 K 个 a,从而提取对应的敏感信息。

前三种攻击类型的实验曲线如下图所示

第四种攻击的结果见下表,该表中还提供了各个网络的分类错误率与图片处理速度。可以看出,尽管引入了少量的计算量,复数神经网络可以有效地抵抗针对敏感信息推断的攻击。

扫描二维码推送至手机访问。

版权声明:本文由财神资讯-领先的体育资讯互动媒体转载发布,如需删除请联系。

本文链接:http://www.tengj.cn/?id=9228

分享给朋友:

“ICLR 2020 | 加密算法也可以不那么复杂:上交大提出面向中层特征隐私保护的复数神经网络” 的相关文章

刘国梁豪宅多奢侈?乒乓球台占近100万,球迷:不愧为国乒主席

刘国梁豪宅多奢侈?乒乓球台占近100万,球迷:不愧为国乒主席

提到国乒,你最先想到谁?你的回答一定是:刘国梁!国内球迷虽然调侃刘国梁“不懂球的胖子”,但他在国乒的地位却是谁也无法撼动的。2018赛季下半年,张本智和、伊藤美诚迅速崛起,国乒半数以上的主力选手都败在他们手中。千钧一发之际,刘国梁临危受命担任国乒主席。刘国梁接手国乒之后,进行大刀阔斧的改革...

乒乓球真好

乒乓球真好

清晨,我高中的梁老师发了一条微信自述,乒乓球真的好,自从我10岁被老师选为校队后,一直到60多岁还在打。梁老师不仅仅坚持不懈地打乒乓球,而且外出地区交流打,乐此不疲,身心健康,精神矍铄,老有所乐,老有矫健。我对于乒乓球没有多少兴趣和研究,就连乒乓球的读音都没有掌握,原来是ping...

中国的乒乓精神是什么你是怎样理解的?

看你从什么方面说这个“精神” 从国家层面上说,国际乒联是世界上第一个接纳中国的体育组织,乒乓球也是国际上第一项允许中国参加的运动项目,早期曾被国家大力培养,是为“国球”。70年代国家采用“乒乓外交”战略,在中美建交时起到了不小的作用,是为“...

国际乒联最新世界排名:王楚钦飙升,孙颖莎第一,女单包揽前四

国际乒联最新世界排名:王楚钦飙升,孙颖莎第一,女单包揽前四

北京时间10月31日,WTT新乡世界杯已经正式落幕,孙颖莎和王楚钦分别夺得了男女单打的冠军,目前最新的世界排名已经更新,国乒锁定了男女单打第一,其中樊振东是男单第一,一个月内连夺三冠的孙颖莎排名女单第一,而一个月内连夺三冠的王楚钦排名由原来的11位飙升至第三位! 男单方面...

祝贺!国乒蝉联3项世界排名第一,59岁倪夏莲再次上升、宝刀不老

祝贺!国乒蝉联3项世界排名第一,59岁倪夏莲再次上升、宝刀不老

北京时间11月8日,国际乒联正式公布了2022年第45周世界排名,虽然国乒全体放弃了上周举办的WTT斯洛文尼亚赛,但由于主力选手们的积分普遍非常高,所以仍然稳居三项第一,除林高远以外的所有主力选手都排名单打前...

乒乓球的比赛规则(具体) 裁判用的?

 1.发球、接发球和方位的选择   (1)选择发球,接发球和这一方,那一方的权力应由抽签来决定,中签者可以选择先发球或先接发球,或选择先在某一方;   (2)当一方运动员选择了先发球或先接发球,或选择先在某一方后,...