如何系统地欺骗图像识别神经网络

本文最初发表于 Towards Data Science 博客，经原作者 Andre Ye 授权，InfoQ 中文站翻译并分享 。

卷积神经网络（Convolutional Nerual Network，CNN）构成了图像识别的基础，这无疑是深度学习最重要的应用之一。然而“不幸”的是，有关深度学习的许多研究都是在数据集的“完美世界”约束下进行的——追求几个百分点的正确率。因此，尽管我们开发的架构在理论测试中效果非常好，但在现实世界中却不一定如此了。

对人眼来说，对抗性样本或输入与普通图像难以区分，但却能完全骗过各种图像识别架构。对抗性输入的部署显然会带来许多令人不安的危险影响，特别是当人工智能被赋予更多自主决策的权力时，尤为如此。

因此，理解和解决应用于深度学习的系统产生对抗性输入——伦理黑客的方法是非常重要的。

由 Goodfellow 等人提出的一种简单的方法，用于系统生成对抗性输入，称为“快速梯度符号法”（fast gradient signed method）。

考虑如下：

输入向量 x（此为输入信息所在的位置，但可以将其视为一维列表）。
对抗性输入 x-hat（与 x 相同的形状，但值有所改变）。
一个 perbutation 向量 η（“eta”，以产生对抗性输入向量）。

Recommend

跨越重重“障碍”，我从 PyTorch 转换为了 TensorFlow Lite

如何优化多表查询的查询性能问题

foreach如何工作

惊了！同事竟然在代码里“下毒”

CVE-2020-7471漏洞复现及浅析

基于 Flink 实时计算商品订单流失量

日调 1000 亿，腾讯微服务平台的架构演进

openGauss 可替代 Oracle 吗？从字段类型说起……

推荐系统中的兴趣拓展如何驱动业务持续增长

套利双拳出击，这边5天盈利5.5%，那边单月盈利23%

About Joyk