使用“扫一扫”即可将网页分享至朋友圈。
看不见的 Unicode 码让敏感词轻松逃过审核,谷歌、IBM 都中招
Unicode码作为全世界文字的统一编码,使用范围广,用它去对NLP模型做对抗攻击,可谓中招一大片。就比如下面这个谷歌翻译:文字部分都没有啥问题,注意到账户数字4321翻译前后不一样吗?为什么会发生这样的情况?来看Unicode码是怎么捣的乱吧。其实原句中就是1234,问题出现在左边:英文句子中数字前面插入了一个不可见的字符0x202E。这是一个可以把字符的文本方向倒转的Unicode码。这样一来,左边的解析系统就会将该1234显示成4321。而谷歌翻译引擎的机制是忽略Unicode码,也就是右边还显示原来的1234。因此,两边就不一样了。这个例子虽然没啥杀伤力,如果万一真有人将它用在了真实转账场景,后果会如何呢?使用Unicode码对NLP模型进行对抗攻击事实上,这种情况在真实场景中并不少见,通过在输入文本中插入一些看不见的Unicode码进行对抗攻击,就有可能骗过AI的语言处理系统去做一些“坏事”。比如改账号、改收款人姓名、绕过评论审核发一些极端言论……而且即使是微软、谷歌、IBM或Facebook这样的大公司开发的软件都可能会因为对Unicode码风险意识的缺乏,被一些精心设计的Unicode码骗过。下面就来看一个发垃圾评论的例子:“Youareacowardandafool”,假如这样一个不友好的评论无法通过审核发出去,那么利用Unicode码,你只需这样加工一下:YouakU+8reaqU+8AU+8cowardandafovU+8JU+8ol.也就是在一些字母中间加上一个多余的字母和U+8,就能让审核系统(Themoderationsystem)忽略Unicode码、看到一串拼写错误的句子,从而将一些本不该出现的不友好评论放出来。U+8:用于删除前一个字符的不可见Unicode字符。这一招对谷歌的PerspectiveAPI和BMI的ToxicContentClassifier(两个语言审核系统)都有效。再来一个同形文字的例子:将“paypal”中第一个英文字母a换成西里尔字母a,尽管这俩人眼视觉上看起来是一样的,但Unicode码不同,谷歌俄语翻译最终就会将它翻译成“папа”,也就是“爸爸”的意思。这样一来,“有心之人”没准就能在有同样问题的AI程序中进行违规付款等操作。如何防止此类情况的发生来自英国剑桥大学和加拿大多伦多大学的研究人员发现了上述机器学习模型中对输入文本处理的这一问题,在今年6月发表的一篇论文中进行了阐述。他们通过对包括微软谷歌旗下等在内的商业系统进行对抗攻击发现:通过一次不可察觉的编码注入——比如一个不可见字符、同形符、重新排序或删除的操作字符——攻击者可以显著降低一些模型的性能,而经过三次注入,大多数模型都可能在功能上失灵。利用视觉和逻辑表示之间的差异,仇恨言论、垃圾信息、损失财产的风险等操作会出现在任何机器学习用于自然语言处理的地方。(当然,计算机视觉方面也早就出现过了一些类似原理的对抗攻击。比如下面这两个经过特殊处理的标志就会被自动驾驶系统认成限速标志。)下图说明了文本可视化和NLP处理管道两者之间的差异是如何给对抗攻击留下可乘之机的:一些NLP模型无法处理具有不同编码的控制序列或看起来相似的字母。在具体过程中,NLP管道会将文本token化之后注释掉它不认识的token,这一步差异也就是造成问题出现的主要原因。那面对自然语言模型的被对抗攻击,又该如何处理呢?研究人员提出了一些见解:要么处理输入时完全过滤掉特殊的Unicode字符;要么将Unicode传递给神经网络之前将其传递给解析器*(如果可行的话)*,这样才能保证用户看到的和神经网络处理的是同一个东西。像那种从英文字母到西里尔字母的变化就更应该被严加注意。相关论文:https://arxiv.org/abs/2106.09898参考链接:https://forums.theregister.com/forum/all/2021/08/06/unicode_ai_bug/
“广东财经网”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与
我们联系删除或处理,客服邮箱1098101642@qq.com,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同
其观点或证实其内容的真实性。
- 声音提醒
- 60秒后自动更新
【民政部回应何时恢复婚姻登记】民政部社会事务司二级巡视员杨宗涛表示,婚姻登记场所是人群聚集场所,部分地区暂停婚姻登记工作是对人民群众安全负责。未停止登记的地方推广用电话、网络、qq群预约登记,控制登记人数,分批分段登记,减少人员聚集和在登记机关停留时间。已停止婚姻登记地方将根据当地疫情控制情况逐渐恢复。
15:54欧洲央行副行长金多斯:欧洲央行还没有达到逆转利率。宽松政策的副作用更明显了。
15:54财经网站Forexlive分析师Justin Low评瑞士1月CPI月率:尽管通胀年率保持稳定,但核心通胀率有所下降,这一点令人更加担忧。这只是进一步巩固了瑞士央行维持现有货币政策不变,并可能在未来寻求更多宽松措施的观点。
15:54【武汉两大批发市场商户开业率超过80%】商务部市场建设司司长朱小良10日称,目前武汉生活必需品供应基本正常,除冷鲜肉、鲜叶菜等少数品种存在结构性短缺外,大部分重要生活物资供应充足,未发生明显抢购或脱销断档情况。当地白沙洲和四季美两大批发市场正常营业,商户开业率超过80%,日交易量上升至3000吨以上。(国是直通车)
15:53【日本2019年经常项目顺差增长4.4%】日本财务省10日发布的国际收支初步统计报告显示,主要受外国人入境游消费扩大影响,2019年日本经常项目顺差增长4.4%。报告显示,2019年日本经常项目顺差为20.06万亿日元(1美元约合109.8日元)。其中,商品贸易方面,由于液化天然气价格下跌等因素,进口下降5.6%至75.56万亿日元;由于汽车部件及钢铁等产品出口减少,出口下降6.3%至76.12万亿日元。货物贸易顺差减少53.8%,为5536亿日元。(新华社)
15:53欧元兑美元EUR/USD短线波动不大,现报1.0952。
15:53瑞士1月CPI年率:0.2%,前值:0.2%,预期:0.1%;瑞士1月CPI月率:-0.2%,前值:0%,预期:-0.2%。
15:52英镑兑美元GBP/USD短线走低13点,现报1.2890。
15:52【宁德时代“供电”国产特斯拉 有望拉低售价20%】全国乘联会秘书长崔东树分析认为,“随着特斯拉国产化率提升和产能爬坡,未来特斯拉国产车型的价格下探空间还是很大的。”他预计今年下半年,国产Model 3车型的售价就有望降至25万元,降幅接近20%。(新京报)
15:51【内蒙古:对不裁员或少裁员企业返还上年度50%失业保险费】据内蒙古新型冠状病毒肺炎疫情防控工作指挥部消息,疫情期间,内蒙古对不裁员或少裁员的企业返还上年度实际缴纳失业保险费的50%,对面临暂时性经营困难的中小企业,返还标准提高到上年度6个月企业及其职工缴纳社会保险费的50%。
15:51【商务部:2019年服务进出口总额54152.9亿元 同比增长2.8%】商务部新闻发言人表示,2019年,在服务贸易创新发展试点等政策的激励下,我国服务贸易总体保持平稳向上态势,逆差明显下降,结构显著优化,高质量发展成效初步显现。全年服务进出口总额54152.9亿元(人民币,下同),同比增长2.8%。其中,出口总额19564.0亿元,同比增长8.9%;进口总额34588.9亿元,同比减少0.4%。(第一财经)
15:51【振华股份:疫情导致下游客户开工推迟 产品库存上升】振华化学公告,公司目前生产经营稳定,所有产能均正常开工,原材料采购能基本满足生产需要,由于疫情导致下游客户开工推迟,公司出货量减少,产品库存有所上升。公司将根据客户需求、疫情及市场变化,适度调整生产经营策略,尽可能保持生产经营的稳定。
15:50环旭电子2月10日晚间公告,公司2020年1月合并营业收入为23.27亿元,较去年同期的合并营业收入减少27.83%,较2019年12月合并营业收入环比减少37.23%。
15:49精测电子:与京东方集团签订了多份销售合同,合同累计金额达到6.96亿元。
17:12华夏银行:银保监会同意本公司在全国银行间债券市场发行不超过100亿元人民币的金融债券,募集资金全部用于绿色信贷。
17:03