加载中 ...
首页 > 科技 > 科技要闻 > 正文

Deepfake 新克星:火眼金睛鉴假脸,还能推算造假模型的结构

2021-06-18 19:21:11 来源:广东财经网

6月18日报道,看看下面这些人的照片,你能看出什么问题吗?这些或微笑或笑容满面的人,都是假的,由一个名为StyleGAN的著名人工智能(AI)模型生成,现实生活中并不存在。Deepfake深度伪造技术愈发强大,令人们难以分辨它所伪造图像的真假,一旦这一技术被大规模用于恶意意图,则将后患无穷。对此,Facebook与密歇根州立大学(MSU)合作,提出了一种新研究方法,不仅能检测出假图片,而且能通过逆向工程,发现伪造出这个假图的AI生成模型是如何设计的。值得注意的是,有些生成模型是此前从未见过的,通过一系列超参数分析,这种新研究方法仍能找出一些伪造图片的共同来源。这将帮助有效追踪到各种社交网络上传播的以假乱真的图片,以及发现协同虚假信息或使用深度伪造发起的其他恶意攻击。Facebook研究科学家TalHassner称:“在标准基准上,我们得到了最先进的结果。”用“指纹”鉴定图像的来源Facebook的新AI方法,是如何工作的?▲模型解析流程研究人员首先通过指纹估计网络(FEN)运行了一组深度伪造图像,来估计AI生成模型留下的指纹细节。什么是指纹?对于人类而言,指纹就像个人标识一样,具有不变性、唯一性、可分类性。具备类似特征的标识也存在于设备上。例如在数码摄影中,因制造过程的不完善,特定设备会在其产生的每张图像上留下独特的图案,可被用于识别产生图像的数码相机。这种图案被称之为设备指纹。同样,图像指纹是生成模型在生成的图像中留下的独特图案,能用来识别图像来自的生成模型。在深度学习时代前,研究人员常用一套小型的、手工制作的、众所周知的工具来生成图片。这些生成模型的指纹通过其手工特征来估计。而深度学习使得工具能无限生成图像,致使研究人员不可能通过手工特征来识别指纹属性。由于可能性无穷无尽,研究人员决定根据指纹的一般属性,使用不同的约束条件来估计指纹,这些属性包括指纹大小、重复性质、频率范围和对称频率响应。然后,这些约束通过不同的损失函数被反馈到FEN中,以强制生成的指纹具有这些所需的属性。指纹生成完成后,就能用作模型解析的输入。通过识别这些图像中的独特指纹,Facebook的AI可以分辨出哪些伪造图像由同一个生成模型创建。▲图像归因:找出哪些图像由同一个生成模型产生模拟超参数,推断deepfake模型结构每个生成模型,都有自己独特的超参数。超参数是被用于指导模型自学过程的变量。比如模型的网络结构、训练损失函数类型的超参数设置,都会对生成图像的方式和结果产生影响。如果能弄清楚各种超参数,则可以由此找出创建某一图像的生成模型。为了更好地理解超参数,Facebook团队将生成模型比作是一种汽车,其超参数则是各种特定的发动机部件。不同的汽车可能看起来很相似,但在引擎盖下,它们可以有非常不同的引擎和组件。研究人员称,其逆向工程技术有点像根据声音来识别汽车的部件,即使此前从未听说过这辆车。▲逆向工程技术能找出未知模型的特征一旦系统能够始终如一地将真指纹与深度伪造指纹分开,它就会将所有假指纹转储到一个解析模型中,以模拟出它们的各种超参数。通过其模型解析方法,研究人员可以估计用于创建deepfake的模型网络结构,比如有多少层,或者被训练了什么损失函数。为了便于训练,他们对网络结构中的一些连续参数进行了归一化处理,并对损失函数类型进行了层次学习。由于生成模型在网络架构和训练损失函数方面存在很大差异,从deepfake或生成图像到超参数空间的映射,使他们能够批判性地理解用于创建它的模型的特征。▲通过模型解析,可以推断出未知模型是如何设计的从100个生成模型,合成10万张假图为了测试这一方法,密歇根州立大学的研究团队将从100个公开可获得的生成模型中生成的10万张合成图像,整合到一个伪造图像数据集中。这100个生成模型中的每一个,都对应着一个由整个科学界研究人员开发和共享的开源项目。一些开源项目已经发布了伪造图片。在这种情况下,密歇根州立大学的研究团队随机挑选了1000张图片。在开源项目没有任何可用伪造图像的情况下,研究团队运行他们发布的代码,生成1000张合成图像。考虑到测试图像可能来自现实世界中不可见的生成模型,研究团队通过交叉验证来模拟现实世界的应用,以训练和评估其模型对数据集的不同分割。▲从100个生成模型中每一个生成的图像在左边产生一个估计的指纹,在右边产生一个相应的频谱。许多频谱显示出不同的高频信号,而有些频谱看起来彼此相似。除了模型解析,其FEN可以用于deepfake检测和图像归因。对于这两个任务,研究人员添加了一个浅层网络,输入估计的指纹并执行二值(深deepfake检测)或多类分类(图像归属)。虽然Facebook的指纹估计不是为这些任务量身定制的,但研究人员称,他们仍然取得了具有竞争力的技术水平的结果,这表明其指纹估计具有出色的泛化能力。来自100个生成模型的深度伪造图像的多样化集合意味着其模型是通过代表性选择建立的,具有更好的泛化跨人类和非人类表示的能力。尽管一些用于生成深度伪造的原始图像是公开可用的人脸数据集中的真实个人图像,密歇根州立大学研究团队开始了法医风格的分析,使用深度伪造图像,而不是用于创建它们的原始图像。由于该方法涉及将深度伪造图像解构到其指纹,研究团队分析了该模型能否将指纹映射回原始图像内容。结果表明,这种情况没有发生,这证实了指纹主要包含生成模型留下的痕迹,而不是原始深度伪造的内容。所有用于这项研究的假脸图像,以及逆向工程过程的所有实验,都来自密歇根州立大学。密歇根州立大学将向更广泛的研究社区开放数据集、代码和训练模型,以促进各个领域的研究,包括深度伪造检测、图像归因和生成模型的逆向工程。结语:深伪vs防深伪,长期的猫鼠游戏Facebook与密歇根州立大学的这一研究,推动了deepfake检测的理解边界,引入了更适合真实世界部署的模型解析概念。这项工作将为研究人员和从业人员提供工具,以更好地调查协调虚假信息事件,使用深度伪造,并为未来的研究开辟新的方向。但值得注意的是,即便是最先进的结果,也未必全然可靠。去年Facebook举办深度检测大赛,获胜算法只能检测到AI操纵的视频的65.18%。研究人员认为,使用算法发现deepfake,仍是一个“未解决的问题。”部分原因是,生成AI领域非常活跃,每天都有新的技术发布,任何检测器几乎不可能完全跟上。当被问及是否会出现这种新方法无法检测到的生成模型时,Hassner同意:“我预计会这样。”他认为,deepfake研发与deepfake检测的研发,“将继续是一场猫鼠游戏”。

“广东财经网”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与

我们联系删除或处理,客服邮箱1098101642@qq.com,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同

其观点或证实其内容的真实性。

  • 声音提醒
  • 60秒后自动更新
  • 【民政部回应何时恢复婚姻登记】民政部社会事务司二级巡视员杨宗涛表示,婚姻登记场所是人群聚集场所,部分地区暂停婚姻登记工作是对人民群众安全负责。未停止登记的地方推广用电话、网络、qq群预约登记,控制登记人数,分批分段登记,减少人员聚集和在登记机关停留时间。已停止婚姻登记地方将根据当地疫情控制情况逐渐恢复。

    15:54
  • 欧洲央行副行长金多斯:欧洲央行还没有达到逆转利率。宽松政策的副作用更明显了。

    15:54
  • 财经网站Forexlive分析师Justin Low评瑞士1月CPI月率:尽管通胀年率保持稳定,但核心通胀率有所下降,这一点令人更加担忧。这只是进一步巩固了瑞士央行维持现有货币政策不变,并可能在未来寻求更多宽松措施的观点。

    15:54
  • 【武汉两大批发市场商户开业率超过80%】商务部市场建设司司长朱小良10日称,目前武汉生活必需品供应基本正常,除冷鲜肉、鲜叶菜等少数品种存在结构性短缺外,大部分重要生活物资供应充足,未发生明显抢购或脱销断档情况。当地白沙洲和四季美两大批发市场正常营业,商户开业率超过80%,日交易量上升至3000吨以上。(国是直通车)

    15:53
  • 【日本2019年经常项目顺差增长4.4%】日本财务省10日发布的国际收支初步统计报告显示,主要受外国人入境游消费扩大影响,2019年日本经常项目顺差增长4.4%。报告显示,2019年日本经常项目顺差为20.06万亿日元(1美元约合109.8日元)。其中,商品贸易方面,由于液化天然气价格下跌等因素,进口下降5.6%至75.56万亿日元;由于汽车部件及钢铁等产品出口减少,出口下降6.3%至76.12万亿日元。货物贸易顺差减少53.8%,为5536亿日元。(新华社)

    15:53
  • 欧元兑美元EUR/USD短线波动不大,现报1.0952。

    15:53
  • 瑞士1月CPI年率:0.2%,前值:0.2%,预期:0.1%;瑞士1月CPI月率:-0.2%,前值:0%,预期:-0.2%。

    15:52
  • 英镑兑美元GBP/USD短线走低13点,现报1.2890。

    15:52
  • 【宁德时代“供电”国产特斯拉 有望拉低售价20%】全国乘联会秘书长崔东树分析认为,“随着特斯拉国产化率提升和产能爬坡,未来特斯拉国产车型的价格下探空间还是很大的。”他预计今年下半年,国产Model 3车型的售价就有望降至25万元,降幅接近20%。(新京报)

    15:51
  • 【内蒙古:对不裁员或少裁员企业返还上年度50%失业保险费】据内蒙古新型冠状病毒肺炎疫情防控工作指挥部消息,疫情期间,内蒙古对不裁员或少裁员的企业返还上年度实际缴纳失业保险费的50%,对面临暂时性经营困难的中小企业,返还标准提高到上年度6个月企业及其职工缴纳社会保险费的50%。

    15:51
  • 【商务部:2019年服务进出口总额54152.9亿元 同比增长2.8%】商务部新闻发言人表示,2019年,在服务贸易创新发展试点等政策的激励下,我国服务贸易总体保持平稳向上态势,逆差明显下降,结构显著优化,高质量发展成效初步显现。全年服务进出口总额54152.9亿元(人民币,下同),同比增长2.8%。其中,出口总额19564.0亿元,同比增长8.9%;进口总额34588.9亿元,同比减少0.4%。(第一财经)

    15:51
  • 【振华股份:疫情导致下游客户开工推迟 产品库存上升】振华化学公告,公司目前生产经营稳定,所有产能均正常开工,原材料采购能基本满足生产需要,由于疫情导致下游客户开工推迟,公司出货量减少,产品库存有所上升。公司将根据客户需求、疫情及市场变化,适度调整生产经营策略,尽可能保持生产经营的稳定。

    15:50
  • 环旭电子2月10日晚间公告,公司2020年1月合并营业收入为23.27亿元,较去年同期的合并营业收入减少27.83%,较2019年12月合并营业收入环比减少37.23%。

    15:49
  • 精测电子:与京东方集团签订了多份销售合同,合同累计金额达到6.96亿元。

    17:12
  • 华夏银行:银保监会同意本公司在全国银行间债券市场发行不超过100亿元人民币的金融债券,募集资金全部用于绿色信贷。

    17:03