使用“扫一扫”即可将网页分享至朋友圈。
试水ChatGPT 切不可以身家试法
在之前的文章(《热度“狂飙”的ChatGPT,亟待“合规刹车”》)中我们讨论了当红风头正盛的ChatGPT,分析了它的技术本质、应用场景和法律风险初探。而在近期的《流浪地球》系列电影中,“虚拟数字人”的概念博人眼球。这不禁让我想起另一个红极一时的概念,“深度伪造(DeepFake)”、“AI换脸”。
深度合成技术
事实上,“虚拟数字人”的构建离不开包括伪造技术在内的深度合成技术,而ChatGPT是深度合成领域下的一类模型。数据深度合成(Deep Synthesis)本身是一个中性概念,泛指借助深度学习算法模型等智能化方案自动生成文本、图像、语音、视频等数据内容的一系列处理技术。其中文本因为其较强的字符特征,只需满足空间序上的合理性,与视频、音频类型数据的处理思路略有不同。
在ChatGPT一类的大型语言模型中,包含预训练和下游任务训练两个部分。在预训练阶段,模型从大量的数据中学习复杂的上下文联系,并将这种联系向量化。Next-token-prediction 和 masked-language-modeling 是用于预训练语言模型的核心技术。在第一种方法中,模型被给定一个词序列作为输入,并被要求预测序列中的下一个词,而在第二种方法中,其输入句子中的一些词被替换为特殊token,例如[MASK],模型被要求预测应该插入到[MASK]位置的正确的词。同时,在下游任务训练中,In-content Learning(语境学习)被提出以提升模型在各个场景任务下的表现能力。譬如标注者会给模型一个提示性的输入,让模型更加清楚的感知到应该输出的范式。
在图像、音频类深度伪造模型中,生成网络”(generative network)或“生成器”(generator)负责制作复制原始数据集特征的合成数据如图片、音频记录、视频等,并制作“深度合成物”;鉴别网络(discriminative network)或者说鉴别器(discriminator)则负责识别合成的数据,检测该视频是否为伪造。通过反复的“无监督学习”过程,“生成网络”制作并修改“深度合成物”,直到“鉴别网络”无法再检测出该合成物系经“深度合成”,最终形成高保真的信息内容。
总体而言,基于深度学习的数据合成技术随着算力的发展逐渐从研究型走向应用型,主要应用在文本合成、视觉合成、听觉合成等三大领域,因循数据收集、模型训练、伪造内容等核心步骤,创造虚拟数字人及其所处的生态环境。
相关戏仿性应用产品迅速迭代,一方面,数据深度合成的正向应用将创建的文本段落、虚拟角色、声音模拟、视频渲染等广泛应用到社交通讯、娱乐文化等众多场景之中,提升信息处理效率,增进临场体验。另一方面,深度合成内容难以精准及时地予以鉴识,部分主体传播虚假信息,操控受众反应,严重威胁整个社会的安全体系与保障机制,因此亟待构建和完善规模化的规制体系。
《互联网信息服务深度合成管理规定》解析
我国国家互联网信息办公室、中华人民共和国工业和信息化部、中华人民共和国公安部在2022年11月3日通过了《互联网信息服务深度合成管理规定》(下称“规定”),该规定基于深度合成应用的定性和风险的评估,从而提出包括内容标志、主体报备、用户实名制、内容审核机制、救济机制、个人信息保护和数据安全等方面的规制措施。
内容标志
深度合成服务提供者(下称“服务提供者”)对使用其服务生成或者编辑的信息内容,应当采取技术措施添加不影响用户使用的显著标识,从而防止公众混淆误认。
主体报备和用户实名制
具有舆论属性或者社会动员能力的服务提供者和技术支持者应当按照《互联网信息服务算法推荐管理规定》履行备案手续,并在网站、应用程序公示,同时按照国家有关规定开展安全评估(相关合规流程仍在摸索之中);服务提供商需要对深度合成服务使用者进行真实身份信息认证。飒姐团队认为之后会出台针对深度合成内容专门的备案手续。
内容审核机制和救济机制
服务提供者应当加强深度合成内容管理。采取技术或者人工方式对输入数据和合成结果进行审核,建立健全用于识别违法和不良信息的特征库,完善入库标准、规则和程序,记录并留存相关网络日志。
服务提供者应当建立健全辟谣机制。发现利用深度合成服务制作、复制、发布、传播虚假信息的,应当及时采取辟谣措施,保存有关记录,并向网信部门和有关主管部门报告。
个人信息保护和数据安全
服务提供者和技术支持者应当加强训练数据管理,采取必要措施保障训练数据安全,若数据集中包含个人信息,则需遵循个保法相关规定和配套标准。
算法安全评估
规定要求合成服务提供者和技术支持者应当加强技术管理,定期审核、评估、验证生成合成类算法机制机理,强调了处理具有生物识别信息、可能涉及国家信息的模型、模板需要进行安全评估,相关审核、评估机制尚未明确要求。飒姐团队认为该类评估由于企业对核心技术披露的限制以及当前评估技术的局限性,困难重重。
写在最后
深度合成归根结底是人工智能技术,尤其是算力发展的产物,其独特的创造性注定会逐渐走入生产生活,因此监管体系和合规体系的构建是必然路径。
深度合成技术上的特殊性要求我们一方面做好深度合成配套法律法规、标准的制定和完善,企业逐步摸索出一条合规路径,另一方面投入到深度合成检测追踪技术的开发与应用,法律、技术双管齐下,为做优产业发展环境提供重要基石,最终促进整个行业的健康发展。
“广东财经网”的新闻页面文章、图片、音频、视频等稿件均为自媒体人、第三方机构发布或转载。如稿件涉及版权等问题,请与
我们联系删除或处理,客服邮箱1098101642@qq.com,稿件内容仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同
其观点或证实其内容的真实性。
- 声音提醒
- 60秒后自动更新
【民政部回应何时恢复婚姻登记】民政部社会事务司二级巡视员杨宗涛表示,婚姻登记场所是人群聚集场所,部分地区暂停婚姻登记工作是对人民群众安全负责。未停止登记的地方推广用电话、网络、qq群预约登记,控制登记人数,分批分段登记,减少人员聚集和在登记机关停留时间。已停止婚姻登记地方将根据当地疫情控制情况逐渐恢复。
15:54欧洲央行副行长金多斯:欧洲央行还没有达到逆转利率。宽松政策的副作用更明显了。
15:54财经网站Forexlive分析师Justin Low评瑞士1月CPI月率:尽管通胀年率保持稳定,但核心通胀率有所下降,这一点令人更加担忧。这只是进一步巩固了瑞士央行维持现有货币政策不变,并可能在未来寻求更多宽松措施的观点。
15:54【武汉两大批发市场商户开业率超过80%】商务部市场建设司司长朱小良10日称,目前武汉生活必需品供应基本正常,除冷鲜肉、鲜叶菜等少数品种存在结构性短缺外,大部分重要生活物资供应充足,未发生明显抢购或脱销断档情况。当地白沙洲和四季美两大批发市场正常营业,商户开业率超过80%,日交易量上升至3000吨以上。(国是直通车)
15:53【日本2019年经常项目顺差增长4.4%】日本财务省10日发布的国际收支初步统计报告显示,主要受外国人入境游消费扩大影响,2019年日本经常项目顺差增长4.4%。报告显示,2019年日本经常项目顺差为20.06万亿日元(1美元约合109.8日元)。其中,商品贸易方面,由于液化天然气价格下跌等因素,进口下降5.6%至75.56万亿日元;由于汽车部件及钢铁等产品出口减少,出口下降6.3%至76.12万亿日元。货物贸易顺差减少53.8%,为5536亿日元。(新华社)
15:53欧元兑美元EUR/USD短线波动不大,现报1.0952。
15:53瑞士1月CPI年率:0.2%,前值:0.2%,预期:0.1%;瑞士1月CPI月率:-0.2%,前值:0%,预期:-0.2%。
15:52英镑兑美元GBP/USD短线走低13点,现报1.2890。
15:52【宁德时代“供电”国产特斯拉 有望拉低售价20%】全国乘联会秘书长崔东树分析认为,“随着特斯拉国产化率提升和产能爬坡,未来特斯拉国产车型的价格下探空间还是很大的。”他预计今年下半年,国产Model 3车型的售价就有望降至25万元,降幅接近20%。(新京报)
15:51【内蒙古:对不裁员或少裁员企业返还上年度50%失业保险费】据内蒙古新型冠状病毒肺炎疫情防控工作指挥部消息,疫情期间,内蒙古对不裁员或少裁员的企业返还上年度实际缴纳失业保险费的50%,对面临暂时性经营困难的中小企业,返还标准提高到上年度6个月企业及其职工缴纳社会保险费的50%。
15:51【商务部:2019年服务进出口总额54152.9亿元 同比增长2.8%】商务部新闻发言人表示,2019年,在服务贸易创新发展试点等政策的激励下,我国服务贸易总体保持平稳向上态势,逆差明显下降,结构显著优化,高质量发展成效初步显现。全年服务进出口总额54152.9亿元(人民币,下同),同比增长2.8%。其中,出口总额19564.0亿元,同比增长8.9%;进口总额34588.9亿元,同比减少0.4%。(第一财经)
15:51【振华股份:疫情导致下游客户开工推迟 产品库存上升】振华化学公告,公司目前生产经营稳定,所有产能均正常开工,原材料采购能基本满足生产需要,由于疫情导致下游客户开工推迟,公司出货量减少,产品库存有所上升。公司将根据客户需求、疫情及市场变化,适度调整生产经营策略,尽可能保持生产经营的稳定。
15:50环旭电子2月10日晚间公告,公司2020年1月合并营业收入为23.27亿元,较去年同期的合并营业收入减少27.83%,较2019年12月合并营业收入环比减少37.23%。
15:49精测电子:与京东方集团签订了多份销售合同,合同累计金额达到6.96亿元。
17:12华夏银行:银保监会同意本公司在全国银行间债券市场发行不超过100亿元人民币的金融债券,募集资金全部用于绿色信贷。
17:03