研究人员开发了句子重写技术来愚弄文本分类器 亚马逊印度与HP Gas合作预订LPG气瓶并付款 Facebook推出新计划以帮助印度的中小型企业 Snapchat现在允许创建者显示其订阅者数量 微软更新了iOS和Android上的待办事项应用程序 由于美国大选错误信息在网上传播 Twitter和Facebook暂停了一些帐户 YouTube帐户将数以千计的实时伪造选举结果直播 Airtel的Nxtra投资1750亿卢比来扩大在印度各地的数据中心 腾讯加入特朗普禁令以保护数据 绅喜黑巧胶原蛋白营养棒,解锁健康潮流新方式! ZFX山海证券来科普经纪商为什么会出现滑点、卡盘、交易延迟 阿卡索以总额近10亿元C轮融资为新起点,开启大众英语教育市场新时代 多地倡议“就地过年”,商家入驻点购广场转型升级应对“大浪淘沙” 春雨慈善基金会铸爱心促发展座谈会在合肥康华康复医院召开 霜巨人工作室为即时战略游戏复兴筹集了470万美元 精灵将让消费者使用Giphy和Gucci创建自己的3D化身 Instagram直播现在可以进行4小时 研究发现谷歌在选举阴谋论网站上投放广告 苹果收购自学AI视频初创公司以改善应用程序 微软对云计算需求旺盛的销售最高预期 亚马逊将雇用100,000名季节性雇员以度过假期 Bharti Airtel第二季度收入因资费提高和4G增加而增长22% Shopify与TikTok合作 以吸引更多的商人到现场 AMD将以350亿美元的价格收购芯片同行Xilinx 安徽省人大代表高立新“两会”提案:“制订专项政策,支持绿色技术推广应用” 美国支持印度新鲜肉食创业公司FreshToHome的1.21亿美元融资 苹果基于硅的iMac将于2021年上半年发布 Google的Smart Fill使用AI自动完成工作表列 耳语的助听器使用AI增强语音并减少噪音 监督部门抨击Verizon的5G广告 称最佳效果并不典型 River为保护隐私的新闻推荐筹集了1040万美元 Xbox Series X是由相信游戏的人设计的 皮尤发现Twitter最丰富的用户中有69%是民主党人 可能的现实将您的面孔摆在视频游戏角色上 Xbox系列X外部存储测试:USB硬盘与SSD和NVME对比 中佛协会长演觉法师重磅长文:善导大师为中国净土宗实际立宗人 鑫世纪:云挖矿,为什么人们选择鑫世纪APP? 备年货,山东人最爱买海参,全国最爱买东阿阿胶和花生油 莲花社区繁华世家小区一违建被拆除 WhatsApp即将加入未接来电和生物特征识别锁定还有新来电功能 2020年第三季度印度智能手机出货量达到创纪录的5000万部 微软在盒子里创建便携式数据中心 僵尸网络在微软的选举安全系统崩溃后反击 诺基亚通过接受德国联想的销售来加剧专利战 高通公司与Reliance Jio合作 苹果推出苹果音乐电视 微软在加强其Azure云计算平台的功能方面迈出了一大步 高通公司与Reliance Jio联手推动印度5G发展 这是Adobe宣布的Adobe Max 2020所有内容 微软和埃隆·马斯克的SpaceX携手吸引太空客户 Opera和Yandex具有地址栏欺骗漏洞 但并非全部都已修复
你当前位置:首页 >资讯 >

研究人员开发了句子重写技术来愚弄文本分类器

2021-02-01 16:24:06来源:

一个最近的一篇文章,同时保持句子的字面意思不变,由麻省理工学院的研究亮点合着的对文本分类句子级攻击的问题,即攻击者会改变一个句子来触发错误分类。

文本分类器用于各种应用程序,尤其是文档处理。此类系统使公司能够构建,规范和标准化诸如电子邮件,法律文档,网页和聊天对话之类的业务信息。在诸如房屋贷款等行业中,对这些分类器的攻击可能是灾难性的,这些行业越来越依赖于AI处理与抵押相关的数百页。

他们的框架-有条件的BERT采样(CBS)-将AI语言模型中的语句提供给RewritingSampler,后者是CBS的一个实例,专门为攻击分类器重写这些语句。在实验中,研究人员声称CBS和RewritingSampler比现有的字级方法具有更高的攻击成功率。

研究人员的CBS框架和RewritingSampler从种子句子开始,并反复采样和替换句子中给定次数的单词。他们使用词嵌入的总和(一种词表示形式,允许具有相似含义的词具有类似表示形式)来最小化原始句子和重写句子之间的语义差异。OpenAI的GPT-2语言模型检查语法质量,从而可以控制和灵活地重写句子。

在涉及新闻,电影评论,Yelp评论和IMDB电影评论的文本分类数据集以及两个自然语言推理数据集的实验中,研究人员发现,他们的方法“显着”优于基线。例如,给定目标分类器将“土耳其加入欧盟”的句子分类为“世界”,则改写后的句子“欧盟使土耳其正式加入欧盟”则分类为“商业”。从理论上讲,如果将这种方法用于现实世界的分类系统,则标有“ 10月纽约贷款申请”的文档可能被误贴为“不紧急”,而不是“及时”,从而延迟了处理。

“大多数旨在欺骗文本分类器的对抗攻击方法都通过修改一些单词或字符来更改文本分类器的预测。研究人员写道:“由于句子级改写所固有的困难以及设置合法重写标准的问题,很少有人尝试通过重写整个句子来攻击分类器。”“我们(使用我们的框架)解决了问题。”

这项工作建立在TextFooler上,TextFooler是用于合成对抗性文本示例的框架,该框架由麻省理工学院的计算机科学和人工智能实验室(CSAIL),香港大学以及新加坡科学技术研究局的研究人员设计。像这项最新著作的合著者一样,TextFooler的创建者指出,尽管该系统可能被误用于攻击,但它也可以用于测试模型的健壮性,并通过对抗性训练来提高模型的泛化性。

“如果[语言模型]容易受到有目的的对抗攻击,那么后果可能是灾难性的,”麻省理工学院的Di Jin在先前的声明中说,学生和TextFooler研究论文的主要作者。“这些工具需要采用有效的防御方法来保护自己,而为了建立这样一个安全的防御系统,我们需要首先研究对抗性方法。”