关注即可获取arXiv每日论文自动推送;
如果您有任何问题或建议,请公众号留言。
[如果您觉得本公众号对你有帮助,就是我们最大的荣幸] 今日 cs.AI方向共计31篇文章。[1]:A Flexible Framework for Anomaly Detection via Dimensionality Reduction
标题:一种灵活的降维异常检测框架
作者:Alireza Vafaei Sadr, Bruce A. Bassett, Martin Kunz
备注:6 pages
链接:https://arxiv.org/abs/1909.04060
摘要:异常检测具有挑战性,特别是对于高维的大数据集。本文探讨了一种基于降维和无监督聚类的通用异常检测框架。我们发布了trama,这是一个通用的python包,它实现了具有各种内置选项的通用框架。我们在3000维的各种模拟和真实数据集上测试了戏剧,发现它与常用的异常检测算法(尤其是高维异常检测算法)具有很强的鲁棒性和竞争力。trama框架的灵活性允许在异常实例可用时进行显著优化,使其成为在线异常检测、主动学习和高度不平衡数据集的理想选择。
[2]:Exploratory Combinatorial Optimization with Reinforcement Learning
标题:强化学习的探索性组合优化
作者:Thomas D. Barrett, William R. Clements, Jakob N. Foerster, A. I. Lvovsky
备注:8 pages (including references), 5 figures/tables + 1 page supplemental material
链接:https://arxiv.org/abs/1909.04063
摘要:许多现实问题可以归结为图上的组合优化问题,在图上必须找到使某个目标函数最大化的顶点的子集或排序。由于这类任务通常是np难的,且难以分析,强化学习(rl)作为一个框架显示出希望,可以学习有效的启发式方法来解决这些问题。以前的工作是增量地构造解子集,每次添加一个元素,但是这种方法的不可逆性阻止了代理修改其先前的决策,考虑到优化任务的复杂性,这可能是必要的。相反,我们建议代理应该通过在测试时学习探索来寻求不断改进的解决方案。我们的探索性组合优化方法(ECO-DQN)原则上适用于任何可以在图上定义的组合问题。实验上,我们展示了在最大割问题上产生最新rl性能的方法。此外,由于eco-dqn可以从任意配置开始,因此可以与其他搜索方法相结合以进一步提高性能,我们使用简单的随机搜索来演示。
[3]:Adversarial Robustness Against the Union of Multiple Perturbation Models
标题:多扰动模型联合的对抗鲁棒性
作者:Pratyush Maini, Eric Wong, J. Zico Kolter
备注:16 pages
链接:https://arxiv.org/abs/1909.04068
摘要:由于深度学习系统对对抗性攻击的敏感性,在开发(经验性的和可证明的)健壮分类器方面已经做了大量的工作,但绝大多数都针对单一类型的攻击进行了防御。最近的研究着眼于防御多种攻击,特别是针对mnist数据集的攻击,但是这种方法使用了一种相对复杂的体系结构,声称标准的对抗性训练不适用,因为它“过分适合”特定的规范。在这项工作中,我们证明了通过将基于标准pgd的对抗训练过程自然地推广到多个威胁模型中,对抗性地训练一个鲁棒模型以对抗范数有界攻击的联合是可能的。通过这种方法,我们能够训练对$\ell infty$、$\ell 2$和$\ell 1$攻击具有鲁棒性的标准体系结构,在mnist数据集上优于以往的方法,并提供第一个训练为同时对$(\ellinfty}、\ell2}、\ll{1})$威胁模型,其对$(\ell{infty}、\ell{2}、\ell{1})$半径为$\epsilon=(0.03,0.5,12)$的扰动的对抗准确率为$(47.6%,64.8%,53.4%)。
[4]:Counterfactual Story Reasoning and Generation
标题:反事实故事推理与生成
作者:Lianhui Qin, Antoine Bosselut, Ari Holtzman, Chandra Bhagavatula, Elizabeth Clark, Yejin Choi
备注:Accepted to EMNLP 2019 as a long paper
链接:https://arxiv.org/abs/1909.04076
摘要:反事实推理需要预测与实际发生的相反的替代事件如何导致不同的结果。尽管被认为是人工智能完整系统的一个必要组成部分,但很少有资源被开发来评估叙事中的反事实推理。
在本文中,我们提出了反事实故事的重写:给定一个原始故事和一个介入的反事实事件,任务是最小化对故事的修改,使其与给定的反事实事件兼容。解决这一问题需要深入理解因果叙述链和反事实不变性,并将这种故事推理能力集成到条件语言生成模型中。
我们提出时间旅行,一个新的数据集29849反事实重写,每一个与原始故事,反事实事件,和人类产生的原始故事与反事实事件兼容的修订。此外,我们还包括80115个没有重写故事情节的反事实“分支”,以支持未来半监督或非监督的反事实故事重写方法。
最后,我们基于预先训练的语言模型评估了几个竞争性基线的反事实重写能力,并评估了文本生成的常见重叠和基于模型的自动度量是否与反事实重写的人类分数有良好的相关性。
[5]:A Classification Methodology based on Subspace Graphs Learning
标题:一种基于子空间图学习的分类方法
作者:Riccardo La Grassa, Ignazio Gallo, Alessandro Calefati, Dimitri Ognibene
备注:8 pages, Dicta Conference
链接:https://arxiv.org/abs/1909.04078
摘要:本文提出了一种基于集成分类器的单类分类器设计方法。目标是使用生成树集合选择在训练阶段创建的最佳结构。它采用最好的分类器,将模式附近的区域划分为$\gamma^{\gamma-2}$子空间,并组合所有可能的生成树,这些树可以从$\gamma$节点开始创建。该方法利用了监督分类方法和最小距离的概念。我们在著名的基准数据集上对我们的方法进行了评估,得到的结果表明,我们的方法达到了可比的,并且在许多情况下达到了最新的结果。而且,即使在数据集不平衡的情况下也能获得良好的性能。
[6]:AC-Teach: A Bayesian Actor-Critic Method for Policy Learning with an Ensemble of Suboptimal Teachers
标题:ac-teach:一种面向次优教师集合的bayesian-actor-critic策略学习方法
作者:Andrey Kurenkov, Ajay Mandlekar, Roberto Martin-Martin, Silvio Savarese, Animesh Garg
链接:https://arxiv.org/abs/1909.04121
摘要:深度强化学习(rl)代理使用的探索机制在决定其样本效率方面起着关键作用。因此,改进超随机勘探方法对于解决报酬稀少的长周期任务至关重要。我们建议利用一组部分解决方案作为教师,在整个培训过程中用行动建议指导代理人的探索。虽然之前已经研究过与教师一起学习的设置,但我们提出的方法-演员与教师合奏的评论家(AC-Teach)是第一个与一组次优教师合作的方法,这些教师可能只解决部分问题或相互矛盾,形成一个统一的算法。与广泛的教师团队兼容的礼仪解决方案。ac-teach利用教师和学生行为预期结果的概率表示来指导探索,减少抖动,并适应动态变化的学习者质量。我们评估了ac-teach的一个变体,该变体指导贝叶斯ddpg代理在三个任务上的学习-路径跟踪、机器人拾取和放置以及使用钩子的机器人立方体扫描-并表明,对于我们的unc目标场景,它在一组基线上大大提高了采样效率。无培训次优教师和更容易与最佳或单一教师设置。其他结果和视频请访问此URL。
[7]:DeepObfuscator: Adversarial Training Framework for Privacy-Preserving Image Classification
标题:deepobfuscator:保护隐私的图像分类对抗性训练框架
作者:Ang Li, Jiayi Guo, Huanrui Yang, Yiran Chen
链接:https://arxiv.org/abs/1909.04126
摘要:深度学习在许多计算机视觉应用中得到了广泛的应用,并取得了显著的商业成功。然而,由于可用计算资源的限制,在移动设备上运行深度学习模型通常具有挑战性。让用户向运行大规模深度学习模型的云服务器发送服务请求是很常见的。然而,将与服务请求相关联的数据发送到云端会给用户数据隐私带来风险。一些现有技术建议将从原始数据(例如图像)中提取的特征发送到云。不幸的是,攻击者仍然可以利用这些提取的特征来恢复原始图像并推断嵌入的私有属性(例如年龄、性别等)。本文提出了一种对抗性的训练框架deepfuscator,它可以防止提取的特征被用来重建原始图像和推断私有属性,同时保留用于预期云服务(即图像分类)的有用信息。deepfuscator包含一个可学习的编码器,即obfuscator,它通过执行我们提出的对抗性训练算法,从特征中隐藏与隐私相关的敏感信息。在CelebaDataset上的实验表明,基于原始图像模糊特征的重建图像在多尺度结构相似性(MS-SSIM)方面从0.9458显著降低到0.3175。因此,重建图像中的人很难被重新识别。攻击者可以获得的推断私有属性的分类准确率下降到随机猜测级别,例如性别的准确率从97.36%下降到58.85%。相比之下,通过云服务执行的预期分类任务的准确性仅下降了2%
[8]:Option Encoder: A Framework for Discovering a Policy Basis in Reinforcement Learning
标题:选项编码器:在强化学习中发现策略基础的框架
作者:Arjun Manoharan, Rahul Ramesh, Balaraman Ravindran
链接:https://arxiv.org/abs/1909.04134
摘要:Option discovery and skill acquisition frameworks are integral to the functioning of a Hierarchically organized Reinforcement learning agent. However, such techniques often yield a large number of options or skills, which can potentially be represented succinctly by filtering out any redundant information. Such a reduction can reduce the required computation while also improving the performance on a target task. In order to compress an array of option policies, we attempt to find a policy basis that accurately captures the set of all options. In this work, we propose Option Encoder, an auto-encoder based framework with intelligently constrained weights, that helps discover a collection of basis policies. The policy basis can be used as a proxy for the original set of skills in a suitable hierarchically organized framework. We demonstrate the efficacy of our method on a collection of grid-worlds and on the high-dimensional Fetch-Reach robotic manipulation task by evaluating the obtained policy basis on a set of downstream tasks.
[9]:NormLime: A New Feature Importance Metric for Explaining Deep Neural Networks
标题:normlime:一种解释深层神经网络的新特征重要度度量
作者:Isaac Ahern, Adam Noack, Luis Guzman-Nateras, Dejing Dou, Boyang Li, Jun Huan
链接:https://arxiv.org/abs/1909.04200
摘要:最近,解释深度学习模型和模型预测的问题引起了广泛的兴趣。许多成功的方法放弃了全局近似,以便对模型的行为提供更可靠的局部解释。莱姆开发了多个可解释模型,每个模型在数据流形的一个小区域上逼近一个大的神经网络,sp-莱姆聚合本地模型以形成全局解释。扩展这一研究领域,我们提出了一种简单而有效的方法,normlime用于将局部模型聚合为全局和类特定的解释。一项人类用户研究强烈支持normlime对其他特性重要性度量创建的类特定解释。数值实验证明normlime在识别重要特征方面是有效的。
[10]:PMD: A New User Distance for Recommender Systems
标题:pmd:推荐系统的新用户距离
作者:Yitong Meng, Weiwen Liu, Benben Liao, Jun Guo, Guangyong Chen
链接:https://arxiv.org/abs/1909.04239
摘要:协作过滤,一种广泛使用的推荐技术,通过聚合来自相似用户的评分来预测用户的偏好。因此,这些措施不能充分利用评级信息,不适合真实世界的稀疏数据。为了解决这些问题,我们提出了一种新的用户距离度量方法,称为优先移动者距离(pmd),它充分利用了每个用户的所有评分。我们提出的pmd可以正确测量一对用户之间的距离,即使他们没有共同评级的项目。我们的研究表明,这一措施可以作为一个实例,地球移动的距离,一个研究良好的运输问题,为几个高效的解决方案已经开发。实验结果表明,在训练数据非常稀疏的情况下,pmd比现有的推荐方法具有更好的推荐精度。
[11]:A Benchmark Dataset for Learning to Intervene in Online Hate Speech
标题:学习干预网上仇恨言论的基准数据集
作者:Jing Qian, Anna Bethke, Yinyin Liu, Elizabeth Belding, William Yang Wang
链接:https://arxiv.org/abs/1909.04251
摘要:对付网上仇恨言论是一项关键而具有挑战性的任务,但可以借助自然语言处理(nlp)技术。先前的研究主要集中在开发NLP方法,自动有效地检测网上仇恨言论,而忽略了需要采取的进一步行动,以平息和劝阻个人在未来使用仇恨言论。此外,大多数现有的仇恨言语数据集将每个帖子视为一个单独的实例,忽略了会话上下文。在本文中,我们提出了一个新的任务生成仇恨言语干预,其目标是在包含仇恨言语的在线会话中自动生成干预响应。作为这项工作的一部分,我们介绍了从gab和reddit收集的两个完全标记的大规模仇恨言语干预数据集。这些数据集提供对话片段、仇恨言语标签,以及土耳其机械工人写的干预反应。本文还对这些数据集进行分析,了解常用的干预策略,探讨常用的自动响应生成方法在这些新数据集上的性能,为以后的研究提供参考。
[12]:Core Semantic First: A Top-down Approach for AMR Parsing
标题:核心语义优先:一种自顶向下的amr解析方法
作者:Deng Cai, Wai Lam
备注:EMNLP2019
链接:https://arxiv.org/abs/1909.04303
摘要:我们提出了一种新的文本解析方法:基于图生成的文本解析(gsp)。gsp的一个新特点是它以自顶向下的方式递增地构造一个解析图。从根节点开始,在每个步骤中,将联合预测新节点及其与现有节点的连接。输出图按照到根的距离跨越节点,遵循先抓住主要思想,然后再挖掘更多细节的直觉。textit{core semantic first}原则强调捕捉句子的主要思想,这一点非常有趣。我们在最新的amr-sembank上评估了我们的模型,并在不采用启发式图重新分类的情况下实现了最新的性能。更重要的是,实验表明我们的解析器特别擅长获取核心语义。
[13]:FDA: Feature Disruptive Attack
标题:fda:功能破坏性攻击
作者:Aditya Ganeshan, B.S. Vivek, R. Venkatesh Babu
备注:Accepted in ICCV;19. Code Available atthis https URL
链接:https://arxiv.org/abs/1909.04385
摘要:尽管深神经网络(dnn)在各种计算机视觉任务中表现出了优异的性能,但已有的研究表明其易受对抗性样本的影响,即具有不可感知噪声的图像样本被用来操纵网络的预测。对抗性样本生成方法从简单的优化技术到复杂的优化技术。这些方法大多通过与网络的pre-softmax或softmax输出相关联的优化目标生成对手。在这项工作中,我们,(i)显示了这种攻击的缺点,(ii)提出两个新的评估指标:旧标签新等级(olnr)和新标签旧等级(nlor),以量化攻击造成的损害程度,和(iii)提出一个新的对抗攻击fda:特征破坏攻击,以增加现有攻击的缺点。fda的工作原理是产生图像扰动,干扰网络每一层的特征,导致深层特征高度损坏。这使得fda的对手严重降低了深层网络的性能。我们通过实验验证了fda在图像分类方面比其他最先进的方法产生了更强的对手,即使在存在各种防御措施的情况下也是如此。更重要的是,我们显示fda甚至在没有访问任务特定网络或方法的情况下也会中断基于特征表示的任务。代码位于:此https url
[14]:An Overview of Open-Ended Evolution: Editorial Introduction to the Open-Ended Evolution II Special Issue
标题:开放进化综述:开放进化2特刊编辑导论
作者:Norman Packard, Mark A. Bedau, Alastair Channon, Takashi Ikegami, Steen Rasmussen, Kenneth O. Stanley, Tim Taylor
备注:This article is published in the Artificial Life journal (this https URL) and is copyright (c) 2019 Massachusetts Institute of Technology. It it posted onarXiv.orgafter the publication embargo period in accordance with MIT Press Journals' author posting guidelines (this https URL)
链接:https://arxiv.org/abs/1909.04430
摘要:Nature's spectacular inventiveness, reflected in the enormous diversity of form and function displayed by the biosphere, is a feature of life that distinguishes living most strongly from nonliving. It is, therefore, not surprising that this aspect of life should become a central focus of artificial life. We have known since Darwin that the diversity is produced dynamically, through the process of evolution; this has led life's creative productivity to be called Open-Ended Evolution (OEE) in the field. This article introduces the second of two special issues on current research in OEE and provides an overview of the contents of both special issues. Most of the work was presented at a workshop on open-ended evolution that was held as a part of the 2018 Conference on Artificial Life in Tokyo, and much of it had antecedents in two previous workshops on open-ended evolution at artificial life conferences in Cancun and York. We present a simplified categorization of OEE and summarize progress in the field as represented by the articles in this special issue.
[15]:The Prevalence of Errors in Machine Learning Experiments
标题:机器学习实验中错误的普遍性
作者:Martin Shepperd, Yuchen Guo, Ning Li, Mahir Arzoky, Andrea Capiluppi, Steve Counsell, Giuseppe Destefanis, Stephen Swift, Allan Tucker, Leila Yousefi
备注:20th International Conference on Intelligent Data Engineering and Automated Learning (IDEAL), 14--16 November 2019
链接:https://arxiv.org/abs/1909.04436
摘要:背景:进行实验是研究机器学习的核心,研究机器学习的基准、评估和比较学习算法。因此,我们必须进行可靠、可信的实验。目的:研究在软件缺陷预测领域中机器学习实验样本的错误发生率。我们的重点是简单的算术和统计错误。方法:我们分析了49篇论文,描述了2456个个体的实验结果,这些结果来自于之前进行的系统回顾,比较了有监督和无监督的缺陷预测分类器。我们提取混淆矩阵并测试相关约束,例如,边际概率必须和为1。我们还检查了多个统计显著性测试错误。结果:49篇论文中有22篇存在明显的错误。其中7个是统计性的,16个与混淆矩阵不一致有关(一篇论文包含两类错误)。结论:虽然有些错误可能是一个相对微不足道的性质,例如,转录错误,他们的存在并不产生信心。我们强烈敦促研究人员遵循开放科学的原则,以便更容易地检测和纠正错误,因此作为一个社区,我们的计算实验降低了这一令人担忧的高错误率。
[16]:Adversarial Orthogonal Regression: Two non-Linear Regressions for Causal Inference
标题:对抗性正交回归:因果推理的两个非线性回归
作者:M. Reza Heydari, Saber Salehkaleybar, Kun Zhang
链接:https://arxiv.org/abs/1909.04454
摘要:本文提出了两种非线性回归方法:加性噪声模型的对抗性正交回归(ador)和一般结构方程模型的对抗性正交结构方程模型(adose)。这两种方法都试图使回归的残差独立于回归者,而不假设噪声分布。在这两种方法中,两个对抗性网络被同时训练,其中一个回归网络输出预测,一个损失网络估计相互信息(在ador中)和kl散度(在adose中)。这些方法可以表示为一个minimax二人博弈;在均衡时,ador在输入和输出之间找到一个确定的映射,并估计剩余和输入之间的相互信息,而adose则估计输出给定输入的条件概率分布。所提出的方法可用作解决因果关系中的若干学习问题的子程序,例如因果方向确定(或更一般地说,因果结构学习)和因果模型估计。综合实验和实际实验表明,所提出的方法与以前的方法相比具有显著的性能。
[17]:Learning review representations from user and product level information for spam detection
标题:从用户和产品级信息中学习审查表示以检测垃圾邮件
作者:Chunyuan Yuan, Wei Zhou, Qianwen Ma, Shangwen Lv, Jizhong Han, Songlin Hu
备注:6 pages. Accepted as IEEE ICDM 2019, Short Paper
链接:https://arxiv.org/abs/1909.04455
摘要:意见垃圾已经成为社交媒体中普遍存在的问题,在社交媒体中,被雇佣的垃圾邮件发送者撰写欺骗性的评论,对产品进行促销或降级,以误导消费者牟利或名誉。现有的研究主要集中在手工设计离散的文本或行为特征,无法捕捉评论的复杂语义。尽管最近的研究采用了深度学习的方法来学习评论级语义特征,但是它们的模型忽略了用户级和产品级信息对学习评论语义和用户评论产品关系信息的影响。本文提出了一种层次化的融合注意网络(hfan),从用户和产品两个层面自动学习评论的语义。具体来说,我们设计了一个多注意单元来提取用户(产品)相关的评论信息。然后,我们使用正交分解和融合注意从评论信息中学习用户、评论和产品表示。最后,我们将评审视为用户和产品实体之间的一种关系,并应用transh将这种关系联合编码为评审表示。实验结果表明,在四个真实数据集上,该模型的绝对精度比现有的性能提高了10%以上,证明了该模型的有效性和通用性。
[18]:Jointly embedding the local and global relations of heterogeneous graph for rumor detection
标题:联合嵌入异构图的局部和全局关系进行谣言检测
作者:Chunyuan Yuan, Qianwen Ma, Wei Zhou, Jizhong Han, Songlin Hu
备注:10 pages, Accepted to the IEEE International Conference on Data Mining 2019
链接:https://arxiv.org/abs/1909.04465
摘要:社交媒体的发展彻底改变了人们交流、分享信息和决策的方式,但同时也为发布和传播谣言提供了一个理想的平台。现有的谣言检测方法侧重于从文本内容、用户配置文件和传播模式中寻找线索。然而,以往的研究并没有充分利用消息传播图中的局部语义关系和全局结构信息。
本文提出了一种新的用于谣言检测的全局局部注意网络(glan),它将局部语义信息和全局结构信息联合编码。我们首先通过将相关转发的语义信息与注意机制融合,为每个源tweet生成更好的集成表示。然后,我们将所有源tweet、retweet和用户之间的全局关系建模为一个异构图,以获取丰富的结构信息,用于谣言检测。我们在三个真实世界的数据集上进行了实验,结果表明glan在谣言检测和早期检测两个场景中都显著优于最新的模型。
[19]:VACL: Variance-Aware Cross-Layer Regularization for Pruning Deep Residual Networks
标题:vacl:用于剪枝深残差网络的方差感知跨层正则化
作者:Shuang Gao, Xin Liu, Lung-Sheng Chien, William Zhang, Jose M. Alvarez
备注:ICCV Workshop
链接:https://arxiv.org/abs/1909.04485
摘要:提高权值稀疏性是产生轻质深层神经网络的常用策略。然而,带有残差学习的剪枝模型更具挑战性。本文介绍了一种新的解决这一问题的方法——方差感知跨层(VACL)。vacl由两部分组成:跨层分组和方差感知正则化。在跨层分组中,通过跳过连接连接的层的$i^{th}$过滤器被分组到一个正则化组中。然后,方差感知正则化项同时考虑连接层的一阶和二阶统计量来约束组内的方差。该方法能有效地改善残差模型的结构稀疏性。对于cifar10,该方法在不降低精度的情况下将resnet模型降低了79.5%,在降低精度小于1%的情况下将resnext模型降低了82%。对于imagenet,它的剪枝率高达63.3%,前5位精度下降不到1%。实验结果表明,该方法在整体模型尺寸和精度上明显优于其他最新方法。
[20]:Context-aware Deep Model for Entity Recommendation in Search Engine at Alibaba
标题:阿里巴巴搜索引擎实体推荐的上下文感知深度模型
作者:Qianghuai Jia, Ningyu Zhang, Nengwei Hua
备注:CIKM2019 International Workshop on Entity Retrieval. arXiv admin note: text overlap witharXiv:1511.08996by other authors
链接:https://arxiv.org/abs/1909.04493
摘要:实体推荐(entity recommendation)通过帮助搜索用户查找给定查询的相关实体,为他们提供更好的体验,已成为当今搜索引擎不可或缺的功能。现有的研究通常只考虑具有显式实体的查询。它们通常无法处理没有实体的复杂查询,例如“什么食物适合寒冷天气”,因为它们的模型无法推断输入文本的潜在含义。在这项工作中,我们相信上下文传达了有价值的证据,可以促进查询的语义建模,并将它们考虑到实体推荐中。为了更好地对查询和实体的语义进行建模,我们结合注意力集中的深层神经网络学习查询和实体的表示。我们使用一个广泛使用的商业中文搜索引擎的大规模、真实的搜索日志来评估我们的方法。我们的系统已经部署在神马搜索引擎中,您可以在阿里巴巴的UC浏览器中获取。在线a/b测试结果表明,点击率提高了5.1%,页面浏览率提高了5.5%。
[21]:DeepPrivacy: A Generative Adversarial Network for Face Anonymization
标题:深度隐私:一种面向匿名化的生成性对抗网络
作者:Hkon Hukkels, Rudolf Mester, Frank Lindseth
备注:Accepted to ISVC 2019
链接:https://arxiv.org/abs/1909.04538
摘要:我们提出了一种新的架构,能够在保留原始数据分布的同时自动匿名化图像中的人脸。我们通过仅基于隐私安全信息生成图像来确保图像中所有人脸的完全匿名。我们的模型是基于一个条件生成的对抗网络,在考虑原始姿态和图像背景的情况下生成图像。条件信息使我们能够在生成的面和现有背景之间无缝过渡,生成高度真实的面。此外,我们还介绍了不同的人脸数据集,包括非常规姿势、遮挡的人脸和背景的巨大变化。最后,我们给出了实验结果,反映了我们的模型在保持数据分布的同时对图像进行匿名化的能力,使数据适合于进一步的深度学习模型训练。据我们所知,目前还没有其他的解决方案来保证人脸在生成真实图像时的匿名性。
[22]:Representation of Constituents in Neural Language Models: Coordination Phrase as a Case Study
标题:神经语言模型中成分的表示:以协调短语为例
作者:Aixiu An, Peng Qian, Ethan Wilcox, Roger Levy
备注:To appear at EMNLP 2019
链接:https://arxiv.org/abs/1909.04625
摘要:神经语言模型在许多nlp任务中都取得了最先进的性能,最近被证明可以学习到单个单词之间的一些层次敏感的句法依赖关系。然而,对于语言处理来说,同样重要的是将单词组合成短语成分的能力,以及使用成分级特征来驱动下游期望的能力。本文以协调名词短语为例,研究了神经网络模型表达成分层次特征的能力。我们评估在英语和法语上训练的不同神经语言模型是否代表短语水平的数字和性别特征,并使用这些特征来驱动下游期望。我们的结果表明,模型使用np成分数的线性组合来驱动coordnp/动词数的一致性。这种行为具有高度的规律性,甚至对局部句法环境敏感,但它与观察到的人类行为有着本质的区别。模特在性别认同方面的成功率较低。在大型语料库上训练的模型表现最好,而使用显式句法监督训练的模型没有明显的优势。
[23]:Meta-Learning with Implicit Gradients
标题:内隐梯度元学习
作者:Aravind Rajeswaran, Chelsea Finn, Sham Kakade, Sergey Levine
备注:NeurIPS 2019. First two authors contributed equally
链接:https://arxiv.org/abs/1909.04630
摘要:智能系统的一个核心能力是通过借鉴以往的经验快速学习新任务的能力。基于梯度(或优化)的元学习最近成为一种有效的少镜头学习方法。在这个公式中,元参数是在外循环中学习的,而特定于任务的模型是在内循环中学习的,只使用来自当前任务的少量数据。扩展这些方法的一个关键挑战是需要通过内环学习过程进行区分,这可能会带来相当大的计算和内存负担。通过引入隐式微分,我们发展了隐式maml算法,它只依赖于内部层次优化的解,而不依赖于内部循环优化器所走的路径。这有效地将元梯度计算与内环优化器的选择分离开来。因此,我们的方法对内环优化器的选择是不可知的,并且可以优雅地处理许多梯度步骤,而不会消失梯度或内存约束。理论上,我们证明了隐式maml可以在不增加总计算成本的情况下,以较小的常数因子,即不超过计算单个内环梯度所需的内存占用来计算精确的元梯度。实验表明,隐式maml的这些优点转化为对少量镜头图像识别基准的经验增益。
[24]:Data Selection for Short Term load forecasting
标题:短期负荷预测的数据选择
作者:Nestor Pereira, Miguel Angel Hombrados Herrera, Vanesssa Gómez-Verdejo, Andrea A. Mammoli, Manel Martínez-Ramón
链接:https://arxiv.org/abs/1909.01759
摘要:利用机器学习进行电力负荷预测是人工智能的一个相当成熟的应用,在电力系统的运行、控制和规划中是必不可少的。数据选择技术在这个应用中很少被使用。然而,如果在负荷预测中数据分布相同的假设显然不是正确的,但它是循环平稳的,那么使用这种技术可能是有益的。在这项工作中,我们提出了一种全自动的方法来确定什么是最充分的数据来训练一个基于全贝叶斯概率模型的预测器。我们根据美国几年来公开记录的真实数据,通过实验评估了该方法的性能。
[25]:Can we trust deep learning models diagnosis? The impact of domain shift in chest radiograph classification
标题:我们能信任深度学习模型诊断吗?区域移位对胸片分型的影响
作者:Eduardo H. P. Pooch, Pedro L. Ballester, Rodrigo C. Barros
备注:4 pages, 2 figures, to be submitted to ISBI 2020
链接:https://arxiv.org/abs/1909.01940
摘要:While deep learning models become more widespread, their ability to handle unseen data and generalize for any scenario is yet to be challenged. In medical imaging, there is a high heterogeneity of distributions among images based on the equipment that generate them and their parametrization. This heterogeneity triggers a common issue in machine learning called domain shift, which represents the difference between the training data distribution and the distribution of where a model is employed. A high domain shift tends to implicate in a poor performance from models. In this work, we evaluate the extent of domain shift on three of the largest datasets of chest radiographs. We show how training and testing with different datasets (e.g. training in ChestX-ray14 and testing in CheXpert) drastically affects model performance, posing a big question over the reliability of deep learning models.
[26]:Towards a general model for psychopathology
标题:心理病理学的一般模型
作者:Alessandro Fontana
备注:40 pages, 18 figures
链接:https://arxiv.org/abs/1909.02199
摘要:DSM-1发表于1952年,包含128个诊断类别,共132页。DSM-5出现在2013年,包含541个诊断类别,描述在947页。心理学领域的特点是诊断模型和子类别的不断增加,这似乎受到了“分裂和膨胀”原则的启发。这一方法与实验证据形成对比,实验证据一方面表明,在病人的记忆中经常出现各种创伤,另一方面,所涉及的基因变异在广泛的诊断中共享。在这项工作中,我提出了一个整体的方法,利用人工智能领域的工具构建。我的模型基于两个支柱。第一种是创伤,它代表着对心灵的攻击,是心理的本质,它的根源在于环境。第二个支柱是分离,它代表了生理和病理条件下的心理防御,并包含了所有其他防御机制。分离损伤可以被认为是另一种类型的攻击,本质上是神经生物学的,可以是遗传或环境起源的。除其他因素外,它们包括突触过度修剪、滥用药物和炎症。这些因素同时削弱了防御,以神经网络为代表,神经网络在大脑中实现了分离机制。该模型随后被用于解释五种精神状态:创伤后应激障碍、复杂创伤后应激障碍、分离认同障碍、精神分裂症和双相情感障碍。理想情况下,这是建立一个模型的第一步,该模型旨在用一个单一的理论框架解释更广泛的精神病理性情感。最后一部分为心理创伤的心理治疗概述。
[27]:Smooth Contextual Bandits: Bridging the Parametric and Non-differentiable Regret Regimes
标题:顺畅语境下的强盗:连接参数和不可微遗憾机制
作者:Yichun Hu, Nathan Kallus, Xiaojie Mao
链接:https://arxiv.org/abs/1909.02553
摘要:We study a nonparametric contextual bandit problem where the expected reward functions belong to a Hlder class with smoothness parameter $\beta$. We show how this interpolates between two extremes that were previously studied in isolation: non-differentiable bandits ($\beta\leq1$), where rate-optimal regret is achieved by running separate non-contextual bandits in different context regions, and parametric-response bandits ($\beta=\infty$), where rate-optimal regret can be achieved with minimal or no exploration due to infinite extrapolatability. We develop a novel algorithm that carefully adjusts to all smoothness settings and we prove its regret is rate-optimal by establishing matching upper and lower bounds, recovering the existing results at the two extremes. In this sense, our work bridges the gap between the existing literature on parametric and non-differentiable contextual bandit problems and between bandit algorithms that exclusively use global or local information, shedding light on the crucial interplay of complexity and regret in contextual bandits.
[28]:Automatic Financial Trading Agent for Low-risk Portfolio Management using Deep Reinforcement Learning
标题:基于深度强化学习的低风险投资组合自动交易代理
作者:Wonsup Shin, Seok-Jun Bu, Sung-Bae Cho
备注:18 pages
链接:https://arxiv.org/abs/1909.03278
摘要:自主交易代理是人工智能领域中解决资本市场投资组合管理问题最为活跃的研究领域之一。投资组合管理问题的两个主要目标是利润最大化和风险抑制。然而,解决这个问题的大多数方法都只考虑最大化收益。因此,本文提出了一种基于深度强化学习的交易代理,它既能管理投资组合,又能兼顾收益最大化和风险约束。我们还提出了一个新的目标政策,允许交易代理学习偏好低风险行为。新的目标策略可以通过超参数调整对最优行为的贪婪程度来反映在更新中。该交易代理通过加密货币市场的数据来验证性能。由于每分钟积累的数据量巨大,市场波动性极大,加密货币市场是测试我们交易代理的最佳试验场。作为实验结果,在测试期间,我们的代理人获得了1800%的回报,并提供了现有方法中风险最小的投资策略。另外,另一个实验表明,即使市场波动较大或训练周期较短,代理仍能保持鲁棒的广义性能。
[29]:Fast mmwave Beam Alignment via Correlated Bandit Learning
标题:基于相关bandit学习的mmwave波束快速对准
作者:Wen Wu, Nan Cheng, Ning Zhang, Peng Yang, Weihua Zhuang, Xuemin, Shen
备注:Accepted by IEEE Transactions on Wireless Communications. In this article, we propose a learning-based fast beam alignment algorithm to reduce beam alignment latency
链接:https://arxiv.org/abs/1909.03313
摘要:波束对准(ba)是在毫米波(mmwave)系统中,为了建立可靠的通信链路,保证发射和接收波束的精确对准。现有的ba方法通过搜索整个波束空间来确定最佳的收发波束对,在最坏的情况下,这会导致显著的ba延迟(以秒为单位)。本文提出了一种降低ba延迟的学习算法,即分层波束对齐(hba)算法。我们首先将ba问题描述为一个随机多臂bandit问题,目标是在一定时间内最大化接收信号的累积强度。该算法利用了波束间的相关性结构,不必搜索整个波束空间,而是从邻近的波束中提取信息来识别最优波束。此外,该算法还结合了信道波动的先验知识,进一步加速了ba过程。理论分析表明,该算法是渐近最优的。大量仿真结果表明,与ieee 802.11ad中现有的ba方法相比,该算法能够以较高的概率识别出最优波束,并将多径信道中的ba延迟从数百毫秒减少到几毫秒。
[30]:Feature-Set-Engineering for Detecting Freezing of Gait in Parkinson's Disease using Deep Recurrent Neural Networks
标题:None
作者:Spyroula Masiala, Willem Huijbers, Martin Atzmueller
链接:https://arxiv.org/abs/1909.03428
摘要:步态冻结(fog)是帕金森病患者常见的步态障碍,通常出现在晚期。冰冻期与跌倒、受伤和心理后果有关,对患者的生活质量产生负面影响。为了自动检测雾幕,需要一种高精度的检测方法。提出了一种基于三维加速度计测量的深度递归神经网络(rnn)雾幕检测方法。我们研究了从传感器时间序列数据中提取的合适特征和特征组合。具体地说,为了检测雾的发作,我们使用了一个带有长期短期记忆细胞的深度rnn。在我们的实验中,我们同时进行了依赖用户和独立用户的实验,以检测冻结事件。实验结果表明,从主干传感器提取的频域特征是独立于受试者方法中信息量最大的特征组,平均auc评分为93%,特异性为90%,敏感性为81%。此外,所有传感器的频率和统计特征被确定为受试者相关方法的最佳单一输入,平均AUC得分为97%,特异性为96%,敏感性为87%。总的来说,与文献中的最新方法作为基线方法相比,我们提出的方法明显优于这些方法。
[31]:Deep MR Brain Image Super-Resolution Using Spatio-Structural Priors
标题:基于空间结构先验的深部mr脑图像超分辨率研究
作者:Venkateswararao Cherukuri, Tiantong Guo, Steve. J. Schiff, Vishal Monga
备注:Accepted to IEEE transactions on Image Processing
链接:https://arxiv.org/abs/1909.04572
摘要:高分辨率磁共振(mr)图像是准确诊断的理想图像。实际上,图像分辨率受到硬件和处理约束等因素的限制。最近,深度学习方法被证明能产生令人信服的最新图像增强/超分辨率结果。针对高分辨率mr图像结构的要求,提出了一种利用图像先验知识的正则化网络,即低阶结构和在增强深度mr图像超分辨率(sr)之前的锐度。然后,我们的贡献是以一种可分析处理的方式将这些prior合并到一个新的previor-guided网络架构中,从而完成超分辨率任务。这对于低秩先验来说尤其具有挑战性,因为秩不是图像矩阵(以及网络参数)的可微函数,我们通过寻求秩的可微近似来解决这个问题。通过拉普拉斯的方差来强调锐度,我们证明在网络的输出端可以通过固定的反馈层来实现。作为一个关键的扩展,我们通过学习一组新的训练数据驱动的滤波器来修改固定反馈(laplacian)层,这些滤波器是为了提高清晰度而优化的。在公开可用的mr脑图像数据库上进行的实验以及与现有最新方法的比较表明,所提出的先验引导网络在改进snr/图像质量度量方面提供了显著的实际增益。由于我们的prior是在输出图像上,因此该方法是多用途的,并且可以与现有的各种网络结构相结合以进一步提高它们的性能。中文来自机器翻译,仅供参考。
|
|