大数据文摘出品
作者:Christopher Dossman
编译:Olivia、Joey、云舟
呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!
AI ScholarWeekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。
每周更新,做AI科研,每周从这一篇开始就够啦!
本周关键词:机器学习安全性、数据编程、对象再识别
提升机器学习系统的安全性:了解如何保护机器学习模型
对于任何软件系统来说安全性都至关重要,这也包括机器学习(ML)模型,因为人们可以通过对抗性示例轻松地适应从而攻击该模型。
现在研究界对于探索和发现对抗性攻击已经有了许多文献和复杂的算法,并提出了一些有可能实施的防御措施。例如,近日一些研究人员发表的这篇论文:机器学习究竟在网络安全领域中处于什么位置?
论文链接:
https://medium.com/ai%C2%B3-theory-practice-business/where-does-machine-learning-stand-in-cyber-security-670e3fe1cda2
但是,根据与华盛顿大学合作和Microsoft Research的一组研究人员的说法,之前对于ML模型安全性的研究大多数的研究对象都是独立的神经网络模型。
在这份最新的研究报告中,研究人员们评估了大规模部署的ML软件产品的安全性,希望能够扩大这一领域的研究范围,从而提供一个从系统安全性视角出发改进现有软件产品的方法。它们描述了使用ML组件在软件中实现系统安全的最佳实践,并提出了一系列的短期缓解建议,部署机器学习模块的从业人员可以参考他们的研究来保护软件系统。
原文:
https://arxiv.org/abs/2007.07205v1
将自然语言转化为移动UI操作
在ACL 2020上发表的这篇论文中,谷歌AI研究人员展示了解决自动动作序列映射问题的第一步:创建三个新的数据集,用于训练深度学习模型,将自然语言指令应用于可执行的移动用户界面操作。
他们的这一成果为移动设备上的任务自动化奠定了技术基础,从而减轻了通过UI细节进行操作的需求,这对于视力受损的用户将非常有价值。他们还开源了其模型代码和数据管道,以促进研究界的进一步发展。
Github链接:
https://github.com/google-research/google-research/tree/master/seq2act
原文:
https://arxiv.org/pdf/2005.03776.pdf
基于数据编程的工业图像标签系统
最近发布的这篇论文提出了Inspector Gadget:一种用于分类问题的可伸缩图像标签系统。该系统有效地结合了众包、数据增强和数据编程技术。Inspector Gadget的目标应用是在制造业中对大型工业图像进行部分分析,此前在这一领域很少甚至根本没有标签。
与现有的使用对象检测模型预先将图像转换为结构化数据的数据编程方法不同,Inspector Gadget通过提供众包工作流以利用人类知识来识别人们希望研究的模式来直接标记图像。然后,将图案增强并与其他图像匹配,并生成用于神经网络模型训练的相似性特征。
结果表明,Inspector Gadget优于其他图像标记方法,例如Snuba,GOGGLES以及使用CNN而不进行预训练的自习基准模型。研究人员认为,Inspector Gadget开辟了使用数据编程的新方向。
原文:
https://arxiv.org/pdf/2004.03264v2.pdf
用于通用实例再识别的Pytorch工具箱FastReID
在本文中,研究人员介绍了一个名为FastReID的开源库,该库可用于通用实例再识别。
实验结果证明了FastReID在多种任务上具有通用性和有效性,例如:人员再识别和车辆再识别等。研究人员称,共享FastReID是因为开源研究平台对整个AI社区(包括学术界和工业界的研究和从业人员)的快速进步至关重要。
他们希望通过发布FastReID来继续加速通用实例再识别领域的发展,同时也期待彼此之间的学习合作,以促进计算机视觉领域的发展。
原文:
https://arxiv.org/pdf/2006.02631v4.pdf
用于紧凑3D人脸建模的基于关节的神经装备表示(Neural Rig Representation)
本文提出了一种新的3D人脸表示方法,它使用基于关节的人脸装备(rig)搭建人脸模型。该模型非常紧凑,因此需要使用更小的数量级来保有其强大功能。这一需求可以通过学习神经蒙皮权重(neural skinning weights)来满足。研究人员还通过重新拓扑扫描、BU-3DFE、可视化Azure Kinect和2D图像等来评估模型。
该模型具有可进行人脸蒙皮编辑和装饰的优点。研究人员已经将人脸模型整合到点云和2D图像,因此未来的工作是通过学习神经网络来直接预测人脸模型参数,从而为加速实时应用重建提供可能。
原文:
https://arxiv.org/pdf/2007.06755v2.pdf
通过像素级自动图像标记实现语义图像分割,性能超过大部分已有的弱监督方法:
https://arxiv.org/pdf/2007.07415v1.pdf
有关机器学习中隐私攻击的最新调查结果:
https://arxiv.org/pdf/2007.07646v1.pdf
从平均场博弈(MFG)和最佳运输(OT)角度分别理解和分析生成对抗网络(GAN):
https://arxiv.org/abs/2002.04112v2
特征量化助力GAN训练:
https://arxiv.org/pdf/2004.02088v2.pdf
表情符号预测的拓展和基准测试:
https://arxiv.org/abs/2007.07389v1
70多个机器学习数据集和项目构想:
https://googleweblight.com/i?u=https://data-flair.training/blogs/machine-learning-datasets/
2020年机器学习项目Top 21:
https://data-flair.training/blogs/machine-learning-project-ideas/
面向初学者的免费机器学习项目构想:
https://www.skyfilabs.com/blog/free-machine-learning-project-ideas-for-beginners
DeepMind与UCL AI中心共同打造深度学习系列讲座:
https://www.youtube.com/playlist?list=PLqYmG7hTraZCDxZ44o4p3N5Anz3lLRVZF
AI芯片初创公司Graphcore开启系统业务,称其比Nvidia经济适用得多:
https://www.zdnet.com/article/ai-chip-startup-graphcore-enters-the-system-business-claiming-economics-vastly-better-than-nvidias/
ICML 2020之Google篇:
https://ai.googleblog.com/2020/07/google-at-icml-2020.html
AI的超强能力能否协助人类外科医生减少医疗错误:
https://www.zdnet.com/article/big-backing-pair-doctors-ai-assist-technology/
大数据文摘出品
作者:Christopher Dossman
编译:李雷、Luna、云舟
呜啦啦啦啦啦啦啦大家好,本周的AI Scholar Weekly栏目又和大家见面啦!AI ScholarWeekly是AI领域的学术专栏,致力于为你带来最新潮、最全面、最深度的AI学术概览,一网打尽每周AI学术的前沿资讯。每周更新,做AI科研,每周从这一篇开始就够啦!
本周关键词:自动驾驶、强化学习、GANs
Waymo开放数据集挑战赛
今年3月,Alphabet旗下的自动驾驶公司Waymo发起公开挑战赛,参赛者可以使用其自动驾驶数据集(包括2D和3D检测、2D和3D跟踪以及域适应数据)来建立和测试机器学习模型。挑战赛收到来自世界各地的上百份代码提交,最终入围决赛的选手来自中国、英国、新加坡、美国等多个国家。
最近公开的Waymo开放数据集(Waymo Open Dataset,WOD)是用于自动驾驶研究的大型数据集,提供了1000个用于训练和验证以及150个用于测试的驾驶片段。每个片段包含拍摄自不同摄像机的镜头,平均每部摄像机约200帧图像,这其中还包括5台分辨率为1280×1920或886×1920的高分辨率摄像机。总而言之,该数据集包含约115万张关于车辆、行人和骑自行车的人的图像,以及990万张2D边界框。
本论文给出了Waymo开放数据集(WOD)2020挑战赛的最佳解决方案。作者采用FPN(Feature pyramid networks)作为基本框架,而级联RCNN、堆叠PAFPN(Path aggregation FPN)和多头RCNN则用于提高性能。为了处理WOD中的小目标检测问题,训练和测试都使用了超大尺寸的图像,本文的方案在2D对象检测跟踪中排名第一。作者们计划持续增加数据集,希望这将有助于国际研究界在机器感知和自动驾驶技术方面取得进步。
原文:
https://arxiv.org/abs/2008.01365v1
MusPy - 用于生成符号音乐的工具包
本文介绍了MusPy,一个用于生成符号音乐的开源Python库。MusPy为音乐生成系统中的基本组件提供了易于使用的工具,包括数据集管理,数据I / O,数据预处理和模型评估等。
为了展示模型能力,作者对MusPy当前支持的11个数据集进行了统计分析。此外,他们还进行了跨数据集的泛化实验,通过在每个数据集上训练自回归模型,测量其他数据集上的留存可能性(MusPy的数据集管理系统使此过程变得更加容易)。
源码及文档:
https://github.com/salu133445/muspy
原文:
https://arxiv.org/abs/2008.01951v1
深度轻量级Transformer模型
在本论文中,Facebook人工智能实验室和艾伦人工智能研究所的研究人员提出了一种名为DeLighT的极深度轻量级Transformer模型。他们认为,与其他基于Transformer的模型相比,DeLighT可以提供类似或更好的性能,并且参数要少得多。
DeLighT可以高效地分配参数,它使用DExTra(一种深度轻量级转换)在每个Transformer编码器层中分配参数,而在各层之间使用逐层缩放的方法,这种方法允许在输入附近使用较浅较窄的DeLighT层,在输出附近使用较宽较深的DeLighT层。
总体而言,DeLighT网络的深度可以是标准Transformer模型的2.5至4倍,但参数和操作却少得多。在机器翻译和语言建模任务上进行的实验表明,DeLighT可以用更少的参数达到Transformer基线模型的性能。
源码:
https://github.com/sacmehta/delight
原文:
https://arxiv.org/abs/2008.00623v1
一个新型、简单并且可扩展性高的强化学习框架
强化学习(RL)已成为当下主流之一的研究领域,前沿的人工智能公司都会将其作为重要工具来对待。因此,许多研究人员建立了RL框架,例如openAI Gym和KerasRL,以简化其他人的使用。
为了降低RL新手的入门障碍,本文提出了一个新框架——EasyRL。EasyRL是一个通过交互式GUI来构建、训练和评估RL代理的框架。
由于EasyRL完全以GUI呈现,因此不需要有关于训练或测试其内置RL代理的编程知识。该框架还支持自定义RL代理和环境,这对于RL研究人员评估和比较其RL模型非常有帮助。
原文:
https://arxiv.org/abs/2008.01700v1
用于图像和视频合成的GANs:算法与应用
GANs现在是执行各种图像和视频合成任务的强大工具。它们能生成高分辨率的逼真图像和视频,而在此之前这是一项艰巨甚至不可能的任务。GANs还能在内容创作中生成一些新内容。
在这项工作中,研究人员提供了GANs的概述,着重于视觉合成的算法和应用。它们涵盖了稳定GANs训练的几种重要技术,尤其是一些臭名昭著的技术难点。他们还讨论了其在图像翻译,图像处理,视频合成和神经渲染中的应用。
原文:
https://arxiv.org/abs/2008.02793v1
简单的Modulo可以大大胜过基于深度学习的代码:
https://arxiv.org/abs/2008.01686v1
一种用于有效标记的主动图像合成方法,可提高使用小数据进行学习任务时的性能:
https://arxiv.org/abs/1902.01522v4
引入Cylinder3D进行驾驶场景LiDAR语义分割:
https://arxiv.org/abs/2008.01550v1
单个示例生成连贯的层级样式:
https://arxiv.org/abs/2008.01531v1
机器学习简单的自学资源:
https://developers.google.com/machine-learning/crash-course
吴恩达讲授斯坦福机器学习课程:
http://www.holehouse.org/mlclass/?fbclid=IwAR1XmS0CtIXUDg0s2bxeTUpiv2Dh08L_DaDQqA2HCXqafUFfcWays6S07UI
AI可能会创造的20种严重犯罪:
https://www.zdnet.com/article/evil-ai-these-are-the-20-most-dangerous-crimes-that-artificial-intelligence-will-create/
Julia 1.5发布:
https://www.zdnet.com/article/programming-language-julia-version-1-5-is-out-lots-of-new-features-better-performance/
相关问答
[最佳回答]首先,在不同页码的分界页面(如:论文中的引言部分)设置“分节符”:单击“插入”菜单中的“分隔符”命令,选择“分节符类型”下的某一个类型,其中“下...
[最佳回答]我去年就参加了全国大学生数学建模竞赛,这些资料是我去年暑假整理的论文模板,如果资料不足的话,再联系我………………全国大学生数学建模竞赛论文...
刘野作品中所传达出的带有卡通艺术的变形、幽默、夸张、讽刺、滑稽的童趣特质,以及洛丽塔情结和女性思索,还有作品中的政治寓意和蒙德里安元素,使其在当代艺术...
论文的前面新增一页,可以按照以下步骤进行操作:1.首先,将光标移动到论文第一页的末尾,确保光标在最后一个字符的后面。2.然后,在Word中按下CTRL+Enter键...
论文声明页是论文翻开后的第一页(即论文的第二页)。页面上一般印有论文题目、专业班级、学生姓名、指导教师、日期等。论文声明页是论文翻开后的第一页(即论...
可以采用下面的方法在word里的任意页输入密码,以word2007为例:1、打开word文档,将光标定位到“任意页”的前一页末尾,单击“页面布局”菜单,单击“...
在LaTeX中,使用`\setcounter{page}{X}`命令将当前页码设置为X。其中,X是您希望从其开始编号的页码。该命令应放在您希望从其开始新编号的文档的第一个页...
当毕业季节到来的时候,大学毕业生正忙于进行毕业设计。很多学生都对毕业设计感到头痛,要花很多心思,还要把毕业设计交给学校进行检测,通过才能毕业。为了发展...
其实这种论文多的是,知网里就有不少,但是知网数据库资料不是对外开放的,你无法查看全文。建议你百度搜下:普刊学术中心,有一个免费论文栏目,看下有没有你需要的...
写论文有2113十个要求。具体是:(一)论文5261——题目科4102学论文都有题目,不能“无题”。论文题目一1653般20字左右。题目大小应与内容符合,尽量不...