快捷搜索:

微软开源人工智能工具和深度学习框架,计算机

日期:2019-11-20编辑作者:澳门新葡8455手机版

图片来源:www.pexels.com

官方主页:

孙剑:我们在南京成立了研究院,与南京大学有合作,我们和西安交大人机所、上海科技大学成立了联合实验室,和权龙老师在香港科技大学也成立了一个实验室,因为想实现互补——3D认知方面和图像识别方面是要结合在一起的。我们接下来还会找和我们相互补的,不管学校也好,或者研究机构也好,来做这样的合作。

视频:大白话讲解卷积神经网络工作原理

●●●

新的监督学习范式:对偶学习

利用两种语言互相翻译,互相提供翻译标注数据。例如中文翻译成日语,再翻译回中文,与中文原文做比对,进行模型训练。再例如由图像生成文字,再由文字生成图像。使用对偶学习可以用更少的数据训练模型,节省人工标注数据的成本。

澳门新葡8455手机版 1微软亚洲研究院

微软研究院在业内号称“AI界的黄埔军校”,从中涌现出众多当今互联网界泰山北斗级人物,从谷歌传奇李开复,到百度总裁张亚勤、金山CEO张宏江、微软必应产品负责人沈向洋、现任微软亚洲研究院院长洪小文、IBM“深蓝”之父许峰雄、“阿里云”之父王坚、今日头条副总裁马维英、商汤科技创始人汤晓鸥、2015年ImageNet冠军孙剑、何恺明,百度高级副总裁王海峰、小米总裁林斌、海尔集团CTO赵峰、科大讯飞副总裁李世鹏……

2018年,微软亚洲研究院成立二十年。

微软亚洲研究院20年20人

澳门新葡8455手机版 2同济大学微软学生俱乐部

Custom Vision

Video Indexer

学堂在线慕课:微软人工智能-深度学习框架和工具

用Microsoft Custom Vision技术识别点东西吧

科普文:大白话讲解卷积神经网络工作原理

B站视频:不用写代码,三分钟做一个人工智能小应用

视频:三分钟走进卷积神经网络

视频:大白话讲解卷积神经网络工作原理

微软亚洲研究院

微软亚洲研究院20年20人

作者介绍:

张子豪,同济大学在读研究生。微信公众号人工智能小技巧运营者。致力于用人类能听懂的语言向大众科普人工智能前沿科技。目前正在制作《说人话的人工智能视频教程》、《零基础入门树莓派趣味编程》等视频教程。西南地区人工智能爱好者高校联盟联合创始人,重庆大学人工智能协会联合创始人。充满好奇的终身学习者、崇尚自由的开源社区贡献者、乐于向零基础分享经验的引路人、口才还不错的程序员。

说人话的零基础深度学习、数据科学视频教程、树莓派趣味开发视频教程等你来看!

微信公众号:人工智能小技巧

Github代码仓库:TommyZihao

个人主页:www.python666.org

同济大学开源软件协会

同济大学微软学生俱乐部

西南人工智能爱好者联盟重庆大学人工智能协会

《知识分子》:那个时候,你做什么样的研究?

微软已经将人工智能应用部署在自己的产品中,比如语音识别小助手Cortana、Office 365,你也可以用微软提供的GPU服务器和FPGA服务器训练深度学习模型。

孙剑澳门新葡8455手机版 ,:我那时候用的那些神经网络不是卷积神经网络,它可以认为是全连接网络的一些改进,做了一些分组,跟卷积有点像。卷积神经网络是我(本科)毕业以后才出现的,最早做手势识别、光学字符识别(Optical Character Recognition, OCR),大家也没觉得那个能怎么样,真的就是这样。后来,在2000年的时候出现了支持向量机(Support Vector Machine, SVM),一统江湖,所有人都在研究这个,所以关注神经网络的人就更少了。

澳门新葡8455手机版 3微软人工智能新进展

2009年和2016年,孙剑两获计算机视觉领域的顶级会议CVPR(IEEE Conference on Computer Vision andPattern Recognition)最佳论文。2010年,他还入选《MIT技术评论》35岁以下年轻创新者。通过设计152层的神经网络ResNets,孙剑所带领的微软亚洲研究院团队在2015年获得ImageNet和MS COCO比赛的五项第一。

澳门新葡8455手机版 4微软开源人工智能框架CNTK澳门新葡8455手机版 5CNTK收敛速度澳门新葡8455手机版 6CNTK并行计算能力

孙剑:鼓励基础研究。深度学习中有一个梯度下降算法、反传算法,最后监督信号决定了这个系统会是什么样子的。我觉得在任何一个组织的话,你希望这个组织做什么,不做什么,就相当于一个监督信号。训练一个分类器,可以接受正样本、负样本,这个组织就会像深度学习一样,自动地去反传、监督这个信号,形成它的特色。微软研究院很鼓励基础创新,鼓励对最前沿问题长期如一日的这么做,这样才可能有新的突破诞生。

微软机器视觉、语音处理、视频检索人工智能开源工具和深度学习框架。

本文介绍了微软在人工智能领域的领先成果、产品线,开源人工智能框架和工具。读者可以运用这些工具快速开发机器视觉、语音处理、视频检索等丰富的人工智能应用。

微信公众号:人工智能小技巧

本文配套B站视频:用微软Custom Version识别水果图片:不用写代码,三分钟做一个人工智能小应用

发布于2018-11-7

澳门新葡8455手机版 7

科普文:大白话讲解卷积神经网络工作原理

我们是在2013年开始研究,2014年第一次参加了ImageNet,物体检测拿了第二。2015年参加比赛的时候,内部就已经开发出了ResNet,ImageNet拿了三个第一名,COCO拿了两个第一名。而且COCO,只是把ResNet用上去,提升的就非常多,这是我在微软的工作。其实与此同时,旷视也是非常早,用深度学习来做人脸识别,大概也是在2013年开始的,我还没到旷视。他们当时在人脸检测、识别、关键点定位上拿了三个世界冠军,这也是他们做的非常早的一个工作。旷视是最早的用深度学习来做计算机视觉的创业公司之一。

澳门新葡8455手机版 8ResNet澳门新葡8455手机版 9ResNet

第二个问题要解决怎么让它拟合上去,就是训练优化问题,ResNet是解决这个问题。当然加了ResNet以后,现在可以说是任何深度层的都可以来拟合。大家常用的是几十层或者是一两百层这样的网络。

ResNet在2015年ImageNet比赛分类任务中获得第一名,在图像分类方面已超过人眼。ResNet共有152层,但它不仅仅靠深度取胜,而是通过残差学习的方法训练模型,通过“跨层抄近道”的方法减少参数数量,简单而实用。衍生出ResNet50和ResNet101旁支,Alpha zero(只训练8个小时就打败了AlphaGo的下棋机器)也使用了ResNet。

举个例子,我自己本科毕业设计时,做了一个硬件设备——硬件电路板,来实现混沌神经网络,当然现在它不是主流。混沌神经网络能够记忆一些模式,是用硬件来实现的,因为当时的算力在CPU上是做不好的,一定要在硬件上来做这件事情。

Switchboard能够识别堪比英语专八水平的电话音频中的每个单词

计算摄影学是计算机视觉和图形学的交叉,我做了很长时间这个工作。那个时候手机还没有这么强大,做完了以后,目的是应该放到单反相机、卡片机里面去,但是这些厂商(其实也是对的)需要做快速改动的能力和意愿不是那么强,所以并没有在相机或者单反上广泛使用,这大概是在十几年前的事情。今天,时代不一样了,相机计算力非常强,里面有很好的图像传感器,甚至在晴天下拍的照片和单反看不出区别。另外,现在的手机厂商也非常重视这个方向,如果看手机发布会的话,基本上照片拍的效果是竞争的一个亮点,所以这也是我们目前投入很大的一个方向。我们去年成立了旷视研究院的西雅图分院,专门研究计算摄影学在手机上的创新和应用。

澳门新葡8455手机版 10语音识别

另一方面,它(神经网络)跟那些纯算法还不太一样,它和数据相关,跟数据相关的话,跟平台也相关,所以核心是说,对要做的一些问题要有非常深入的理解,理解有很多细节,理解整个网络在不同的情况下会怎么样,然后从小出发,抓住小的点,把小的点做大,慢慢就可以设计好。

CNTK通过减少数据传输量、传输次数,通过异步处理和管道机制权衡训练和传输代价,加速深度学习模型训练。

在前不久举行的CCF-GAIR全球人工智能与机器人峰会发表题为《云、端、芯上的视觉计算》演讲后,孙剑博士接受了《知识分子》的独家专访。他用自己的研究经历说明,计算机视觉研究是如何改变我们的生活的。

微软研究院在业内号称“AI界的黄埔军校”,以下是微软研究院机器学习组最新进展总结。

《知识分子》:设计各种各样的网络,看起来就像是艺术,你是基于什么去设计一个算法的?

澳门新葡8455手机版 11Custom Vision

Power Human with AI.

分布式机器学习平台DMTK

Multiverso参数服务器开源框架,CNTK异步快速训练的幕后功臣。

包括在芯片上也是一样,不光要调结构,而是内部的网络表示都要采取低精度化的表示,其实这也是神经网络很神奇的特性,因为我们一般来说用32位浮点数表示里面所有的信号,但它(神经网络)其实很稳健,不用32位,用几个比特也能够很好地把这个信息流给传播了。

ResNet的作者何恺明是2003年广东省理科高考状元,本科毕业于清华大学,博士毕业于香港中文大学,曾在微软亚洲研究院孙剑领导的研究组实习。何恺明在图像去雾领域也成果颇丰。

《知识分子》:从研究方法上来说,现在是不是一个巨大的改变,都是用深度学习,卷积神经网络来做?

澳门新葡8455手机版 12视频样本澳门新葡8455手机版 13字幕澳门新葡8455手机版 14翻译

撰文 | 邸利会(《知识分子》主笔)

与其它开源人工智能框架(比如谷歌的Tensorflow、Facebook的Caffe,以及Keras、Torch、Theano)相比,微软的开源人工智能框架CNTK最大的优势就是训练速度快、分布式和并行计算性能好。同时,CNTK也支持各种操作系统,提供各种编程语言的开发工具。

也有机器人项目。那个时候国有机器人还很少,我的导师郑南宁老师从日本引进了一台机器臂的设备,我们专门有一个机器人的组来研究怎么去控制这个机器人,学习里面的基本知识,操作机器人抓东西,跟今天的研究也是一样的。目前这个方向已经有很大进展,但是还不够,还需要更大的进展,因为这是更难的问题——感知问题,只是被动的看,怎么能够主动地去和世界交互,这个是更难的。看的话,很容易教计算机,给它一张照片,然后就可以学;但是交互的过程,很难有大规模的交互的例子能提供给计算机,让它理解,所以这个是最难的。

高效的机器学习工具

  • LightGBM:数据竞赛利器
  • LightLDA:超大规模主体模型训练世界纪录保持者
  • LightRNN:大规模文本模型训练

孙剑:云上不用考虑计算量和内存访问、模型大小的一些问题,或者说是有很松的边界,要追求的是精度问题。在端上,比如说在手机上,它的计算量、内存访问模式和要求的模型大小都是不一样的。今天因为设计网络结构还是人工的一个事情,所以在云上设计的模型肯定在端上不是最优的设计,所以需要在端上面设计才能得到更好的效果。

视频:三分钟走进卷积神经网络

机器学习会长期产生更大的作用

B站视频:用微软Custom Version识别水果图片

第三个问题今天还没有解决的很好,就是推广能力问题。比如,确认了网络在训练数据、测数据的时候好,如果突然来一个新的场景,能不能也做好?比如说,突然来了一个刮风下雨的天气,又有一个奇怪的车,车上掉了东西下来,这个东西还没见过,这就需要推广能力。这是在训练数据当中无法大规模收集到的,这个问题今天深度学习也好,人工智能也好,还是长期要解决的问题。这跟人不一样,人有推理、抽象,有先验,很多东西都能来帮助我们解决推广能力问题,泛化能力问题。这是下一个深度学习解决的问题。像人脸识别解决的非常好了,但是还有很多任务没有这么好。

Cognitive Services为开发者提供计算机视觉、自然语言处理、语音翻译、搜索等各领域应用程序接口,开发者只需要简单调用API即可。

孙剑:我觉得拥抱卷积神经网络也是花了好几年。2012年AlexNet出来时还有人怀疑,不相信,从2013年到现在也5年了,大家慢慢接受了。深度学习核心思想是,它有端到端学习的思想,尽可能不要人来设计复杂系统,因为人的设计能力是有限的。所以更多人去用这个思想来做事情。不是说这个思想是新的,而是如果这个思想有效,就会有更多的人愿意主动去用。

Video Indexer是非常强大的视频和音频处理工具,用户只需上传视频或音频,即可得到关键词分析、时间线字幕、视频中出现的名人及其讲话时段、情绪分析、关键帧以及带字幕和字幕翻译的视频。

西安交大的“人机所”成立已经30多年了,成立之初就叫人工智能与机器人研究所,那时有做图像的,比如有国防项目就是用摄像头看一个车,去跟踪,这样就需要做车的检测、跟踪,跟今天做的是一样的。

澳门新葡8455手机版 15CNTK的并行计算能力澳门新葡8455手机版 16CNTK支持的编程语言澳门新葡8455手机版 17微软收购Github

我读硕士的时候,就是用神经网络来做人脸检测和简单的人脸识别工作。但是,其实当时的人脸识别就仅限于人脸或者是一些车牌这样的识别,能够做到一定地步。我博士做的方向是3D感知,也就是立体匹配。计算机视觉有两大核心问题:一个问题是3D重建;一个问题是识别。这样就把计算机视觉的一些基本问题学习了一下。

澳门新葡8455手机版 18微软AI产品澳门新葡8455手机版 19微软AI产品线

《知识分子》:你对微软的研究氛围体会如何?

澳门新葡8455手机版 20微软Cognitive Service

《知识分子》:LeCun教授1998年提出LeNet-5,用卷积神经网络,你硕士的时候的神经网络是怎样的?

官方主页:

《知识分子》:你今天的主题讲的是“云端芯的计算机视觉”,你觉得现在云端、终端和芯片上有哪些不同的要求?

用微软的开源计算机视觉开发工具Custom Vision快速开发图像分类小应用。初学者不需要有任何深度学习、图像处理的算法知识,小学生都能快速上手。

孙剑:对。基础都得用这个,结合具体问题的一些领域知识,领域知识用得越多越好。现在深度学习已经成为一个工具。我们刚从CVPR2018回来,如果看今年的发展的热点,深度学习已经无处不在了。有几个Talk很有意思,讲者上来就说,我的Talk不包含深度学习,没用深度学习。像以前专门有论文,题目叫深度学习XXX,今天这样的论文题目已经很少了,而是真正深入到问题的本身去研究了。

提起微软,大家首先想到的就是世界首富比尔盖茨以及Windows操作系统等微软产品,近几年,微软大规模部署人工智能领域,开发了一系列基于人工智能技术的产品和深度学习开源框架,并致力于开源社区的建设。微软在2018年10月底完成了对全球最大开源代码托管网站Github的收购。2018年2月,本文作者在宾夕法尼亚大学沃顿商学院聆听了微软新总裁Satya Nadella的演讲,并在慕课网站学堂在线学习了慕课:微软人工智能-深度学习框架和工具 ,遂撰写本文对微软AI产品线及开源生态做一个介绍。

《知识分子》:你在2009年就得过CVPR的最佳论文奖?

[TOC]

本文由澳门新葡8455手机版发布于澳门新葡8455手机版,转载请注明出处:微软开源人工智能工具和深度学习框架,计算机

关键词:

未来人工智能是生产力,但为何获得巨大商业成

原标题:思维导图 | 乔布斯与比尔盖茨都没新发明, 但为何获得巨大商业成功? 区块链技术,被认为是继蒸汽机、电...

详细>>

美国科学家在南卡州附近海域发现大片珊瑚礁,

原标题:美国科学家在南卡州附近海域发现大片珊瑚礁 美国科学家近日宣布在美国南卡罗来纳州近海发现了大片珊瑚...

详细>>

国外高通量卫星发展概述,13号通信卫星

原标题:国外MediaTek量卫星发展概述 二十一日19时04分,中中原人民共和国在西昌卫星发射中央用长三乙火箭成功发射...

详细>>

OpenStack学习教程

下一步是什么呢?在即将举行的柏林峰会上,有三场会议专注于StarlingX。 image.png OpenStack架构 StarlingX旨在支持边缘、...

详细>>