机智如你
首发于机智如你
机器学习是什么?

机器学习是什么?

当今世界,数据无处不在。从一张图片,到一段乐曲,再到一篇文章,数据充斥着我们的生活,并且在相当一段时间内,数据仍然会是数字世界的主体。而机器学习给予了我们从这些无穷无尽的数据中找出规律并加以利用的可能。

https://www.zhihu.com/video/898275234841505792

在这一系列文章中,我们将一起探秘人工智能的世界,共同品味艺术、探索科学以及掌握机器学习的工具。一路上,我将为你展现机器学习的魅力并指导你亲身体会整个创造的过程。千里之行,始于足下,我们将从概念开始,逐渐深入到它们背后的技术细节。

人类对数据的探索岂止于当下

Arthur C. Clarke 曾讲过:

任何先进之技术,乍一看,如梦如幻。

一开始你会觉得机器学习好似变戏法一般深不可测,但当你深入其中,会发现它就是一堆用来从数据中挖掘信息的工具。

▌数据就在我们身边

在过去,人们往往通过分析数据,并针对数据模式的变化来适配软件系统。但是,当数据容量超越人类的感知或模式制定能力之后,我们不得不倾向于使用那些可以从数据自主总结归纳的方式,尤其是从变化的数据中自主学习的软件系统。

▌机器学习早已无处不在

如今我们能够在将日常生活当中瞥见机器学习的身影,但却忽视了一些难以发现的应用。比如你可能发现相册应用自动为照片分门别类是利用了机器学习算法,却可能没有意识到,YouTube 等视频网站、Google 等搜索引擎的推荐算法也得力于机器学习。

如你所料,也许当前最庞大和复杂的机器学习系统就是 Google 搜索了。每一次你「Google」某个关键字的过程,就是在使用一个于软件内核大量运用机器学习的系统(从理解你检索的文本,到根据用户的个人喜好调整搜索结果)。譬如当你搜索「Java」时,机器学习将通过判断你的身份(比如是开发者还是还是咖啡大拿,亦或是二者兼有之)来选择哪些结果优先显示在你面前。

如今,机器学习的直接应用已经非常广泛了,包括图像识别、欺诈检测、推荐引擎、文本和语音系统等等。这种强大的能力被广泛应用于糖尿病视网膜病变、皮肤癌检测到零售以及自动泊车与自动驾驶运输系统等等领域当中。

▌备受期待的特性

不久以前,人们普遍认为一个公司或是一款产品在其产出中使用机器学习简直是痴人说梦。现在,每个公司都在探索将机器学习应用到自身产品的方法。这已然成为对产品的一种预期。正如当初我们希望每个企业都有一款好用的 App 或者一个漂亮实用的网站那样,不久的将来,人们将会希望这些技术或服务都更加个性化,都能深入洞悉用户需求并且还具备一定的自我纠错能力。

我们希望机器学习能够让现今的任务办得更好、更快、更轻松,同时也希望在未来,机器学习可以帮助我们实现一些曾经通过人力无法完成的工作。

我们应当庆幸,要充分发挥机器学习的优势并不困难。利刃早已磨好,你要的就是数据、开发者和强大的意志力来挥舞宝刀!

▌用数据来解决问题

此处我们可以将机器学习的定义简化为7个字:

『施以数据解难题』

这一表述也许过度简化了,但足以充分表达我们的目标。尤其是当我们将这句话拆分成两个部分:「施以数据」和「解难题」,我们会发现两者充分勾勒出机器学习的两个重要层面(训练和预测)。

「施以数据」也就是常说的「训练」,而「解难题」则被当作是「预测」或是推理的过程。

将这两者联系起来的部分叫做模型。我们使用数据集来训练模型以实现更好、更有用的预测。训练完成后,这一模型就可以通过部署来预测未曾出现过的数据。

▌数据是金钥

如你所见,在整个流程中最关键的部分就是数据。将数据比作机器学习的核心,有如将机器学习比作开启数据洞察殿堂的金钥。

▌接下来呢?

这篇文章仅仅只是在鸟瞰机器学习,解答为什么它如此有用,当然,我们也列举了它的一些应用。机器学习是一个非常广阔的领域,涵盖了一整个与「从数据推断答案」相关的技术栈群。之后,我们将致力于为大家提供如何根据给定的数据集和问题挑选合适的方法来解答,同时还会提供相关的实现工具。

这是 Cloud AI Adventures 系列的首个分享。下一次,我们会更详细深入探究机器学习的过程,通过一个公式一步一步剖析怎样解决机器学习问题。

向 Sara Robinson 致谢!


「注」Arthur C. Clarke 是英国著名科幻小说家、科学作家、未来主义者,同时还是著名的水下探险家、发明家和知名电视节目主持人。他和罗伯特•海因莱因及艾萨克•阿西莫夫并称科幻小说界三巨头,曾与库布里克合写了《2001太空漫游》的剧本。


▏原文出处:What is Machine Learning

▏封面来源:What's the Difference Between Artificial Intelligence, Machine Learning, and Deep Learning?

▏视频出处:YouTube - What is Machine Learning?

▏字幕翻译:谷创字幕组

▏文章编辑: @杨栋

文章被以下专栏收录