亚洲中字慕日产2020,大陆极品少妇内射AAAAAA,无码av大香线蕉伊人久久,久久精品国产亚洲av麻豆网站

資訊專欄INFORMATION COLUMN

原創(chuàng)翻譯 | 深度學(xué)習(xí)與機器學(xué)習(xí) - 您需要知道的基本差異!

jsummer / 1899人閱讀

摘要:深度學(xué)習(xí)自動找到對分類重要的特征,而在機器學(xué)習(xí),我們必須手工地給出這些特征。數(shù)據(jù)依賴深度學(xué)習(xí)和傳統(tǒng)機器學(xué)習(xí)最重要的區(qū)別在于數(shù)據(jù)量增長下的表現(xiàn)差異。這是深度學(xué)習(xí)一個特別的部分,也是傳統(tǒng)機器學(xué)習(xí)主要的步驟。

前言

機器學(xué)習(xí)和深度學(xué)習(xí)現(xiàn)在很火!突然間每個人都在討論它們-不管大家明不明白它們的不同!

不管你是否積極緊貼數(shù)據(jù)分析,你都應(yīng)該聽說過它們。

正好展示給你要關(guān)注它們的點,這里是它們關(guān)鍵詞的google指數(shù):

如果你一直想知道機器學(xué)習(xí)和深度學(xué)習(xí)的不同,那么繼續(xù)讀下去,下文會告訴你一個關(guān)于兩者的通俗的詳細對比。

我會詳細介紹它們,然后會對它們進行比較并解釋它們的用途。


目錄表

1 機器學(xué)習(xí)和深度學(xué)習(xí)是什么?

1.1 什么是機器學(xué)習(xí)?

1.2 什么是深度學(xué)習(xí)?

2 機器學(xué)習(xí)和深度學(xué)習(xí)的比較

2.1 數(shù)據(jù)依賴

2.2 硬件依賴

2.3 問題解決辦法

2.4 特征工程

2.5 執(zhí)行時間

2.6 可解釋性

3 機器學(xué)習(xí)和深度學(xué)習(xí)目前的應(yīng)用場景?

4 測試

5 未來發(fā)展趨勢


1.什么是機器學(xué)習(xí)和深度學(xué)習(xí)?

讓我們從基礎(chǔ)開始——什么是機器學(xué)習(xí),什么是深度學(xué)習(xí)。如果你已經(jīng)知道答案了,那么你可以直接跳到第二章。


1.1 什么是機器學(xué)習(xí)?

“機器學(xué)習(xí)”更受廣泛引用的定義是來自于Tom Mitchell對它的解釋概括:

? ? “如果一個計算機程序在任務(wù)T中,利用評估方法P并通過相應(yīng)的經(jīng)驗E而使性能得到提高,則說這個程序從經(jīng)驗E中得到了學(xué)習(xí)”

這句話是不是聽起來特別難以理解?讓我們用一些簡單的例子來說明它。


例子1-機器學(xué)習(xí)-基于身高預(yù)測體重

假如你現(xiàn)在需要創(chuàng)建一個系統(tǒng),它能夠基于身高來告訴人們預(yù)期的體重。有幾個原因可能可以解釋為什么這樣的事會引起人們興趣的原因。你可以使用這個系統(tǒng)來過濾任何可能的欺詐數(shù)據(jù)或捕獲誤差。而你需要做的第一件事情是收集數(shù)據(jù),假如你的數(shù)據(jù)像這個樣子:

圖中的每個點都代表一個數(shù)據(jù)點。首先,我們可以畫一條簡單的直線來根據(jù)身高預(yù)測體重。例如是這么一條直線:

Weight (in kg) = Height (in cm) - 100

它可以幫助我們做出預(yù)測。如果這條直線看起來畫得不錯,我們就需要理解它的表現(xiàn)。在這個例子中,我們需要減少預(yù)測值與真實值之間的差距,這是我們評估性能的辦法。

進一步說,如果我們收集到更多的數(shù)據(jù)(經(jīng)驗上是這樣),我們的模型表現(xiàn)將會變得更好。我們也可以通過添加更多的變量來提高模型(例如`性別`),那樣也會有一條不一樣的預(yù)測線。


例子2-風(fēng)暴預(yù)測系統(tǒng)

讓我們舉個復(fù)雜一點點的例子。假設(shè)你在開發(fā)一個風(fēng)暴預(yù)測系統(tǒng),你手里有過往所有發(fā)生過的風(fēng)暴數(shù)據(jù),以及這些風(fēng)暴發(fā)生前三個月的天氣狀況數(shù)據(jù)。

想一下,如果我們要去做一個風(fēng)暴預(yù)測系統(tǒng),該怎么做呢?

首先,我們需要探索所有數(shù)據(jù)并找到數(shù)據(jù)的模式(規(guī)則)。我們的任務(wù)是尋找什么情況下會引起風(fēng)暴發(fā)生。

我們可以模擬一些條件,例如溫度大于40攝氏度,溫度介于80到100之間等等,然后把這些“特征”手動輸入到我們的系統(tǒng)里。

或者,我們也可以讓系統(tǒng)從數(shù)據(jù)中理解這些特征的合適值。


現(xiàn)在,找到了這些值,你就可以從之前的所有數(shù)據(jù)中預(yù)測一個風(fēng)暴是否會生成?;谶@些由我們的系統(tǒng)設(shè)定的特征值,我們可以評估一下系統(tǒng)的性能表現(xiàn),也就是系統(tǒng)預(yù)測風(fēng)暴發(fā)生的正確次數(shù)。我們可以迭代上面的步驟多次,給系統(tǒng)提供反饋信息。


讓我們用正式的語言來定義我們的風(fēng)暴系統(tǒng):我們的任務(wù)`T`是尋找什么樣的大氣條件會引起一個風(fēng)暴。性能`P`描述的是系統(tǒng)所提供的全部情況中,正確預(yù)測到風(fēng)暴發(fā)生的次數(shù)。而經(jīng)驗`E`就是我們系統(tǒng)的不斷重復(fù)運行所產(chǎn)生的。

1.2 什么是深度學(xué)習(xí)?

深度學(xué)習(xí)并不是新的概念,它已經(jīng)出現(xiàn)好一些年了。但在今時今日的大肆宣傳下,深度學(xué)習(xí)變得越來越受關(guān)注。正如在機器學(xué)習(xí)所做的事情一樣,我們也將正式的定義“深度學(xué)習(xí)”并用簡單的例子來說明它。


“深度學(xué)習(xí)是一種特別的機器學(xué)習(xí),它把世界當做嵌套的層次概念來學(xué)習(xí)從而獲得強大的能力和靈活性,每一個概念都由相關(guān)更簡單的概念來定義,而更抽象的表征則通過較形象的表征計算得到?!?


現(xiàn)在-這看起來很令人困惑,讓我們用簡單的例子來說明。


例子1-形狀檢測

讓我們從一個簡單的例子開始,這個例子解釋了概念層次上發(fā)生了什么。我們來嘗試理解怎樣從其他形狀中識別出正方形。

我們的眼睛首先會做的是檢查這個圖形是否由4條邊組成(簡單的概念)。如果我們找到4條邊,我們接著會檢查這4條邊是否相連、閉合、垂直并且它們是否等長的(嵌套層次的概念)

如此,我們接受一個復(fù)雜的任務(wù)(識別一個正方形)并把它轉(zhuǎn)化為簡單的較抽象任務(wù)。深度學(xué)習(xí)本質(zhì)上就是大規(guī)模的執(zhí)行這種任務(wù)。


例子2-貓狗大戰(zhàn)

讓我們舉一個動物識別的例子,這個例子中我們的系統(tǒng)需要識別給定的圖片是一只貓還是一只狗。

如果我們把這個當做典型的機器學(xué)習(xí)問題來解決,我們會定義一些特征,例如:這個動物有沒有胡須,是否有耳朵,如果有,那是不是尖耳朵。簡單來說,我們會定義面部特征并讓系統(tǒng)識別哪些特征對于識別一個具體的動物來說是重要的。


深度學(xué)習(xí)走得更深一步。深度學(xué)習(xí)自動找到對分類重要的特征,而在機器學(xué)習(xí),我們必須手工地給出這些特征。深度學(xué)習(xí)的工作模式:

首先識別一只貓或一只狗相應(yīng)的邊緣 然后在這個基礎(chǔ)上逐層構(gòu)建,找到邊緣和形狀的組合。例如是否有胡須,或者是否有耳朵等 在對復(fù)雜的概念持續(xù)層級地識別后,最終會決定哪些特征對找到答案是有用的 2.機器學(xué)習(xí)和深度學(xué)習(xí)的比較


現(xiàn)在你已經(jīng)了解機器學(xué)習(xí)和深度學(xué)習(xí)的概念了,我們接著將會花點時間來比較這兩種技術(shù)。


2.1 數(shù)據(jù)依賴

深度學(xué)習(xí)和傳統(tǒng)機器學(xué)習(xí)最重要的區(qū)別在于數(shù)據(jù)量增長下的表現(xiàn)差異。當數(shù)據(jù)量很少的時候,深度學(xué)習(xí)算法不會有好的表現(xiàn),這是因為深度學(xué)習(xí)算法需要大量數(shù)據(jù)來完美地實現(xiàn)。相反,傳統(tǒng)機器學(xué)習(xí)在這個情況下是占優(yōu)勢的。下圖概括了這個事實。


2.2 硬件依賴

深度學(xué)習(xí)算法高度依賴高端機器,相較之下傳統(tǒng)的機器學(xué)習(xí)算法可以在低端機器中運行。這是因為深度學(xué)習(xí)算法對GPU的依賴是它在工作中的重要部分。深度學(xué)習(xí)算法內(nèi)在需要做大量的矩陣乘法運算,這些運算可以通過GPU實現(xiàn)高效優(yōu)化,因為GPU就是因此而生的。

2.3 特征工程

特征工程是將領(lǐng)域知識引入到創(chuàng)建特征提取器的過程,這樣做的目的在于減少數(shù)據(jù)的復(fù)雜性并且使模式更清晰,更容易被學(xué)習(xí)算法所使用。無論從對時間還是對專業(yè)知識的要求,這個過程都是艱難的而且是高成本的。

在機器學(xué)習(xí)中,絕大多數(shù)應(yīng)用特征需要專業(yè)知識來處理,然后根據(jù)領(lǐng)域和數(shù)據(jù)類型進行硬編碼。

舉個例子,特征數(shù)據(jù)可以是像素值、文本數(shù)據(jù)、位置數(shù)據(jù)、方位數(shù)據(jù)。絕大多數(shù)的機器學(xué)習(xí)算法的性能表現(xiàn)依賴于特征識別和抽取的準確度。


深度學(xué)習(xí)算法嘗試從數(shù)據(jù)中學(xué)習(xí)高級特征。這是深度學(xué)習(xí)一個特別的部分,也是傳統(tǒng)機器學(xué)習(xí)主要的步驟。因此,深度學(xué)習(xí)在所有問題上都免除了特征提取器的開發(fā)步驟。就像卷積神經(jīng)網(wǎng)絡(luò)會嘗試學(xué)習(xí)低級特征,例如在低層中學(xué)習(xí)邊緣和線條,然后是部分的人臉,再接著是人臉的高層表征。

2.4 問題解決辦法

當使用傳統(tǒng)機器學(xué)習(xí)算法求解一個問題時,它通常會建議把問題細分成不同的部分,然后獨立地解決他們?nèi)缓蠛喜⒌揭黄饛亩@得最終結(jié)果。然而深度學(xué)習(xí)卻主張端對端地解決問題。


讓我們用一個例子來理解。

假設(shè)你現(xiàn)在有一個多目標檢測任務(wù)。這個任務(wù)要求識別目標是什么和它出現(xiàn)在圖像中的位置。

在一個傳統(tǒng)機器學(xué)習(xí)方法中,你會把問題分成兩個步驟:目標檢測和目標識別。首先你會用一個像grabcut一樣的邊框檢測算法來掃描圖像并找到所有可能的目標。然后,對所有被識別的對象,你會使用對象識別算法,如帶HOG特征的SVM,來識別相關(guān)對象。


相反地,在深度學(xué)習(xí)方法中,你會端對端地執(zhí)行這個過程。例如,在一個YOLO網(wǎng)絡(luò)中(一款深度學(xué)習(xí)算法),你傳入一個圖像,接著它會給出對象的位置和名稱。

2.5 執(zhí)行時間

通常神經(jīng)網(wǎng)絡(luò)算法都會訓(xùn)練很久,因為神經(jīng)網(wǎng)絡(luò)算法中有很多參數(shù),所以訓(xùn)練它們通常比其他算法要耗時。目前較好的深度學(xué)習(xí)算法ResNet需要兩周時間才能完成從隨機參數(shù)開始的訓(xùn)練。而機器學(xué)習(xí)相對而言則只需要很短的時間來訓(xùn)練,大概在幾秒到幾小時不等。


但在測試的時候就完全相反了。在測試的時候,深度學(xué)習(xí)算法只需要運行很短的時間。然而,如果你把它拿來與K-近鄰(一種機器學(xué)習(xí)算法)來比較,測試時間會隨著數(shù)據(jù)量的增長而增加。但是這也不意味著所有機器學(xué)習(xí)算法都如此,其中有一些算法測試時間也是很短的。

2.6 可解釋性

最后,我們也把可解釋性作為一個因素來對比一下機器學(xué)習(xí)和深度學(xué)習(xí)。這也是深度學(xué)習(xí)在它被應(yīng)用于工業(yè)之前被研究了很久的主要因素。


舉個例子,假設(shè)我們使用深度學(xué)習(xí)來給文章自動打分。它打分的表現(xiàn)十分的好并且非常接近人類水平,但是有個問題,它不能告訴我們?yōu)槭裁此o出這樣的分數(shù)。實際在數(shù)學(xué)上,你可以找到一個深度神經(jīng)網(wǎng)絡(luò)哪些結(jié)點被激活了,但我們不知道這些神經(jīng)元被模型怎么利用,而且也不知道這些層在一起做了點什么事情。所以我們不能結(jié)果進行合理的解釋。


在另一方面,機器學(xué)習(xí)算法例如決策樹,通過清晰的規(guī)則告訴我們?yōu)槭裁此x擇了什么,所以它是特別容易解釋結(jié)果背后的原因。因此,像決策樹和線性/邏輯回歸一樣的算法由于可解釋性而廣泛應(yīng)用于工業(yè)界。

3.機器學(xué)習(xí)和深度學(xué)習(xí)目前的應(yīng)用場景?

維基百科文章給出了機器學(xué)習(xí)所有應(yīng)用場景的概述,它們包括:


計算機視覺:例如車牌號碼識別和人臉識別 信息檢索:例如文字和圖像的搜索引擎 市場營銷:自動郵件營銷,目標監(jiān)察 醫(yī)療診斷:癌癥識別,異常檢測 自然語言處理:情感分析,圖片標注 在線廣告等。

上圖簡要總結(jié)了機器學(xué)習(xí)的應(yīng)用領(lǐng)域,盡管它描述的還包括了整個機器智能領(lǐng)域。

一個應(yīng)用機器學(xué)習(xí)和深度學(xué)習(xí)較好的例子就是谷歌了。

上圖中,你可以看到谷歌把機器學(xué)習(xí)應(yīng)用在它各種各樣的產(chǎn)品中。機器學(xué)習(xí)和深度學(xué)習(xí)的應(yīng)用是沒有邊際的,你需要的是尋找對的時機!

4.測試

為了評估你是否真正了解這些差異,我們接著會來做一個測試。你可以在這兒發(fā)布你的答案。

請注意回答問題的步驟。

你會怎樣用機器學(xué)習(xí)解決下面的問題? 你會怎樣用深度學(xué)習(xí)解決下面的問題? 結(jié)論:哪個是更好的方法?


情節(jié)1:

你要開發(fā)一個汽車自動駕駛的軟件系統(tǒng),這個系統(tǒng)會從攝像機獲取原始像素數(shù)據(jù)并預(yù)測車輪需要調(diào)整的角度。


情節(jié)2:

給定一個人的認證信息和背景信息,你的系統(tǒng)需要評估這個人是否能夠通過一筆貸款申請。


情節(jié)3:

為了一個俄羅斯代表能解決當?shù)厝罕姷膯栴},你需要建立一個能把俄文翻譯成印地語的系統(tǒng)。

5.未來發(fā)展趨勢

上述文章可以給了你關(guān)于機器學(xué)習(xí)和深度學(xué)習(xí)以及它們之間差異的概述。本章中,我想要分享一下我對機器學(xué)習(xí)和深度學(xué)習(xí)未來發(fā)展趨勢的看法。

首先,由于工業(yè)界對數(shù)據(jù)科學(xué)和機器學(xué)習(xí)使用需求量的增長,在業(yè)務(wù)上應(yīng)用機器學(xué)習(xí)對公司運營會變得更加重要。而且,每個人都會想要知道基礎(chǔ)術(shù)語。 深度學(xué)習(xí)每天都給我們每個人制造驚喜,并且在不久的將來也會持續(xù)著這個趨勢。這是因為深度學(xué)習(xí)已經(jīng)被證明是能實現(xiàn)較先進表現(xiàn)的較佳技術(shù)之一。 機器學(xué)習(xí)和深度學(xué)習(xí)的研究會持續(xù)進行。但與前些年局限于學(xué)術(shù)上的研究有所區(qū)別,深度學(xué)習(xí)和機器學(xué)習(xí)領(lǐng)域上的研究會在工業(yè)界和學(xué)術(shù)界同時爆發(fā)。而且隨著可用資金的增加,它會更可能成為整個人類發(fā)展的主題。


我個人緊隨著這些趨勢。我通常在關(guān)于機器學(xué)習(xí)和深度學(xué)習(xí)的新聞中獲得重要信息,那些信息會使我在最近發(fā)生事情中不斷進步。而且,我也一直關(guān)注著arxiv上每天更新的論文以及相應(yīng)的代碼。


結(jié)束語

在這篇文章中,我們從一個相對高的角度進行了總結(jié),并且比較了深度學(xué)習(xí)跟機器學(xué)習(xí)的算法之間的異同點。我希望這能讓您未來在這兩個領(lǐng)域中的學(xué)習(xí)中變得更有自信。這是關(guān)于機器學(xué)習(xí)以及深度學(xué)習(xí)的一個學(xué)習(xí)路線。

如果您有任何的疑問,完全可以放心大膽地在評論區(qū)提問。


英文原文鏈接:https://www.analyticsvidhya.com/blog/2017/04/comparison-between-deep-learning-machine-learning/

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://www.ezyhdfw.cn/yun/4588.html

相關(guān)文章

  • 原創(chuàng)翻譯 | 10個音頻處理任務(wù)讓你開始使用深度學(xué)習(xí)應(yīng)用

    摘要:這是機器學(xué)習(xí)課程中的一個典型例子,他把演講者的聲音和背景音樂分開。雖然用于啟動檢測的技術(shù)主要依賴于音頻特征工程和機器學(xué)習(xí),但在這里可以很容易地使用深度學(xué)習(xí)來優(yōu)化結(jié)果。 介紹 想象一個能理解你想要什么,且當你打電話給客戶服務(wù)中心時能理解你的感受的機器--如果你對某件事感到不高興,你可以很快地和一個人交談。如果您正在尋找特定的信息,您可能不需要與某人交談(除非您愿意!)。 ...

    notebin 評論0 收藏0
  • 深度學(xué)習(xí)神經(jīng)科學(xué)相遇(一)[譯]

    摘要:如今在機器學(xué)習(xí)中突出的人工神經(jīng)網(wǎng)絡(luò)最初是受神經(jīng)科學(xué)的啟發(fā)。雖然此后神經(jīng)科學(xué)在機器學(xué)習(xí)繼續(xù)發(fā)揮作用,但許多主要的發(fā)展都是以有效優(yōu)化的數(shù)學(xué)為基礎(chǔ),而不是神經(jīng)科學(xué)的發(fā)現(xiàn)。 開始之前看一張有趣的圖 - 大腦遺傳地圖:Figure 0. The Genetic Geography of the Brain - Allen Brain Atlas成年人大腦結(jié)構(gòu)上的基因使用模式是高度定型和可再現(xiàn)的。 Fi...

    YJNldm 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<