五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言

首頁 > 機器人資訊 > 實際工作總與理論相矛盾?詳解機器學習教科書七大經典問題

實際工作總與理論相矛盾?詳解機器學習教科書七大經典問題

日期:2025-01-18   人氣:  來源:互聯網
簡介:實際工作總與理論相矛盾?詳解機器學習教科書七大經典問題 實際工作中,應該怎么做和教科書講的結論相矛盾,這時候要怎么辦呢?難道教科書中的結論出錯了? 如果希望了解機器學習,或者已經決定投身機器學習,你會第一時間找到各種教材進行充電,同時在心……

實際工作總與理論相矛盾?詳解機器學習教科書七大經典問題

實際工作中,庫卡機器人驅動器維修,應該怎么做和教科書講的結論相矛盾,這時候要怎么辦呢?難道教科書中的結論出錯了?

如果希望了解機器學習,或者已經決定投身機器學習,你會第一時間找到各種教材進行充電,同時在心中默認:書里講的是牛人大神的畢生智慧,是正確無誤的行動指南,認真學習就能獲得快速提升。但實際情況是,你很可能已經在走彎路。

科技發展很快,數據在指數級增長,環境也在指數級改變,因此很多時候教科書會跟不上時代的發展。有時,即便是寫教科書的人,也不見得都明白結論背后的所以然,因此有些結論就會落后于時代。針對這個問題,第四范式創始人、首席執行官戴文淵近日就在公司內部分享上,向大家介紹了機器學習教材中的七個經典問題。戴文淵是ACM世界冠軍(2005年),遷移學習全球領軍人物,在遷移學習領域單篇論文引用數至今仍排名世界第三。曾任百度鳳巢策略的技術負責人、華為諾亞方舟實驗室主任科學家。

本文根據演講實錄整理,略有刪減。

有時我們會發現,在實際工作中,應該怎么做和教科書講的結論相矛盾,這時候要怎么辦呢?難道教科書中的結論出錯了?事實上,有時確實如此。所以今天我就想和大家分享一下機器學習教材中的一些經典問題,希望對大家今后的工作和學習有所幫助。

問題一:神經網絡不宜超過3層

這是最有名錯誤判斷,現在的教科書幾乎已經不再有這樣的結論,但如果看15年、20年前的機器學習教科書,會有一個很有趣的結論:神經網絡不能超過三層。這和我們現在說的深度學習是矛盾的,深度學習現在大家比拼的不是神經網絡能不能超過三層,而是能不能做出一百層、一千層或者更多。

那為什么之前的教科書上會寫神經網絡不能超過三層,這就要從神經網絡的歷史說起。五十年代有位科學家叫MarvinMinksy,他是一位生物學家,數學又很好,所以他在研究神經元的時候就在想能不能用數學模型去刻畫生物的神經元,因此就設計了感知機。感知機就像一個神經細胞,它能像神經細胞一樣連起來,形成神經網絡,就像大腦的神經網絡。其實在60年代開始的時候,是有很深的神經網絡,但當時經過大量實驗發現,不超過三層的神經網絡效果不錯,于是大概到80年代時就得出結論:神經網絡不宜超過三層。

那為什么現在這條結論又被推翻了呢?實際上這條結論是有前提條件的,即在數據量不大的情況下,神經網絡不宜超過三層。而從2005年開始,大家發現隨著數據增加,深度神經網絡的表現良好,所以慢慢走向深度學習。其實這里真正正確的原理是Valiant引理,它可以理解為模型復雜度(例如專家系統的規則數量)要和數據量成正比。數據量越大,模型就越復雜。上個世紀因為數據量小,所以神經網絡的層數不能太深,現在數據量大,所以神經網絡的層數就要做深。這也解釋了為什么當時教科書會有這樣的結論,而現在隨著深度學習的流行,大家已經不再會認為這句話是對的。

問題二:決策樹不能超過五層

如果有同學看教科書上介紹決策樹,會有一個說法就是決策樹要減枝,決策樹如果不減枝效果不好。還有教科書會告訴決策樹不能超過五層,超過五層的決策樹效果不好。這個結論和神經網絡結論一樣,神經網絡不能超過三層也是因為當時數據量不大,決策樹不能超過五層也是因為上個世紀數據量不夠大,二叉樹決策樹如果深度是N的話,復雜度大概是2的N次方,所以不超過五層復雜度也就是三十多。如果數據量達到一百萬的時候,決策樹能達到十幾二十層的規模,如果數據量到了一百億的時候決策樹可能要到三十幾層。

現在,我們強調更深的決策樹,這可能和教科書講的相矛盾。矛盾的原因是現在整個場景下數據量變大,所以要做更深的決策樹。當然,我們也不一定在所有的場景里都有很大數據量,如果遇到了數據量小的場景,我們也要知道決策樹是要做淺的。最根本來說,就是看有多少數據,能寫出多復雜的模型。

問題三:特征選擇不能超過一千個

有些教科書會單獨開個章節來講特征選擇,告訴我們在拿到數據后,要先刪除一些不重要的特征,甚至有的教科書注明,特征數不能超過一千,否則模型效果不好。但其實這個結論也是有前提條件的,如果數據量少,是不能夠充分支撐很多特征,但如果數據量大,結論就會不一樣。這也就是為什么我們做LogisticRegression會有幾十億個特征,而不是限制在幾百個特征。

過去傳統數據分析軟件,如SAS,之所以只有幾百個特征,是因為它誕生于上世紀七十年代,它面臨的問題是在具體場景下沒有太多可用數據,可能只有幾百上千個樣本。因此,在設計系統時,就只需要針對幾百個特征設計,不需要幾十億個特征,因為上千個樣本無法支撐幾十億特征。但現在,隨著數據量增加,特征量也需要增加。所以我認為,在大數據環境下,整個機器學習教科書里關于特征選擇的章節已經落后于時代,需要根據新的形式重新撰寫;當然在小數據場景下,它仍然具有價值。

問題四:集成學習獲得最好學習效果

第四個叫做集成學習,這個技術在各種數據挖掘比賽中特別有用,比如近些年KDDCUP的冠軍幾乎都是采用集成學習。什么是集成學習?它不是做一個模型,而是做很多(例如一千個)不一樣的模型,讓每個模型投票,投票的結果就是最終的結果。如果不考慮資源限制情況,這種模式是效果最好的。這也是為什么KDDCUP選手們都選擇集成學習的方式,為了追求最后效果,不在乎投入多少,在這種條件下,集成學習就是最好的方式。

但在現實中,企業做機器學習追求的不是用無限的資源做盡可能好的效果,而是如何充分利用有限資源,獲得最好效果。假設企業只有兩臺機器,如何用這兩臺機器獲得最好的效果呢?如果采用集成學習,用兩臺機器跑五個模型,就要把兩臺機器分成五份,每個模型只能用0.4臺機器去跑,因此跑的數據量就有限。那如果換種方式,不用集成學習,就用一個模型去跑,就能跑5倍的數據。通常5倍的數據量能比集成學習有更好的效果。在工業界比較少會應用集成學習,主要是因為工業界絕大多數的場景都是資源受限,資源受限時最好的方式是想辦法放進去更多的數據。集成學習因為跑更多的模型導致只能放更少的數據,工業機器人維修,通常這種效果都會變差。

問題五:正樣本和負樣本均衡采樣到1:1

第五個叫做均衡采樣,絕大多數的教科書都會講到。它是指如果我們訓練一個模型,正樣本和負樣本很不平均,比如在正樣本和負樣本1:100的情況下,就需要對正、負樣本做均衡采樣,把它變成1:1的比例,這樣才是最好的。但其實這個結論不一定對,因為統計學習里最根本的一條原理就是訓練場景和測試場景的分布要一樣,所以這個結論只在一個場景下成立,那就是使用模型的場景中正、負樣本是1:1,那這個結論就是對的。

免責聲明:本網部分文章和信息來源于互聯網,本網轉載出于傳遞更多信息和學習之目的。如轉載稿涉及版權等問題,請立即聯系網站所有人,我們會予以更改或刪除相關文章,保證您的權利。
五月婷婷欧美视频_少女频道在线观看高清_欧美日韩视频一区二区三区_7777精品伊久久久大香线蕉语言
日本一区二区成人| 亚洲欧美日韩成人高清在线一区| 国产性色一区二区| 国产老女人精品毛片久久| 日韩一区二区在线观看视频 | 亚洲妇熟xx妇色黄| 欧美丰满一区二区免费视频| 蜜桃传媒麻豆第一区在线观看| 91精品国产欧美日韩| 国产又黄又大久久| 亚洲免费观看高清在线观看| 欧美精品乱码久久久久久 | 美国欧美日韩国产在线播放| 精品国产免费一区二区三区四区| 国产麻豆视频一区| 一区二区三区久久久| 欧美一级午夜免费电影| k8久久久一区二区三区| 亚洲1区2区3区4区| 国产人成亚洲第一网站在线播放| 91福利国产精品| 精品在线观看视频| 亚洲线精品一区二区三区八戒| 日韩一级在线观看| 91色在线porny| 国产一区二区三区国产| 亚洲h在线观看| 日韩一区在线免费观看| 日韩美女主播在线视频一区二区三区| 成人av在线一区二区| 日本不卡视频在线观看| 亚洲精品成人少妇| 国产精品毛片a∨一区二区三区| 欧美一二区视频| 欧美人伦禁忌dvd放荡欲情| 91亚洲精品久久久蜜桃网站 | 亚洲欧美一区二区三区孕妇| 欧美mv日韩mv国产| 在线电影一区二区三区| 日本高清无吗v一区| 成人黄色电影在线| 国产成人在线免费观看| 经典三级视频一区| 男人的j进女人的j一区| 日韩精品一二三| 亚洲aⅴ怡春院| 亚洲电影你懂得| 一区二区三区免费看视频| 亚洲黄色尤物视频| 亚洲国产成人va在线观看天堂| 亚洲色图欧洲色图| 亚洲日本电影在线| 亚洲人亚洲人成电影网站色| 国产精品福利影院| 成人欧美一区二区三区1314| 中文字幕在线一区| 亚洲视频香蕉人妖| 亚洲一区二区三区在线| 亚瑟在线精品视频| 天天综合色天天| 奇米精品一区二区三区在线观看一 | 欧美人妇做爰xxxⅹ性高电影| 色综合咪咪久久| 91国模大尺度私拍在线视频| 日本韩国欧美在线| 欧美精品国产精品| 精品日产卡一卡二卡麻豆| 欧美mv日韩mv亚洲| 欧美国产精品久久| 最新热久久免费视频| 一卡二卡三卡日韩欧美| 亚洲一区免费在线观看| 日韩不卡一区二区三区| 麻豆免费看一区二区三区| 精品亚洲国内自在自线福利| 国产一区二区导航在线播放| 不卡视频免费播放| 欧美体内she精高潮| 日韩欧美久久久| 国产精品伦理一区二区| 夜夜揉揉日日人人青青一国产精品| 亚洲一区影音先锋| 久久99国产精品久久99| 99久久久久免费精品国产 | 国产精品99久久久久久似苏梦涵 | 国模少妇一区二区三区| 成人高清免费在线播放| 在线亚洲欧美专区二区| 日韩精品中午字幕| 国产精品久久久久久久久果冻传媒| 亚洲黄色免费电影| 国产麻豆日韩欧美久久| 91成人免费网站| 2014亚洲片线观看视频免费| 亚洲精品乱码久久久久久黑人| 青娱乐精品在线视频| 成人午夜看片网址| 欧美精品一二三| 一区二区中文视频| 韩国v欧美v日本v亚洲v| 一本久久a久久精品亚洲| 精品久久99ma| 午夜伦欧美伦电影理论片| 成人高清伦理免费影院在线观看| 日韩欧美久久一区| 亚洲国产视频直播| 波多野结衣91| 久久久久久久一区| 免费在线观看日韩欧美| 欧美午夜寂寞影院| 综合久久一区二区三区| 国产成人综合在线观看| 欧美草草影院在线视频| 亚洲h在线观看| 欧美午夜不卡在线观看免费| 最新国产の精品合集bt伙计| 精品一区二区三区欧美| 欧美一区二区精美| 视频精品一区二区| 欧美三日本三级三级在线播放| 亚洲欧洲国产日本综合| 国产成人免费视频精品含羞草妖精| 日韩一级片网址| 日本成人在线不卡视频| 欧美日韩高清在线播放| 亚洲国产一区二区三区| 欧美无人高清视频在线观看| 一区二区三区美女视频| 欧美在线三级电影| 亚洲一区二区av在线| 欧美午夜电影网| 午夜一区二区三区视频| 欧美日韩另类一区| 天天综合网 天天综合色| 91精品国产手机| 麻豆一区二区99久久久久| 26uuu国产一区二区三区| 国产一区在线不卡| 欧美国产综合一区二区| 国产成人在线影院| 亚洲精品国产高清久久伦理二区| 在线亚洲人成电影网站色www| 亚洲va欧美va国产va天堂影院| 制服视频三区第一页精品| 奇米四色…亚洲| 国产日韩高清在线| 一本大道av一区二区在线播放| 亚洲综合激情另类小说区| 欧美日韩在线免费视频| 免费在线观看成人| 国产精品麻豆久久久| 欧美日韩你懂得| 国产精品亚洲第一区在线暖暖韩国| **欧美大码日韩| 日韩一二三四区| 丰满放荡岳乱妇91ww| 亚洲制服丝袜av| 精品国产一区二区三区av性色 | 国产福利精品导航| 亚洲欧美中日韩| 欧美剧情片在线观看| 国产一区二区视频在线| 亚洲免费在线视频| 日韩欧美在线不卡| 97久久超碰国产精品| 奇米影视在线99精品| 亚洲天天做日日做天天谢日日欢| 欧美日韩国产高清一区二区三区 | 国产精品主播直播| 亚洲国产色一区| 久久精品视频一区二区| 欧美日韩亚洲国产综合| 国产成人精品免费网站| 婷婷开心激情综合| 国产精品灌醉下药二区| 日韩欧美亚洲另类制服综合在线| 成人avav影音| 激情文学综合丁香| 亚洲444eee在线观看| 亚洲同性同志一二三专区| 久久九九99视频| 制服丝袜中文字幕一区| 欧美综合一区二区三区| 国产99久久久久久免费看农村| 丝袜亚洲另类欧美| 亚洲精品国产一区二区精华液 | 国产精品天干天干在观线| 欧美美女bb生活片| 91网页版在线| 北条麻妃国产九九精品视频| 国产一区二区三区在线观看免费视频| 亚洲在线视频一区| 亚洲色图制服诱惑| 国产精品拍天天在线| 久久先锋影音av| 欧美成人在线直播| 91精品免费观看| 欧美精品少妇一区二区三区| 欧美日韩一区二区三区在线 | 色综合天天性综合|