機器學習一直是計算史上最大的進步之一,現在被視為能夠在大數據和分析領域發揮重要作用。從企業的角度來看,大數據分析是一個巨大的挑戰。例如,理解大量不同數據格式、分析數據準備和過濾冗餘數據等活動可能是資源密集型的。招聘數據科學家專家是一項昂貴的提議,而不是每家公司都達到目的的手段。專家認為,機器學習可以自動化許多與分析相關的任務——包括常規任務和復雜任務。自動化機器學習可以釋放大量資源,用於更複雜和創新的工作。機器學習似乎一直在朝著這個方向發展。
信息技術背景下的自動化
在 IT 中,自動化是不同系統和軟件的連接,使它們能夠在沒有任何人工干預的情況下執行特定任務。在 IT 領域,自動化系統可以執行簡單和復雜的工作。簡單工作的一個例子可能是將表單與 PDF 集成並將文檔發送給正確的收件人,而提供異地備份可能是複雜工作的一個例子。
為了正確完成您的工作,您需要對自動化系統進行編程或給出明確的指令。每次需要自動化系統修改其工作範圍時,都需要有人更新程序或指令集。儘管自動化系統在其工作中是有效的,但由於各種原因可能會發生錯誤。當發生錯誤時,需要找出根本原因並加以糾正。顯然,要完成其工作,自動化系統完全依賴於人類。工作的性質越複雜,出現錯誤和問題的可能性就越大。
IT 行業自動化的一個常見示例是基於 Web 的用戶界面測試的自動化。測試用例被輸入到自動化腳本中,並相應地測試用戶界面。(有關機器學習實際應用的更多信息,請參閱下一代欺詐檢測中的機器學習和 Hadoop。)
支持自動化的論點是,它執行例行和可重複的任務,讓員工騰出時間去做更複雜和更有創意的任務。然而,也有人認為自動化已經排除了以前由人類執行的大量任務或角色。現在,隨著機器學習進入各個行業,自動化可以增加一個新的維度。
自動化機器學習的未來?
機器學習的本質是系統在無需人工干預的情況下不斷從數據中學習和進化的能力。機器學習能夠像人腦一樣運作。例如,電子商務網站上的推薦引擎可以評估用戶的獨特偏好和品味,並提供關於最合適的產品和服務的推薦以供選擇。鑑於此功能,機器學習被視為自動化與大數據和分析相關的複雜任務的理想選擇。它克服了傳統自動化系統不允許定期人工干預的主要限制。有多個案例研究證明了機器學習執行複雜數據分析任務的能力,本文稍後將對此進行討論。
如前所述,大數據分析對企業來說是一個具有挑戰性的命題,可以部分委託給機器學習系統。從業務角度來看,這可以帶來許多好處,例如釋放數據科學資源用於更具創造性和關鍵任務的任務、更高的工作負載、更少的時間完成任務和成本效益。
案例分析
2015 年,麻省理工學院的研究人員開始研究一種數據科學工具,該工具可以使用一種稱為深度特徵合成算法的技術從大量原始數據中創建預測數據模型。科學家們聲稱該算法可以結合機器學習的最佳特徵。據科學家稱,他們已經在三個不同的數據集上對其進行了測試,並且正在擴大測試範圍以包括更多。在國際數據科學與分析會議上發表的一篇論文中,研究人員 James Max Kanter 和 Kalyan Veeramachaneni 說:“使用自動調整過程,我們優化了整個路徑而無需人工參與,使其能夠泛化到不同的數據集”。
讓我們來看看任務的複雜性:該算法具有所謂的自動調整能力,借助這些能力可以從原始數據(例如年齡或性別)中獲得或提取洞察力或價值,然後預測數據可以創建模型。該算法使用複雜的數學函數和稱為 Gaussian Copula 的概率論。因此很容易理解算法可以處理的複雜程度。這種技術也曾在比賽中獲獎。
機器學習可以取代家庭作業
全世界都在討論機器學習可以取代許多工作,因為它以人腦的效率執行任務。事實上,有人擔心機器學習會取代數據科學家,這種擔心似乎是有根據的。
對於沒有數據分析能力但在日常生活中有不同程度分析需求的普通用戶來說,使用能夠分析海量數據並提供分析數據的計算機是不可行的。然而,自然語言處理 (NLP) 技術可以通過教計算機接受和處理自然人類語言來克服這一限制。這樣,普通用戶不需要復雜的分析功能或技能。
IBM 認為,可以通過其產品 Watson Natural Language Analytics Platform 最大限度地減少或消除對數據科學家的需求。Watson 分析和商業智能副總裁 Marc Atschuller 表示,“有了像 Watson 這樣的認知系統,您只需提出您的問題——或者如果您沒有問題,您只需上傳您的數據,Watson 就可以查看它並推斷出您可能想知道的內容。”
結論
自動化是機器學習的下一個合乎邏輯的步驟,我們已經在日常生活中體驗到影響——電子商務網站、Facebook 好友推薦、LinkedIn 網絡推薦和 Airbnb 搜索排名。考慮到給出的例子,毫無疑問,這可以歸因於自動化機器學習系統產生的輸出質量。儘管機器學習具有所有優點和好處,但機器學習導致大量失業的想法似乎有點反應過度。幾十年來,機器一直在我們生活的許多方面取代人類,但人類已經進化並適應了在行業中的重要性。根據這種觀點,機器學習的所有顛覆性只是人們將要適應的另一波浪潮。
發帖時間:2021-08-03