過去二十年來,亞馬遜不斷研發(fā)新的技術,用于優(yōu)化用戶在亞馬遜(amzon.com)上網(wǎng)購的用戶體驗。
早在2003年的時候,物流方面,亞馬遜的貨物倉庫里用自動機器人系統(tǒng)揀貨,為的是讓用戶更早拿到買的東西。
在產(chǎn)品推薦方面,亞馬遜的購物推薦早就成了大數(shù)據(jù)應用的典型場景,根據(jù)用戶自己的購買經(jīng)歷或者購買過同一個產(chǎn)品的別的用戶的購買經(jīng)歷進行推薦展示。
這樣需要一個龐大的電子表格,AWS開發(fā)出了一個強大的算法來預測出購買某個產(chǎn)品的概率,類似的Netflix也用了這樣的算法,據(jù)說,Netflix上75%的視頻流量都是推進引擎導流過來的。
近幾年來,亞馬遜嘗試用無人機來送貨,目前正處于試驗階段。實際上,所有的送貨無人機都是由一系列的算法來控制的,比如有基于GPS來規(guī)劃路徑的算法,計算機視覺算法,目前僅適用于五斤以下,三十分鐘行程以內(nèi)的包裹。
智能音箱Echo,伊恩坦言智能音箱是個比較低級的智能,喚醒音箱之后,將用戶的語音輸入轉(zhuǎn)化成文本輸送到云端,調(diào)用自然語言理解服務了解人說話的真正意圖。
以上是幾種亞馬遜AWS的幾種人工智能和機器學習的應用實例,作為一家云服務商,如何將人工智能和機器學習的能力做輸出呢?
AWS將用這些資源的人分成了三類,對應有不同的服務。
一層是框架和基礎設施層,需要的是底層的工具和資源,適用于機器學習專家、軟件開發(fā)人員以及數(shù)據(jù)科學家。AWS提供了GPU/FPU(浮點運算器)這類高性能的并行計算硬件環(huán)境,比如有AWS EC2 P3這樣專門用來做機器學習的機型。在軟件環(huán)境方面,有打包了框架和各種驅(qū)動的AMI鏡像,用起來很方便。
二層是平臺服務,它主要是做深度學習工作流的管理,幫助一般的軟件開發(fā)人員,把他們在軟件開發(fā)方面的知識應用到機器學習的當中。它提供數(shù)據(jù)清洗所用的工具,提供模型訓練的工具最后輸出模型,過程中,機器學習需要反復調(diào)參迭代,AWS提供了迭代自動化工具。
AWS發(fā)布的AI和人工智能的方案SageMaker就是做AI機器學習流程管理的,涉及從數(shù)據(jù)處理,算法設置,到模型訓練,乃至迭代調(diào)優(yōu)的全過程,可以對接AWS的云服務,比如可以存放訓練數(shù)據(jù)的s3,SageMaker里面集成了Jupyter Notebook,主要的代碼都可以在這里完成,調(diào)整batch_size,epoch,學習率這些參數(shù)的操作可以交給SageMaker來完成,省時省力高效。
Jupyter Notebook
第三層是一些應用服務,指的是已經(jīng)做了預抽取或者訓練好的機器學習模型或者服務,供開發(fā)人員直接調(diào)用。用戶可以調(diào)用SageMaker SDK的API來開發(fā)應用,使用剛剛訓練成的模型,機器學習模型快速為得以應用。
機器學習常見的幾大場景中有關于圖像的,有關于音頻的,關于自然語言理解的,AWS在這些方面也有自己的服務,Amazon Comprehend是做NLP(自然語言處理的),Amazon Rekognition Video是做視頻識別的。
為了方便開發(fā)者在本地捕捉數(shù)據(jù)和運行機器學習模型,AWS發(fā)布了一個叫DeepLens的攝像頭,可以連到AWS上對接別的服務,比如SageMaker。
以上就是AWS在AI和機器學習方面的實踐和對外提供的服務,AWS提供的AI服務有兩方面的優(yōu)勢,一個是在于AWS開放平臺上的海量數(shù)據(jù),另外,就是AWS有一系列的服務可以對人工智能的服務提供支持和集成。
一家云計算服務商能提供什么樣的服務呢?云說到底是資源,是服務,AI本身需要做的事情現(xiàn)在也很明確,需要數(shù)據(jù),需要清洗處理過的數(shù)據(jù),需要云計算的數(shù)據(jù)存儲和處理服務,訓練所需的算法在過去幾十年中一直在實踐中發(fā)展著,不需要云服務商做什么,云服務商還能做的就是讓繁瑣的調(diào)參迭代的過程更高效一些,讓訓練出的模型快速得到應用。從這個角度來看,AWS的服務是全覆蓋。
AI還在發(fā)展當中,AI在未來的發(fā)展主線肯定是隨著數(shù)據(jù)的不斷積累,AI場景的不斷發(fā)掘而不斷走向成熟的,過程中AWS這樣的云服務商必不可少。