社區(qū)生鮮重力柜
重力感應解決方案在每個貨道上均裝有重力感應器,核心原理即通過感知貨道上的重力變化來判斷消費者實際拿取的商品?;诘讓釉?,該方案擁有以下應用特性:
?。?)不涉及人工智能算法模型搭建,無需對商品進行學習,便于商品上新
(2)可自動稱重售賣散裝生鮮產(chǎn)品,非常適用于社區(qū)生鮮零售場景;
?。?)支持多品類SKU售賣,商品可堆疊擺放以充分利用柜體空間。
同時,該方案中,商品重量成為唯一識別標準,這也造成了諸多弊端:
(1)無法識別重量相同的SKU;
?。?)置換商品位置后會出現(xiàn)識別誤差;
?。?)長期放置后,脹氣、濕度等影響因素將使商品重量發(fā)生變化,同時重力感應器長久發(fā)生形變后難以感知小幅度重力變化,識別精度無法保證;
?。?)只感知單次消費重力變量,不涉及庫存盤點,給實際運營管理造成困難。
2.2 動態(tài)視覺識別
動態(tài)視覺柜購物視頻截圖
動態(tài)視覺識別方案通常是在柜體頂端或兩側安裝1-4個攝像頭,對消費者開門后拿取商品的過程進行錄制,視頻上傳至后臺系統(tǒng)后,通過對購物視頻進行識別從而確定消費者拿取的商品信息?;诖?,筆者總結了動態(tài)視覺柜的應用特性:
?。?)對商品陳列無任何要求,商品可堆疊擺放,能夠提高空間利用率,適用于倉儲運營場景;
(2)商品的學習成本比較低,支持多品類SKU售賣。
動態(tài)視覺方案僅依據(jù)消費者開門后拿取商品的視頻來進行識別,非常容易受到外界干擾,如果遇到消費者故意遮擋商品信息、快速拿取商品導致畫面模糊、有意遮擋攝像頭無法正常拍攝等情況,便無法正確識別商品。因此目前市場上已投放運營的動態(tài)視覺智能柜均為100%人工識別,通過人工審查視頻來完成消費結算,在運營中存在諸多局限性:
(1)視頻上傳流量費用高,帶寬成本遠高于其他方案;
(2)依賴于人工,使得消費結算時間非常不穩(wěn)定,短則幾秒鐘,長則一天,嚴重影響購物體驗;
?。?)識別準確率較低。以上圖為例,視頻定格畫面十分模糊,難以準確判斷商品信息;
?。?)僅針對消費過程進行變量記錄,無法對柜內貨品進行精確盤存,貨損率比較高。
2.3 靜態(tài)視覺識別
該方案同樣是基于計算機視覺算法,但實現(xiàn)原理與動態(tài)方案有著本質的區(qū)別。靜態(tài)視覺柜每層貨架的頂端都安裝有攝像頭,在消費者開門前、后,攝像頭均會對柜內物體進行拍照并上傳系統(tǒng),系統(tǒng)后臺的算法模型會對所有圖片進行檢測識別,并生成開門前、后柜內商品的庫存明細,通過計算商品庫存量差值來判斷消費者實際拿取的商品。
經(jīng)過大量的實例驗證,靜態(tài)視覺方案有諸多優(yōu)勢:
?。?)以人工智能算法完全取代人力審核,結算速度快,識別穩(wěn)定;
?。?)識別準確率高,同時也可通過實際運營中采集的數(shù)據(jù)持續(xù)優(yōu)化算法,現(xiàn)識別準確率基本可達到99%-99.9%;
(3)可實現(xiàn)實時遠程庫存管理,商品貨損率極低;
?。?)更適合大密度投放,獲得規(guī)模運營效益。
同樣,相比其他的技術方案,靜態(tài)視覺方案也存在局限性:
?。?)空間利用率低,柜內商品不能疊放,否則會在鏡頭前形成遮擋,影響識別準確率;
?。?)需要對商品進行學習,數(shù)據(jù)采集及數(shù)據(jù)標注等流程較為繁瑣,通常至少需要3-7天的時間完成。
2.4 重力+動態(tài)視覺
為進一步提高識別準確率,市場上還出現(xiàn)了重力感應+動態(tài)視覺的組合方案。經(jīng)筆者調研了解到,該方案在實際的運營過程中,依舊以重力感應技術為主,視頻監(jiān)控僅在大單消費等極特殊情況下才會啟用,本文將不再做詳細介紹。
三、圖像識別原理
目前應用比較廣泛的智能柜大多以視覺識別方案為主。在上文分析過,視覺識別技術方案尤其是靜態(tài)視覺方案已非常成熟,可以基于人工智能算法實現(xiàn)閉環(huán)式無人零售。下面筆者將繼續(xù)剖析圖像識別的實現(xiàn)原理。
3.1 圖像識別原理
圖像識別主要由兩個步驟組成,首先是目標檢測,其次是商品識別。
目標檢測就是在照片中確定商品的位置,找到每個商品的像素區(qū)域。簡單來講,就是確定每個商品的邊緣輪廓并進行標注,如圖中所示,在每個商品的邊緣畫上白框即目標檢測過程。
商品識別通過基于深度學習的算法來實現(xiàn)。深度學習就是采用卷積神經(jīng)網(wǎng)絡提取目標特征,再根據(jù)相同商品表現(xiàn)出來的共性總結出一定的識別經(jīng)驗值。將上圖每個白框標注出來的待檢測目標放入算法模型中,提取并比對商品特征點后,即可確定商品名稱。
3.2 目標檢測實現(xiàn)難點
理解了圖像識別原理,筆者再以實例講解技術應用難點。由于商品外形包裝千變萬化,消費者行為又難以控制,諸多因素都給技術落地造成了不小的障礙:
商品密集擺放
上圖是靜態(tài)視覺智能柜拍攝到的真實畫面,魚眼攝像頭會造成圖像畸變,尤其是當商品密集擺放或商品位于邊緣區(qū)域時,將給目標檢測、特征提取等造成障礙。
軟包裝商品難以精確檢測商品邊緣
與瓶裝、盒裝商品不同的是,軟包裝商品外形沒有那么規(guī)則,很難清晰地區(qū)分單個商品的邊緣輪廓,尤其是遇到上圖所示的透明包裝商品,在豎立擺放的情況下,很容易造成目標檢測不準確,從而導致識別出錯。
以上是幾個較為直觀的案例,可見單靠圖像識別算法很難解決這類實際運營難題,此外還需要其他技術輔助,以一個更加全局觀的視角分析并解決問題,方可提升智能貨柜的穩(wěn)定性。
四、智能柜產(chǎn)品測評
筆者走遍上海,對支付寶、深蘭科技、海深科技、智購貓、嗨便利這五家智能貨柜進行了實地調研,從結算時間、復雜場景識別穩(wěn)定性等多個維度對智能貨柜進行評估,結果如下:
沒有100%完美的技術方案,但針對不同的運營場景,必然有最具比較優(yōu)勢的解決方案。本文從智能柜實際運營的角度出發(fā),分析了不同技術方案的應用特性,希望能幫助智能柜運營團隊做出最適合自己的選擇,為無人零售行業(yè)的智能化升級貢獻一份力量。
感興趣者可參考下方具體的產(chǎn)品測評視頻:
https://www.bilibili.com/video/BV1Bz4y1D77u?from=search&seid=2895542164485255315
https://v.qq.com/x/page/e3113xwfgz7.html
或者在騰訊視頻、嗶哩嗶哩搜索“智能貨柜超全測評”關鍵詞,獲取更多詳細信息!