無論有多先進的技術,看錯了市場,還是只能面臨失敗的後果。2009年,一個能提高遊戲伺服器百倍效能的技術,因初次轉換成本過高而在遊戲廠商圈中乏人問津。直到2013年秋天,一場愛貓飲食控制失衡後的截肢意外,讓奇群科技執行長宋牧奇找到了新的商機,打造出吸引美國科技媒體爭相報導的智慧貓咪餵食器,3天就在美國募資網站獲得上千位跨國投資者的支持。這一次,宋牧奇還多用了一個秘密武器,就是連Google、百度都全力押注的機器學習新技術。
2008年宋牧奇從美國IBM離職,便與另一位創辦人共同創立奇群科技,他們一開始專注於GPU技術,並將之應用於開發多人線上遊戲伺服器平臺,宋牧奇說:「一般伺服器約能讓2,000人同時上線,但是GPU高速平行運算的特性,他們所開發出來的平臺能讓20萬人同時上線」,儘管當時各大線上遊戲廠商也認為,能讓伺服器效能提升百倍是一項很厲害的技術。
不過,因為伺服器的花費對於一款線上遊戲整體營運成本來說,比例低的不足一提,廠商不願花費額外的開發資源轉換平臺,使的原本宋牧奇引以為傲的技術,因為疏於對於市場的了解,而導致這項產品最終以失敗收尾。
在2014年,奇群科技卻又因這項GPU技術的應用,獲得了許多市場的關注,其智慧貓咪餵食器CATFi在群眾募資網站Indiegogo受到超出預期的歡迎,3天內就達到原先募款目標的10萬美元,最終吸引來自80個國家1,400名贊助者,共募得25萬美元。CATFi這個看似有趣的商品,其後端所使用的技術並不簡單,是運用現在當紅的深度學習技術。
CATFi出發點只為解決自己的問題
而CATFi這個點子,來自宋牧奇飼養寵物的親身慘痛經驗,他家中總共養了5隻貓,其中有一隻貓一個星期都沒吃東西喝水,但是他卻不知道,因為5隻貓都共用食物以及水的容器,當他下班回家,看到食物跟水都有減少,直覺認為每隻貓都有正常吃喝,直到有天回家發現其中一隻貓趴在地上不能動,送去醫院才知道這隻貓因為胰臟炎,導致身體不舒服沒有食慾,沒有進食引發血栓兩隻腳癱瘓,最後只好截肢。
宋牧奇的妹妹是獸醫,常常碰到飼主將家中寵物帶來就醫的時候,健康狀況已經非常糟糕,但如果能紀錄寵物的飲食習慣,對於諸如糖尿病會導致貓咪進食喝水頻率改變的疾病,就能提早發現,而不至於嚴重到無法挽回的地步。宋牧奇表示,設計貓咪餵食器CATFi一開始的目的,只是想解決自己遇到的問題而已。CATFi的應用特別適合多貓家庭,有養貓的家庭,通常都不只養一隻貓而已,宋牧奇提到,美國有多達一半以上的養貓家庭都是多貓家庭。
CATFi的功能不只能夠紀錄家中每隻貓日常的喝水以及進食的狀況,主人也能用手機看到家中愛貓吃東西的即時影像,或是過去的統計資料,而根據每隻貓長期的飲食紀錄,便能粗略掌握愛貓日常的健康變化。
在剛開始使用的時候,主人需要先在App中,標記幾張家中貓咪的照片以及相對應的名字,以訓練CATFi學習分辨貓咪間的差異,之後當貓靠進裝置要吃東西時,踏板下不只有感測器能測得貓咪的重量,還能啟動攝影機,即時將貓咪影像串流回後端伺服器,經過辨識知道是哪一隻貓咪要吃飯,再根據預先設定的餵食策略,給予貓個別化餵食。
至於貓咪會不會乖巧的使用餵食器,讓攝影機拍攝臉部影像,或是同時有兩隻貓擠進餵食器的情況又該怎麼辦,宋牧奇說:「CATFi在裝置硬體上做了很多貓體工學的努力」,以盡量避免意料之外的事情發生。
把餵食器設計的讓貓方便使用固然是重要的,不過,CATFi之所以被稱為智慧餵食器,是因為它能對每隻貓給予不同的餵食策略,而要分辨出家中每一隻貓並非易事,需要應用如同人臉辨識的機器學習技術,才能夠不只讓電腦知道什麼是貓,甚至進一步知道每一隻貓的不同之處。
深度學習讓機器精準辨識貓
在發表CATFi之前,奇群科技接了不少企業的案子,其核心技術都圍繞著GPU的運算應用,讓他們著實累積了不少技術底子。而最新的產品CATFi不只使用了GPU技術,還使用了機器學習中當紅的演算法深度學習(Deep Learning),這項技術現已被諸多網路公司廣為應用,像是Google有約20項產品背後都有使用深度學習。
過去機器學習中曾被寄予重望的類神經網路,有一段時間遇到了客觀條件的限制而遭遇瓶頸,辨識率一直無法提升,直到深度學習重新被提出來,宋牧奇說:「深度學習被證明可以用來解決過去無法解決的難題」。而事實上,深度學習並非新穎技術,但一直到了2012年,Google發表了一篇深度學習的論文,這項技術因此才一炮而紅。
這篇論文的實驗是,Google從YouTube未上標籤的影片中,擷取出1千萬張圖片,並使用擁有1千臺電腦的運算叢集Google Brain,以深度學習演算法從圖片中自主學習,最後Google Brain學會辨識3樣東西,人的臉、身體還有貓。宋牧奇表示,深度學習就是讓電腦模仿人類學習事物的方法,自己找出輸入樣本的特徵。
深度學習演算法會從學習樣本中最小的單位(Primitive)開始,例如樣本是圖片,為了優化學習效果,須將資料處理單位拆解到像素等級,演算法會從每個畫素出發,計算畫素與畫素之間的線段關係,線段與線段的連接形成邊的關係,而邊與邊相連則會形成輪廓關係等,每一階段的處理都是一種特徵萃取,電腦進而找出具有哪些特徵的圖片是代表貓。
適當的將深度學習演算法運用在辨識工作上,能取得良好的結果,但由於深度學習是複雜數學模型,且要使用足夠多的訓練樣本,才能得到夠好的結果。計算上又需從樣本的最小單位(Primitive)開始計算,並且經過多層特徵萃取,因此非常耗費運算資源,當用來訓練模型(Model)的運算能力有限的時候,訓練一個可用的模型所需時間可能高達數周,這樣的時間成本,在很多情況的應用上可用性便大打折扣,更何況並非任何人都能擁有像Google Brain千臺伺服器等級的運算資源。
宋牧奇以辨識人臉作為例子,解釋過去常應用的機器學習演算法與深度學習的差異,過去在運算能力低落的時代,為加速計算的過程,機器學習的演算法在設計上,都會加入一些人的觀察作為預設條件以加速或是增加辨識的成功率,像是定義人臉一定有2個眼睛、1個鼻子和嘴巴。
他說,這與模仿人類實際學習方法的深度學習不同,要教一位小孩學習什麼是人臉,只要給他看很多人臉的照片,人腦的神經元便能自主處理訊號特徵,歸納出人臉的抽象概念。
而這也是過去常應用的機器學習演算法,其辨識度遠不及深度學習的原因,越多的假設便會限制機器的學習能力而造成辨識誤差,就像是同樣一張佛地魔的圖片,即是佛地魔沒有鼻子,人仍然會判斷這是個人,但是有假設的機器學習演算法就不這麼認為了。
CATFi是一款智慧貓咪餵食器,後端使用深度學習技術,能夠辨識家中每一隻貓,並根據不同的餵食策略餵食,主人還能透過App即時看到貓吃東西的畫面。(圖片來源/奇群科技)
不只精準,GPU加持讓辨識更快
為了克服深度學習訓練模型動輒以天計算的問題,工程師開始把腦筋動到GPU上,利用其平行運算的特性加速整個過程。但在GPU以及分散式系統執行機器學習都會遭遇相同的問題,由於機器學習在取得最終結果之前,中間過程需要經過多次迭代,而這兩種平行運算的系統在設計上,便需要建立互相溝通的機制,讓機器互相交流資訊,宋牧奇說,由於在GPU上每個執行緒是共用記憶體,所以耗費在溝通的成本非常低幾乎可忽略。
宋牧奇認為,深度學習技術之所以能夠普及,跟GPU廠商的策略有很大的關係。全球GPU的市場過去呈現寡占的局面,但是在GPGPU(通用圖形處理器)的發展上,宋牧奇嘗試採用過Nvidia以及AMD的解決方案後,認為AMD在這完全失去競爭力。
而Nvidia在2011年將GPGPU帶出科學計算領域,原先需要動輒3、4千美元的顯示卡才能用來計算,但是當時Nvidia開始讓消費型的顯卡也有一定的資料運算能力,此策略對於GPU與深度學習的發展有很大的影響,到了現在甚至已有現成的GPU深度學習的套件可以直接使用,雖然應用上還是需要基本的機器學習觀念,但是技術進入門檻已經大幅降低。
奇群科技提供服務的伺服器就是使用GPU來做深度學習的運算,GPU與深度學習的結合,使得技術可用程度得以大幅提高。因為即便深度學習的辨識率很高,但是當計算時間需要過長的時間,那終究是無用,畢竟使用者利用像是Google Now的語音搜尋服務,便會想要立即得到結果,對於回應延遲的容忍度隨著科技發展而降低。
不要想拿一個工具解決所有問題
宋牧奇表示,奇群科技從創立到現在,能存活下來是運氣很好。因為過去他們一直用錯誤的方式尋找商業模式,宋牧奇自認技術底子很好,而且手中握了一個極具潛力的GPU運算技術,總覺得這項技術一定可以大放異彩,但是這卻成為奇群科技發展的致命傷,他說,過去他一直在尋找一個適合的問題,可以套用這項技術來解決,但是這樣的方式完全背離解決問題的初衷。
要是能夠重來一次,宋牧奇說,他會試著停止寫程式,並把時間放在思考需要解決的問題上,CATFi這個點子出現的時候,就是他開始停止寫程式的時候。他表示,很多新創公司都會掉進這個陷阱裡,嘗試拿一個工具解決所有的問題,但這終究是不可能的,而他認為,尤其是技術好的公司,更容易掉入這樣的迷思,應該適時的停下腳步,思考發展的方向。
工程師應該停止寫程式,先思考如何解決問題,特別是那些技術很好的人。──奇群科技執行長 宋牧奇
公司檔案
奇群科技
● 地址:臺北市大安區和平東路1段192號6樓
● 網址:www.zillians.com
● 成立時間:2008年
● 主要業務:GPU運算、電腦視覺、深度學習、物聯網
● 總部:臺北市
● 員工數:32人
● 資本額:52,500,000元
● 董事長:宋光彥
● 總經理:宋牧奇
公司大事紀
● 2008年:奇群科技創立
● 2009年:發表基於GPU加速之線上遊戲伺服器平臺
● 2011年:與廣達電腦合作開發虛擬GPU技術之雲計算平臺
● 2013年:與勝捷光電合作,推出行車記錄議視頻網站PushCam
● 2014年:推出跨越CPU與GPU架構、跨機器、支援大量平行處理之編譯式程式語言Thor
● 2014年:推出全球第一臺貓臉辨識的智能貓咪餵食器Bistro
熱門新聞
2024-11-25
2024-11-25
2024-11-25
2024-11-25
2024-11-24
2024-11-22
2024-11-25