它可以將盲人的周邊環(huán)境處理成3D空間模型,并通過超聲波提供更準確的定位和導(dǎo)航制導(dǎo);為了讓盲人知道身邊都有誰,這個應(yīng)用還貼心地提供了人臉掃描功能,并能告訴盲人身邊的人的情緒。
IBM,這個藍色巨人近年來在科技領(lǐng)域似乎過于保守。從生產(chǎn)機械制表機開始,直到成為一個集硬件、軟件和服務(wù)于一身的大型科技企業(yè),IBM在自己的領(lǐng)域顯得非常專注,并不輕易進行核心領(lǐng)域之外的其他科研活動。它曾經(jīng)在存儲技術(shù)、數(shù)字通信技術(shù)、半導(dǎo)體芯片技術(shù)等方面領(lǐng)先世界,但是也僅僅是淺嘗輒止,并沒有深耕細作,形成完整的產(chǎn)業(yè)鏈。它更多地是不斷完善自己的系統(tǒng),以服務(wù)于政府單位、金融機構(gòu)和大企業(yè),似乎對個人零售產(chǎn)品不太感興趣。
即便到了移動互聯(lián)網(wǎng)時代,也不見得它在個人版APP上的開發(fā)有多大的突破。雖然在去年和蘋果公司合作開發(fā)了10款I(lǐng)OS系統(tǒng)的APP,涉及航空、金融、保險、電信、零售以及政府通信等領(lǐng)域,但是這些APP無一例外全部是企業(yè)版本。比如一款叫做Plan Flight的APP,主要用途是供飛行員提前查看航班時刻表、航班計劃以及機組人員名單,在飛行中向地勤人員報告遇到的問題,提出最佳燃油使用推薦,很顯然這個APP是為航空公司設(shè)計的。
服務(wù)大企業(yè)和大機構(gòu)是IBM的一貫作風,也是這家企業(yè)傳承已久的商業(yè)傳統(tǒng)和文化基因。二戰(zhàn)時期,它甚至還制造過槍械武器,當時下訂單的是美國國防部。
這是一個足以傲視全球的巨無霸,但是最近它悄悄改變了作風,開始研發(fā)一款個人用的APP,說實話,這個APP還不一定有多少人用,但是這個轉(zhuǎn)變無疑是值得期待的。
IBM和卡內(nèi)基·梅隆大學合作開發(fā)個人用APP
華盛頓郵報近期在科技欄目上刊發(fā)了一篇短文,介紹了一款可以做盲人眼睛的新型APP,那么這個被叫做NavCog的應(yīng)用到底如何呢?下面先簡單介紹一下。
1、由IBM和卡內(nèi)基·梅隆大學合作開發(fā)。負責這個手機應(yīng)用開發(fā)的工程師來自久負盛名的IBM Research和卡內(nèi)基-梅隆大學,這個開發(fā)工程是雙方的合作項目。有意思的是,其中一個主要的工程師,名叫Asakawa的女士,她自己本身就是一個盲人,她對這個應(yīng)用充滿期待和自信,她希望以后能夠憑借這個應(yīng)用在科研樓里自由漫步。
2、它不只可以導(dǎo)航。習慣了手機地圖的我們,對于導(dǎo)航功能并不陌生,甚至是司空見慣。可是對于盲人,事情就沒有那么簡單了。不過,這個應(yīng)用的構(gòu)想也是不簡單的。
首先,這個應(yīng)用可以通過語音或者震動兩種方式,為盲人提供信息并進行導(dǎo)航;
其次,它可以將盲人的周邊環(huán)境處理成3D空間模型,并通過超聲波提供更準確的定位和導(dǎo)航制導(dǎo);
第三,為了讓盲人知道身邊都有誰,這個應(yīng)用還貼心地提供了人臉掃描功能,并能告訴盲人身邊的人的情緒。
當然,導(dǎo)航功能目前已經(jīng)成熟,而人臉識別還在探索。
3、它暫時依賴藍牙燈塔提供的信號。應(yīng)用的運行在目前主要依靠藍牙燈塔(Bluetooth Beacon),藍牙燈塔在國內(nèi)可能不多見,但是在蘋果、谷歌等企業(yè)已經(jīng)有相關(guān)的產(chǎn)品問世,簡而言之,它是一種比較方便的信號傳遞載體。目前,NavCog的試驗主要依賴于遍布校園的藍牙燈塔,不過根據(jù)工程師們的介紹,他們的工作方向是逐漸讓應(yīng)用適應(yīng)各種環(huán)境,適應(yīng)沒有藍牙燈塔的環(huán)境。
藍牙燈塔
IBM也許會給人們帶來驚喜
如果NavCog的導(dǎo)航和人臉識別系統(tǒng)完善了,那么它將是盲人的一大福音。或許某一天在街頭上,你可以看見一個身穿休閑裝、戴著耳機悠閑散步、時不時和路上的熟人打招呼的人,她看起來和我們一模一樣,誰也不會說她是個盲人。
不過IBM的工程師不滿足這些,有了上述功能,工程師可以開發(fā)出其他提高輔助認知能力的應(yīng)用,這些應(yīng)用可以當做醫(yī)護人員和氣象監(jiān)測員的助手,甚至它還有可能用到對自閉癥的研究中來。
雖然目前的技術(shù)水平還沒有達到此程度,但是不得不說這是IBM給人們帶來的驚喜,一個蘊含著人文關(guān)懷的手機應(yīng)用,一份進軍個人版APP領(lǐng)域的華麗開端。
一款可以做盲人眼睛的新型APP
本文所提到的華盛頓郵報文章,我自己將這篇文章翻譯出來了,供參考。
隨著計算機在周邊環(huán)境下的感知能力的進一步提升,它也在幫助人們更好地感知這個世界。好在人工智能和機器人學等專業(yè)的發(fā)展,IBM Research和卡內(nèi)基·梅隆大學的科學家正在為視覺損傷者研究一項讓他們能夠看見外面的世界的新方法。
這個目標不僅鼓舞人心,還極具創(chuàng)意--建立一個技術(shù)平臺,讓視覺損傷者可以向其他人一樣自由漫步。這個工程的第一個嘗試是一款叫做NavCog的應(yīng)用,它可以在IOS系統(tǒng)和安卓系統(tǒng)上使用,這個應(yīng)用可以通過耳機發(fā)出的聲音或者讓手機震動來為盲人導(dǎo)航(使用者可以選擇設(shè)定應(yīng)用為“聲音模式”還是“震動模式”)。
就像汽車GPS提供的實時導(dǎo)航一樣,這個應(yīng)用為盲人提供實時的視角。它分析來自人行道上的藍牙燈塔以及智能手機傳感器提供的信號,能讓盲人在沒有其他人的幫助下自由行動,無論在學校建筑內(nèi)還是在戶外都可以。
當程序能夠幫助盲人隨時定位、告訴他們所處的方向以及周邊環(huán)境的其他信息時,好戲就開始了。電子導(dǎo)航程序?qū)⑹謾C內(nèi)對周邊環(huán)境拍下的照片處理成3D空間模型,以此來作為實時導(dǎo)航的指導(dǎo)。
NavCog工程,是位于Yorktown Heights 的IBM Research和卡內(nèi)基-梅隆大學的合作項目,它對于工程的主要研究者之一的Chieko Asakawa具有特別的意義,她是IBM的院士以及卡內(nèi)基-梅隆的客座教授,她是一個盲人。對她而言,利用這個APP幫助她在校園內(nèi)行走將可能在短時間內(nèi)變?yōu)楝F(xiàn)實,她戴著耳機,聽著從手機里傳過來的聲音,行走時和別人并非兩樣。
這僅僅是一個開端”,卡內(nèi)基·梅隆大學機器人研究院的Kris Kitani這樣說道。當然,一個主要的目標,是要拓展被藍牙燈塔覆蓋面,目前的試驗主要依靠的是大學校園里面的藍牙燈塔。為了鼓勵覆蓋,項目科學家將NavCog平臺完全開放了,開發(fā)者能夠自由使用IBM BlueMix cloud上的資源。這使得其他的開發(fā)者有能力為系統(tǒng)強化其他方面的功能,并且加快展現(xiàn)出其他物理上的功能。
Kitani說,另一個重要目標,是使系統(tǒng)可以在任何環(huán)境,甚至在沒有藍牙燈塔的情況下運行。為了將這個可能性變?yōu)楝F(xiàn)實,學校希望在電子視覺和輔助認知兩方面進行提升,開展新的工作。輔助認知這個領(lǐng)域的設(shè)立是為了增強盲人正在消失和弱化了的感知能力,從外界重新獲得信息。
例如,通過電子輔助視覺系統(tǒng)對照片的處理,可能會發(fā)展一個更加精準的,不需要藍牙燈塔的系統(tǒng)。此外,當電子輔助視覺系統(tǒng)與定位系統(tǒng)結(jié)合時,潛在地也就能識別出每天的“地標”。比如,路上一排臺階或者柵欄,這些東西目前并不能被傳感器感應(yīng)。
“憑借對那些對象的本地化信息的理解,我們正在嘗試一項技術(shù),讓現(xiàn)實環(huán)境更加適合每一個人。我們開展人類智能和機器人技術(shù)的研究已經(jīng)有很長一段時間,我們能更好地完善人們對于周邊環(huán)境的感知能力。這個開放的平臺將擴大全球研究人員合作范圍,一個視覺障礙患者觀看世界的新時代即將來臨。”--卡內(nèi)基-梅隆大學機器人學院院長Martial Hebert說。
得利于卡內(nèi)基-梅隆大學內(nèi)人工智能和機器人專業(yè)的融合,研究者計劃在系統(tǒng)內(nèi)加入其他的功能,使得NavCog不僅僅可以導(dǎo)航。舉個例子,面部識別元件將實時提醒你,你正在一個熟人旁邊路過。不止如此,傳感器還可以識別人們面部表情所反映出來的情緒:因為它可以分析出在你面前匆匆而過的人是笑容滿面還是緊鎖眉頭--這是與學校里其他關(guān)于自閉癥的部分研究工作有關(guān)。研究者同時還可以探索通過電子視覺來判斷周圍的人的活動,通過超聲波技術(shù)更加精準的定位。
如Asakawa所說,輔助識別的研究的進步創(chuàng)造出的NavCog應(yīng)用與IBM Watson機構(gòu)展示的電子識別是有類似的地方的。在這兩個案例中,他們都在不斷嘗試在確保時效性的前提下提高人類的識別能力。例如,在IBM公司內(nèi)部,研究者有時候會使用“Watson on my shoulder”這個術(shù)語來憧憬IBM Watson的未來。那將是一個連續(xù)的、地方化的存在,它可以為所有人提供輔助識別,包括醫(yī)護人員和氣象監(jiān)測員。
如果一切進展順利,那么就可以為機器智能和人類智能設(shè)想一個高質(zhì)的反饋回路,在這里,為提升機器能力而發(fā)展起來的識別技術(shù),最終也會促進人類能力本身的提升。