奔跑吧,AI當你的眼睛
谷歌表示,它開發(fā)了一個人工智能系統(tǒng),可以幫助視力受損的人獨立運行。據(jù)報道,依靠該系統(tǒng),視力受損的人不需要依靠人類的指導,也不需要引導狗狗自己完成全程。那么,這個人工智能系統(tǒng)如何讓視力受損的人參加跑步比賽?近年來,幫助視力受損的人恢復視力,人工智能的周期性成就是什么?這些產(chǎn)品與目前的應用程序有多遠?
用聲音信號指引盲人的道路
如今,許多健身倡導者喜歡挑戰(zhàn)馬拉松,盲人如何參與跑步?"半匹馬"或"整匹馬"?一位公共福利組織者說,盲人參加這樣的比賽需要跑步者的幫助。為了便于跑步,盲人和隨行跑步者之間有一根繩子,他們的手腕上都纏著,就像他們手牽手一樣。為了確保盲人在跑步時是萬無一失的,有時需要兩名跑步者。然而,當盲人通常訓練的時候,在任何時候找到一個隨行跑步者似乎是不現(xiàn)實的。
最近,許多城市開始允許導盲犬進入地鐵和公共汽車。然而,在中國,導盲犬的數(shù)量是非常有限的。據(jù)統(tǒng)計,截至2017年,導盲犬的數(shù)量只有116只,比大熊貓還少,同時有800萬視力受損的人需要導盲犬服務。每只導盲犬的訓練費用在120000到150000美元之間。導盲犬的壽命大約是十多年。即使視力受損的人幸運地安排了一次,這也是一個值得思考的問題,即有視力障礙的人退休后應該如何外出。
谷歌開發(fā)的這個系統(tǒng)似乎給了我們希望。"在這個系統(tǒng)中,視力有缺陷的人不需要依靠人工向導或導盲犬獨自完成旅程。"智庫人工智能主管、圖靈機器人公司首席戰(zhàn)略官譚明洲說。
應用程序使用人工智能模型來識別道路上的一條線,并根據(jù)應用程序推斷出跑步者與直線之間的關系。如果跑步者太遠,應用程序會向戴著耳機的骨頭耳機發(fā)送信號,播放令人不快的噪音。哪個耳機發(fā)出聲音,聲音有多大,讓跑步者知道自己需要移動到哪里,以及離終點線有多遠。
譚明洲解釋說,這有點像汽車上使用的接近警報器,汽車離發(fā)生碰撞的地方越近,警報器就越響,頻率也就越快。使用谷歌的系統(tǒng),跑步者需要在腰帶上系上Android手機。這個應用程序不需要連接互聯(lián)網(wǎng)就能工作,它還可以考慮各種照明和天氣條件。顯然,如果在某些社區(qū),特別是為視覺殘疾者設置帶有引導標志的軌道,他們可以安心地跑步和鍛煉。
構建一個無障礙的場景,如您所見
有視力障礙的人只是看不見的,可以被聽到。譚明洲指出:"目前的人工智能技術使得他們不可能真正看到世界,但它讓他們能夠體驗"仿佛他們看到了的效果。
如今,許多互聯(lián)網(wǎng)公司已經(jīng)成功地讓視力遲鈍的人能夠以多種方式與他們提供的服務進行互動,主要是通過將文本轉化為屏幕閱讀器的聲音。四年前,F(xiàn)acebook(Facebook)推出了"無障礙倡議"(Accessability Initiative),試圖利用人工智能技術豐富盲人、聾人和其他殘疾人的用戶體驗。關鍵任務之一是重新設計菜單和按鈕結構,使用自動解釋特定照片和視頻的算法,以便為屏幕閱讀器提供豐富的場景描述。
作為美國的一名職業(yè)徒步旅行者,視力遲鈍的特雷弗·托馬斯(Trevor Thomas)偶爾會和他的狗在一些山路上和粉絲們在Facebook上分享徒步旅行的照片和視頻。我不在乎是否使用Facebook,因為我看不見照片,"他說。"但現(xiàn)在我無法想象沒有Facebook的一天。"例如,人工智能技術的屏幕閱讀器描述了舊金山灣日落的照片:它包含自然、室外、云、草地、地平線、植物或樹木;一對夫婦站在加州丹麥一家著名的風車前,解釋說這張照片包括三個人,微笑和戶外。
很明顯,這些解釋并沒有提供對照片的全面描述,但是沒有人的幫助,它們確實填補了一些空白。譚明洲說:"視力受損的人只需要點擊讀者來描述他們,而不需要其他人來解釋。
瑞士EYRA公司開發(fā)了一種用于視力障礙患者的閱讀輔助設備。據(jù)報道,該設備由三部分組成:耳朵上懸掛的骨傳導耳機和高清攝像頭,以及人工智能處理器。人工智能處理器可以將文本轉換成音頻小說,當然,也不需要擔心噪音干擾,因為它是骨骼傳導,可以在一定程度上減少噪音干擾,給視力受損者的生活帶來方便。
今年在拉斯維加斯舉行的世界上最大的消費電子展上,智能手機可以通過聲音談論周圍的世界,為視力殘疾和弱視用戶提供更豐富的視覺體驗。"該應用程序還可以適應智能眼鏡,它可以將用戶的智能手機攝像頭變成用戶的眼睛。據(jù)報道,它使用人工智能識別攝像機指向的視覺信息,包括食品包裝、海報和展示屏幕,如超市商品信息、車站展示屏幕、街頭海報等。此外,你還可以識別朋友和家人的臉,用戶可以用它們來掃描和發(fā)現(xiàn)周圍的人和東西。
努力從三個方面釋放科技人文關懷
根據(jù)美國勞工部和美國盲人聯(lián)合會的統(tǒng)計,147個視力障礙者的職業(yè)可以成功就業(yè),因此,有學者指出,教育是改變視力障礙者就業(yè)狀況的關鍵一步,特殊教育也需要技術化。
目前,許多針對弱智者的解決方案突出了人工智能應用的多樣性和人性化。那么,如何加快人工智能產(chǎn)品的突破性使用,從而使冷技術釋放出人文關懷呢?
譚明洲指出,這需要三方面的努力。首先,我們應該培育創(chuàng)新的生態(tài)。在2017年德勤國家創(chuàng)新精英挑戰(zhàn)總決賽上,四川大學一組學生開發(fā)的一款視覺致殘Kindle閱讀器獲得了該獎項。我們應該鼓勵更多這樣的科技成就,為視力有缺陷的人進行創(chuàng)新,讓他們睡不著覺,并盡快把他們變成真正有益于視力缺陷的人的產(chǎn)品,"譚明洲說,"我們需要建立一個良好的創(chuàng)新環(huán)境。
此外,應解決計算能力與成本之間的矛盾。譚明洲說,機器學習和訓練經(jīng)常消耗大量的計算能力,在操作中會存在信息隱私的時間延遲和安全風險,這就需要將數(shù)據(jù)從人工智能算法上傳到云端。為了滿足終端人工智能推理操作的實時性和可用性要求,需要對大量的數(shù)據(jù)進行局部處理。然而,如果在終端本身部署高性能的AI芯片,從成本控制的角度來看是不現(xiàn)實的,在實體場景中部署足夠多的EDGE AI更可行。
邊緣計算可以被看作是對5G/AI+云計算的巨大幫助"--"神經(jīng)末梢"。例如,AI向導堅持實現(xiàn)實時的交互和判斷,看到交通燈變綠,就可以自動判斷出"可以"的狀態(tài)。使用邊緣計算無需通過云服務器逐層判斷將路燈信息上傳到云端,從而發(fā)送步行提醒。這無疑大大降低了延遲的風險,以及云計算的過載。
最后,我們還需要等待工業(yè)環(huán)境的全面成熟:基礎設施、硬件和軟件的改進基本到位,以便終端設備能夠更好地運行深度學習算法。"加強5G智能網(wǎng)絡的建設,確保云計算和邊緣計算各節(jié)點的高效可靠使用。"譚明洲指出。