阿里巴巴「讀光者」 助視障群體讀取不一樣顏色

 

琳琅满目的商品圖片資訊,是天貓雙11全球狂歡季(「天貓雙11」)的特色之一,瀏覽評價區的圖片分享及買後心得,也成為一眾淘寶天貓消費者購入心儀商品前的指定動作之一。

然而,簡單的一個瀏覽圖片動作,卻不是所有人都能享受到。

27歲的蔡琼卉,是一名鋼琴調律師,跟很多人一樣喜歡網購,特別是參與天貓雙11這個年度購物盛事;稍不一樣的是,後天失明讓她無法再感知溫暖的色譜。

2015年,蔡琼卉第一次接觸互聯網平台,她坦言當時體驗並不流暢,因為當時大部分的網絡平台都缺少便利視障人士使用的提示功能,當初註冊淘寶、支付寶帳號,以及綁定銀行卡的動作,都需要他人輔助才能完成。

為了讓視障人士都能參與及感受數字經濟時代發展,阿里巴巴一直在手機端及應用程式改善「無障礙」服務,方便非健全人士行動,當中包括阿里巴巴技術團隊的努力—OCR(optical character recognition,光學字符識別)技術。

所謂OCR,是指利用光學技術和計算機技術,對文本資料的圖像文件進行分析識別處理,獲取文字及版面資訊的過程。OCR技術最初用於印刷體文字識別,例如郵政系統的郵編數字識別,以實現郵件自動分揀功能。隨著光學設備(如掃描儀、數碼相機及手機等)的飛速發展,OCR應用領域日益廣泛,覆蓋車牌識別、證件識別、票據識別等眾多場景。阿里巴巴達摩院加以改善這項便利視障群體的技術,並將其取名為「讀光」。

後天失明的鋼琴調律師蔡琼卉。

後天失明的鋼琴調律師蔡琼卉。

將圖片資訊化為語音 用耳朵「讀取」資訊

在視力被遮蔽的現實世界裡,很多視障人群寸步難行,但互聯網世界及科技力量,為他們重新打開通往社會的道路,用耳朵「讀取」不一樣的光明。

「讀光」是一款由阿里巴巴達摩院團隊打造的雲產品,透過多年不斷整合前沿技術和行業經驗,打磨出能夠承載跨行業應用的技術架構,形成完整的圖像文字定位、文字識別和文字理解的技術體系,為阿里巴巴集團各個業務方提供高性能、高穩定性的文字識別服務。經過多年的技術沉澱及實戰經驗,「讀光」的識別準確率和處理性已經處於業界的領先水平。

雖然新款智能手機一般具備手機讀屏功能,不過,圖片資訊目前並不能被識別出,而達麼院的OCR技術,讓手機淘寶具備了自動識別圖片的能力。2018年,淘寶天貓正式推出「聽圖購物」的程序,將「讀光」應用至購物體驗之中,它能夠精準地把圖片中的資訊轉為語音,讓視障用戶能夠靠聽力購物。

今年天貓雙11期間,蔡琼卉明言希望為她的導盲犬買入一批狗糧。目前她家中的物品中,有約90%都是從網上買入的。

達摩院資深算法專家、阿里巴巴OCR技術負責人王永攀介紹,阿里巴巴的技術團隊從2010年就開始致力於解決圖像中的文字問題,「只要你打開(手機)旁白功能,OCR就會在這樣的一些應用程式裡面,自動的去把讀光OCR開始啟動起來。讀光的閱讀速度非常的快,在我們聽來全是電頻的聲音,但對他們(視障人士)來說非常流暢。」

今年天貓雙11全球狂歡季期間,蔡琼卉希望為她的導盲犬買入一批狗糧。她表示,目前家中有約90%的物品都是從網上買入的。

今年天貓雙11全球狂歡季期間,蔡琼卉希望為她的導盲犬買入一批狗糧。她表示,目前家中有約90%的物品都是從網上買入的。

善於聆聽的阿里無障礙服務

阿里巴巴致力於改善無障礙服務,很多時候出發點都是來自一些生活細節。2010年底,一眾淘寶工程師前往一位视障按摩师的家里,切身體會視障人士的實際使用環境,深入意識到健全人士點點屏幕的簡單操作,對視障人士而言卻是困難重重。隨後,淘寶成立「無障礙實驗室」,啟動網頁的無障礙鏈路改造、支付驗證碼改造等等。

2014年,手機淘寶誕生,針對手機端的無障礙改造從淘寶延伸至天貓、支付寶、釘釘、高德地圖等阿里巴巴的多個產品之中,為視障用戶在網上開拓一條新盲道。隨後「無障礙」測試被寫入淘寶的產品規範,而淘寶也成為中國首個將訊息無障礙測試納入產品發佈常態化流程的互聯網產品。

簡而言之,手機淘寶每個版本和功能發佈前,都會預留一定時間交由無障礙團隊進行測試,確保視障人士的使用體驗。

今年,阿里巴巴集團成立「訊息無障礙委員會」,覆蓋10個阿里巴巴業務及14個不同的產品部門,除了不斷完善阿里巴巴各款產品的無障礙化外,該委員會也在技術探索、行業發展、標準製訂、倡導宣傳等方面發力,相關成果也多次入選訊息無障礙行業白皮書及案例彙編等。

在阿里巴巴,無障礙不是一項錦上添花的功能,而是眾多國民應用的標準配備。阿里巴巴工程師們相信,技術的發展應該讓人跨越殘障帶來的鴻溝,而不是帶來新的不平等,再小的群體也應該獲得平等享受科技便利的權利。

按此了解更多天貓雙11全球狂歡季的介紹及歷史背景,或是瀏覽阿里足跡的2020天貓雙11專頁活動欄目,獲取更多活動內容及最新動向。

達摩院資深算法專家、阿里巴巴OCR技術負責人王永攀(圖左)表示,阿里巴巴技術團隊從2010年就開始致力於解決圖像中的文字問題。圖右為阿里安全圖靈實驗室負責人薛暉。

達摩院資深算法專家、阿里巴巴OCR技術負責人王永攀(圖左)表示,阿里巴巴技術團隊從2010年就開始致力於解決圖像中的文字問題。圖右為阿里安全圖靈實驗室負責人薛暉。

OCR 天貓 天貓雙11 天貓雙11全球狂歡季 淘寶 讀光 達摩院