Facebook 認識到圖像是一種維持自己18.6億用戶保持活躍的生命力。Facebook 用戶每年分享數(shù)十億的嬰兒、寵物、假期以及其他事物的照片。這就使得公司必須要開發(fā)出能夠搜索到最相似的圖像的技術(shù),這樣用戶就能輕松找到朋友、親人或愛人經(jīng)常分享的圖片。
近日,F(xiàn)acebook 宣布了一系列人工智能上的創(chuàng)新,它認為這將改善用戶體驗。這方面的技術(shù)突破,使它的人工智能系統(tǒng)能夠在像素級別上對圖像進行理解。
新的人工智能在兩個方面帶來了精彩的成果:
首先是一套新的圖像分類功能,可以向視力受損的用戶說明照片中的動內(nèi)容這在以前是不可想象的。
第二,系統(tǒng)可以允許用戶在照片沒有被任何文本標記和注釋的情況下,基于關(guān)鍵詞找到他們的朋友或家庭成員共享的照片。
人工智能是Facebook的重要努力成果
Facebook 認為人工智能可以作為重點跨越自己的許多(甚至可能是全部)主要服務(wù)來傳遞最相關(guān)的內(nèi)容。Facebook希望自己能夠像在社交網(wǎng)絡(luò)和即時通訊中一樣,在人工智能和機器學習中占據(jù)主導地位,并且在該領(lǐng)域?qū)iT組織了超過150人的團隊。近年來,F(xiàn)acebook在增強人工智能和機器學習處理能力的研究投資增加了三倍——盡管它沒有公開這筆投資的具體數(shù)額。
當然,F(xiàn)acebook并不是唯一一個在這一技術(shù)上努力的公司。每個主要的技術(shù)公司都在人工智能方面進行了大量投資,因為該技術(shù)被視為下一個計算時代的基礎(chǔ)。英偉達公司的首席執(zhí)行官黃仁勛在去年接受Fast Company采訪時表示:“這是近20年來最重要的計算的發(fā)展, Facebook和其他人將不得不為了確保人工智能的的核心競爭力而展開競爭?!?/p>
在關(guān)于發(fā)展新技術(shù)的博客文章中,F(xiàn)acebook的機器學習應用小組的負責人Joaquin Candela指出,在線搜索,即使是針對圖像的搜索,在傳統(tǒng)上都需要解析文本,而圖像通常只有在被標簽或字幕正確標記的情況下才能被正確搜索到。
“改變正在發(fā)生,因為我們已經(jīng)將計算機視覺推動到下一個階段,目標是在像素級別上理解圖像,” Candela寫道,“這有助于我們的系統(tǒng)完成諸如識別圖像中的內(nèi)容、場景類型是否是一個著名地標等事務(wù)。這反過來又幫助我們更好地向視力殘障人士描述照片,并為帶有圖像和視頻的帖子提供更好的搜索結(jié)果。”
無障礙環(huán)境自2011年以來一直是Facebook的工作重心,其目的在于改善視覺或聽力受損用戶參與服務(wù)互動的方式。
利用人工智能來豐富盲人用戶的體驗
2015年,F(xiàn)acebook開始利用人工智能來豐富盲人用戶體驗。它設(shè)計了一種算法,能夠自動將某些照片和視頻轉(zhuǎn)換為口頭詞句,讓那些有視力障礙的的對象也能了解他們從來不能看的帖子。
使用該系統(tǒng),屏幕閱讀器可以告訴用戶一幅日落的照片中包含著諸如自然、室外、云、草、地平線、植物或樹木等元素。
但是現(xiàn)在,新的圖像分類系統(tǒng)可以在它的描述中添加動作,比如“人在走路”、“人在騎馬”、“人在跳舞”、“人在彈奏樂器”,等等。
通過建立基于130000個人工標記照片的機器學習模型,可以無縫推斷照片中的人的行為,Candela寫道。
第二個主要創(chuàng)新是一個搜索系統(tǒng),基于圖像識別技術(shù)能夠過濾掉大量不相關(guān)的照片,并且以盡可能最快的方式找到最相關(guān)的結(jié)果。比如說,只要在搜索框輸入“黑色襯衫”,就能找到?jīng)]有被文本標記的黑色襯衫的圖片。
這對于看到過某人或某物的照片,但不知道照片來自哪里的用戶而言是有價值的,特別是在所需的照片沒有標簽或標題的情況下。
最后,雖然今天取得的這些進步令人印象深刻,F(xiàn)acebook很清楚目前仍然處于應用人工智能進行圖片搜索和無障礙化的早期階段。
“這些新的進展十分顯著,” Candela寫道,“我們的面前是一條漫長而激動人心的道路,而我們僅僅抓住了可能在將來引起變革的事物的表面?!?/p>