Google Indexing:聲音辨識和Flash索引

researcher

This site has been moved to dreamerslab.com

本站已經移至 dreamerslab.com

Google實驗室推出可以搜尋聲音紀錄的Google Audio Indexing,簡稱為「GAudi」。此服務可讓我們直接用文字的方式搜尋哪些人說了哪些話。語音辨識系統會將影片中的演講或對話轉成文字記錄下來, 使用者直接鍵入關鍵字就可搜尋影片裡符合的段落。

「Audio Indexing」是Google Labs的小型測試項目,目前只提供跟美國政治、選舉相關的影片索引資訊,亦即只能搜尋少部份美國政治人物與 歐巴馬(Obama)、麥坎(McCain)等人的相關影片。

搜尋結果會以「黃色圓點」的方式呈現在影片播放進度列。有八筆資料就會有八個點。

搜尋結果的關鍵字會清楚標示並連同前後文列在影片下方。特別的是,除了列出來之外,有提到「關鍵字的影片段落」是可以播放的,也就是說只要按下播放鍵,就會將關鍵字連同上下文一同播放。

在Flash索引方面,Google目前能索引Flash的文本(文字)內容以及能識別在Flash出現的URL連結以及該檔案加載(讀取)的外部資源。 舉例來說,使用者在與Flash檔案互動過程中所看到的一切文本內容都將得到更好地索引(像是按鈕或選單形式的Flash「小工具」,獨立自成一體的 Flash 網站,以及所有介於兩者之間的Flash形式)。如果網站包含Flash,其中的文字內容會被Google用來生成網站的摘要,換句話說使用者可搜尋到在 Flash檔案中的文字以及連結指向。

在加載外部資源方面,假設一個SWF檔案從其他檔案(比如text, HTML, XML和其他SWF等檔案)加載內容的時候,Google也能索引這些外部內容,並把它與原SWF檔案和其他任何引用了這些內容的檔案聯繫起來。

目前Google對於SWF(Flash)檔案時,能作到:

可索引那些使用者和Flash檔案交互時才顯示的「文字性」內容。
可識別Flash檔案中的連結。
可加載外部資源,並把這些內容跟母檔案聯繫起來。
可支持通用的Flash檔案中內嵌的JavaScript技術,比如SWFObject和SWFObject2。
可索引採用AS1、AS2和AS3腳本的網站,即使ActionScript是模糊的。
另 外,由於Google無法索引圖片,因此如果Flash檔案裡只有圖片,Google無法能識別和索引出現在圖片中的任何文字。類似地,如果一個 Flash按鈕沒有任何附屬的文字的話,Flash按鈕生成的連結指向也不能被索引。另外,FLV 檔案(如 YouTube影片)無法被索引,因為這些檔案沒有包含任何文字元素。

參考來源
Flash索引現在可以加載外部資源了!
改進後的Flash索引
Google Audio Indexing 連「聲音」都能直接搜尋! (人講的話)

Related Posts


Comments are closed.