2012年4月24日 星期二

乘著 open data 浪頭往前邁進/Surfing the open data wave

Jason Hibbets (Red Hat)/文 R. L. Chen/翻譯
圖片來源:Jason Hibbets
From 臺北維基人聯合部落格
當颶風肆虐的季節,我的注意力轉向大西洋。我利用世面上能找到的預測工具,注意吹動海浪的海風,尋找最適宜衝浪的地點。但我從來沒有仔細想過,這些預測工具背後用的資料。
現今的天氣預報技術,都需要收集不同的觀測資料歸納、計算,這些觀測資料像是海浪大小,方向以及時間週期;風力大小及方向、潮汐預測。以上提到的數值都是你想衝個好浪時必須知道的因素。那這些資料都是從那裡來的呢?

回答上面這個簡單問題,可以展現在我喜愛 20 年的運動上,open data 重要的地方了。這些資料早就被視為理所當然的 open data 了。試想假如這些資料來源不再受到補助,像是你每天看的天氣預報以及股市訊息?甚至有一天這些資料一下子都不見了?

來自 NOAA 的 open data

如果你住的地方離海岸最少有兩小時的車程,看準時機去衝浪是很重要的。到另一個適合衝浪的地點往往不是開一下車就到了,除非你是一心一意想找尋適合衝浪的地點。事先能夠用預測工具查明最好的衝浪地點,這全拜 open data 的緣故。

當我開始研究這些預測網站背後所使用的原始資料時,我很快理解到這類型網站,資料都是來自同一個來源:NOAA((National Oceanic and Atmospheric Administration,美國國家海洋和大氣管理局)。由於 NOAA 為美國聯邦政府出資的機構,公眾都能夠無償取得其資料(見其資料開放近用政策說明)。與其他開放源碼專案使用 open data 情形類似,真正的產生價值的作為在於解讀資料,以及如何將解讀後的資料呈現給觀眾。我研究了三種服務是如何使用及標示資料來源。

Surfline

我最早使用的預測工具網站是 surfline.com。開發者利用來自 NOAA 以及其他資料來源,發展一套海浪預測的專有系統。他們網站提供三天免費的預報。如果要長時間的預報,或者是高畫質的即時海浪影像,則要花錢買進階服務。
From 臺北維基人聯合部落格
我過去很常使用 Surfline,但我慣用的服務換另一家了。我學會怎麼去看原始的預報資料。加上長期研究當地有關潮汐的狀況,我開始想要單純將資料呈現的簡單介面,讓我方便自行解讀。免費報告有它的限制,同時也會阻礙對於真實狀況的了解。現在我仍會看 Surfline,不過不是當主要來源。人們會很樂意花錢訂閱進階服務,事實上我也曾是其中一員訂閱者。

Swellinfo

另一個我常使用的衝浪預測網站是 swellinfo.com。就像其他衝浪以及氣象網站,他們也是利用 NOAA 的資料。NOAA 的資料不僅可以自由取得,還允許為提供給客戶的產品加值卻不用付出額外的成本。
From 臺北維基人聯合部落格
Swellinfo 的 CEO,首席預報員 Micah Sklut, M.S.,對於像是 NOAA 這類提供 open data 的資料來源,處理 open data 資訊的服務提供者,以及接受這些加值過資料的客戶,他說了以下的看法:
「如果沒有這些開放資料,這個國家大部分的私人天氣服務公司都做不下生意。在其他國家,比如說澳洲,你需要付服務費才能取得天氣預報當局的資料。
讓 NOAA 的資料能夠自由取用,提供更好的研究以及科技進步的可能,遍地開花的商機。如果 NOAA 將切掉這些資料的供給,最後只能單獨依靠 NOAA 提供如今上千家公司提供服務了。
我想 NOAA 是個很好的例子,顯示由公家支持的計畫,能夠真得幫助整個大環境,而非只是幾個廠商。我們真得從 NOAA 提供的天氣以及環境資料得利甚多。」
開放格式以及開放近用都是 Swellinfo.com 能夠成功的重要關鍵。如果少了來自 NOAA 的 open data,那麼 Swellinfo.com 根本不可能存在。同一個原始資料來源,可以有無限個發展可能性。下一個例子則要顯示與 Swellinfo 完全不同的發展方向。

Magicseaweed

我最常使用的網站是 magicseaweed.com。他們將得到的原始資料重新整理以及花心思呈現資料,來展現他們的核心價值。由於資料是開放的,資料的呈現手法是他們的技術核心。我喜歡這網站因為它是免費的。
From 臺北維基人聯合部落格
當我與網站經營者聯絡時,他們不肯透露資料來源,不過他們證實他們的資料來源的確是 open data。我很好奇為何他們不願透露?這可不是很開放的舉動啊。

網站宣稱說網站的資料沒有著作權,屬於公有領域。因此我判斷他們的資料來源應該與 NOAA 有關。

身為有經驗的衝浪者,我可以瞄過像是 magicseaweed.com 這類的網站,大概知道他們呈現的資料在說什麼。舉例來說,八英尺高十二秒週期的浪,空氣中吹著微風(答案:胸部到頭部高度的高浪以及 clean surf)。這種情況,可以準備到 coconut wireless 海灘衝浪了。

五顆星的評分機制,讓人做決定時可以更有依據。對於初入門的人來說,知道風浪的情況究竟是好是壞。對於當地海岸以及有衝浪經驗,則可以檢驗網站的衝浪模型有多準。

這個網站不只將數值資料搭配小圖示呈現而已,Magicseaweed 將資料轉成 infographics ,呈現資料隨著時間變化的程度。你可以用 3D 畫面持續一個接一個,看網站預測的海浪大小、海浪週期,風速、風向。再次強調,網站透過將資訊整理成易於消化的格式給使用者,達到加值目的。

那個工具最適合你?

市面有許多衝浪狀態預測網站,你依據你的喜好選擇常用的網站。當我開始深入研究相關資料時,Magicseaweed 成為我資訊的主要來源。如果隨便看看,Magicseaweed 能很快讓我找到我感興趣的數據。我會將網站預測與我自己對資料解讀的結果相比較。我也許會上 Surfline 比較預測結果,以及看即時影像(免費用戶影片只能看 60 秒)。

以上所舉的網站有個共同點,就是都有社群。我想這是因為網站經營者體認到使用者的力量以及回饋。就像今日許多公司一樣,網站有許多功能上的設計是希望社群能夠成形。當衝浪者不在海上,預報者想要使用者在網上瀏覽。經營社群是讓人們持續光顧的好方法之一,另外還得持續開發使用者想使用的工具以及想看的資訊。

當一天快結束時,沒有比現場轉播浪頭狀況來得更好了。當你能掃視海平面上的風浪並且看到他們拍擊岸邊的浪花時,可以驗證花整天時間分析的資料是否值得。現在真正的問題來了,你會依據網站告訴你的情形,拿起衝浪板衝去衝浪?或者依據網站看到的情形,深入研究你不熟的衝浪點?

今日開放,明日封閉?

以上這些工具都使用來自 NOAA 的資料。這些網站將複雜、難以解讀的資訊,轉換成使用者容易吸收的型式,就像氣象學家預報天氣一樣。你能想像只用衛星圖以及 wind vectors 數據來預報明天的氣溫及風向嗎?

NOAA 的資料不只可以拿來預報,就像天氣預報不只是告訴你明天天氣晴朗。地震學家依據同樣的天氣與衛星訊息用來預測地震,其他氣象學家預測颶風或者龍捲風路徑。如果下游的顧客像是當地新聞媒體需要付錢取得這些資料呢?或者是更糟,這些資料根本無法取得呢?

整個天氣預報的生態系圍繞著 NOAA 釋出的資料,而且還有其他免費的服務可供不願付錢或是無法付錢的人選擇。環顧整個市場,各家廠商利用這些不同種類的 open data 創造了多樣的營利模式,而顧客也因而充滿了選擇的機會。

最近,這些資料的開放性遭到美國眾議院的威脅,他們想將 NOAA 的服務私有化。減少 NOAA 的預算,將會限制颶風預報的準確性。而這可不是我們能夠承擔的後果。
如果最後你看到這裡,來個衝浪的影片吧!


翻譯自 OpenSource.com-Surfing the open data wave,原文採 CC-BY-SA 3.0 Unported 授權

編按:留言者有 magicseaweed 的經營者 Bob McWhirter。文章作者順勢問了一個問題:假如 NOAA 的資料收費,他們要怎麼辦?Bob 很坦承的回答,假如是現在網站經營有成的階段,NOAA 替釋出的資料收費,反而對 magicseaweed 有利,因為會讓 magicseaweed 與潛在的競爭者樹立競爭的高牆。如果是早年還在新創階段,沒有 NOAA 開放的資料,他們根本就不會存在。

沒有留言:

張貼留言