CKAN 簡介#

CKAN 為用來建立開放資料平台的開源軟體套件(類似於內容管理系統 WordPress,但非用於管理頁面與部落格等資訊,而是用來管理「資料」),在 CKAN 平台上可管理與發布資料集。目前 CKAN 已廣為各國家政府、地方政府及研究機構等收集有大量資料集的單位所採用。本平台即是使用 CKAN 並擴增功能建置。

當資料發布於本平台後,任何使用者可透過其提供的資料搜尋功能,搜尋或瀏覽他們所需的資料,並且可以在網頁上直接瀏覽資料的樣貌(包括地圖、縮圖、表格等類型)。

資料集與資源#

本平台遵循 CKAN 的運作機制,將資料的發布單元稱之為「資料集」(dataset)。「資料集」顧名思義為資料的集合,舉例而言,資料集可以是一個區域的犯罪統計資料、政府部門的經費收支圖表,或者是由各類型天氣測站所觀測到的溫度數據。當使用者在 CKAN 平台上搜尋資料時,所呈現的搜尋結果即為資料集。

一份資料集包含:

  • 後設資料 (metadata):即為資料集的描述。例如:資料集的標題、產製者、產製時間、資料格式、該資料集以何種方式授權使用等相關說明資訊。

  • 資源 (resources):即實際的資料本身。CKAN 平台可以存放任何檔案類型或格式的資料。一份「資源」可以是 CSV 表單、Excel 試算表、XML 檔案、PDF 文件、影像檔、RDF 格式的連結資料等。CKAN 可以將各類型的資源儲存在系統內部,或者儲存資源的連結,且一份資料集可以儲存任意數量的資源。例如,不同的資源可能儲存不同年份的資料,或是相同的資料以不同格式的資源儲存。