
R 的 rio 套件:匯入與匯出 Excel、SAS、SPSS、CSV、JSON、XML 等檔案
R 的 rio 套件是一個綜合型的檔案匯入與匯出工具套件,支援各種常見的檔案格式。 當我們要把資料從別的軟體匯入 R 中,或是要從 R 中匯出資料到別的軟體時,都會需要處理各式各樣檔案格式的轉換問題,傳統上不同的檔案格式會需要使用不同的匯入與匯出方式,而所需要安裝的套件也不同,當然使用方法也會有很大的差異,所以不是很方便。 ...

R 的 rio 套件是一個綜合型的檔案匯入與匯出工具套件,支援各種常見的檔案格式。 當我們要把資料從別的軟體匯入 R 中,或是要從 R 中匯出資料到別的軟體時,都會需要處理各式各樣檔案格式的轉換問題,傳統上不同的檔案格式會需要使用不同的匯入與匯出方式,而所需要安裝的套件也不同,當然使用方法也會有很大的差異,所以不是很方便。 ...

準備執行環境 若要使用 R 與 Hadoop Streaming API 分析資料,要先準備好標準的 Hadoop 環境,在測試時可以自己安裝單節點的 Hadoop 環境,或是使用 Hortonworks 或 Cloudera 這類整合好的虛擬機器也可以,然後在每一個 Hadoop 節點上安裝一般的 R 執行環境。 ...

這裡示範如何使用 R 與 Hadoop MapReduce 分析 Stack Exchange 網站的傾印資料。 Stack Exchange 是一個程式設計領域非常知名的問答網站,上面有非常多具有參考價值的問題解答,Stack Exchange 也將其整個網站的內容傾印成 XML 檔,以創用 CC 授權的方式開放出來,放在 archive.org 提供大家免費下載使用。 ...

本篇敘述如何使用 RHadoop 的 MapReduce 實作 k-means 分群演算法。 在架設好 RHadoop 計算環境之後,接著就可以使用 MapReduce 撰寫各種分析程式,以下是用 MapReduce 實作 k-means 的 R 程式碼。 這個 k-means 範例只是用來示範 MapReduce 的實作方法,程式碼比較簡單,不適合在實際的應用上使用。 ...

本篇介紹如何手動架設 RHadoop 計算伺服器,並使用 RHadoop 相關套件進行巨量資料分析。 RHadoop 是由 Revolution Analytics 所發展的 R 套件集,可讓 R 使用者更方便的使用 Hadoop 分析巨量資料,適用於 Cloudera、Hortonworks 等 Hadoop 發行版,以下是基本的 RHadoop 計算環境架設流程、MapReduce 用法與簡單的範例程式碼。 ...