
使用 R 與 Hadoop MapReduce 分析 Stack Exchange Data Dump 資料
這裡示範如何使用 R 與 Hadoop MapReduce 分析 Stack Exchange 網站的傾印資料。 Stack Exchange 是一個程式設計領域非常知名的問答網站,上面有非常多具有參考價值的問題解答,Stack Exchange 也將其整個網站的內容傾印成 XML 檔,以創用 CC 授權的方式開放出來,放在 archive.org 提供大家免費下載使用。 ...

這裡示範如何使用 R 與 Hadoop MapReduce 分析 Stack Exchange 網站的傾印資料。 Stack Exchange 是一個程式設計領域非常知名的問答網站,上面有非常多具有參考價值的問題解答,Stack Exchange 也將其整個網站的內容傾印成 XML 檔,以創用 CC 授權的方式開放出來,放在 archive.org 提供大家免費下載使用。 ...

本篇敘述如何使用 RHadoop 的 MapReduce 實作 k-means 分群演算法。 在架設好 RHadoop 計算環境之後,接著就可以使用 MapReduce 撰寫各種分析程式,以下是用 MapReduce 實作 k-means 的 R 程式碼。 這個 k-means 範例只是用來示範 MapReduce 的實作方法,程式碼比較簡單,不適合在實際的應用上使用。 ...

本篇介紹如何手動架設 RHadoop 計算伺服器,並使用 RHadoop 相關套件進行巨量資料分析。 RHadoop 是由 Revolution Analytics 所發展的 R 套件集,可讓 R 使用者更方便的使用 Hadoop 分析巨量資料,適用於 Cloudera、Hortonworks 等 Hadoop 發行版,以下是基本的 RHadoop 計算環境架設流程、MapReduce 用法與簡單的範例程式碼。 ...

這裡介紹如何在 PHP 的程式中呼叫 R 語言進行各式的統計分析語資料繪圖,並將結果顯示於網頁之中。 PHP 是現今很熱門的程式語言之一,有非常多的網頁應用程式都是使用 PHP 來開發的(例如 WordPress 等),而 R 語言則是一種功能強大的統計分析工具,拜大資料的風潮所賜,目前 R 語言已經是資料科學領域最熱門的分析工具。 ...

這裡介紹如何在使用 R 畫圖時,自行指定中文字型,讓圖形更美觀,同時亦可解決亂碼問題。 在使用 R 繪圖時,若需要在圖形中加入中文字,若字型沒有設定好,中文字就很容易出問題。 ...